分享
李飞飞的两次 TED 演讲
输入“/”快速插入内容
李飞飞的两次 TED 演讲
一、2015年 《我们怎么教计算机理解图片?》
链接:
https://www.ted.com/talks/fei_fei_li_how_we_re_teaching_computers_to_understand_pictures?language=zh-CN
我先来给你们看点东西。
(视频)女孩: 好吧,这是只猫,坐在床上。
一个男孩摸着一头大象。
那些人正准备登机。
那是架大飞机。
李飞飞: 这是一个三岁的小孩
在讲述她从一系列照片里看到的东西。
对这个世界, 她也许还有很多要学的东西,
但在一个重要的任务上, 她已经是专家了:
去理解她所看到的东西。
我们的社会已经在科技上 取得了前所未有的进步。
我们把人送上月球, 我们制造出可以与我们对话的手机,
或者订制一个音乐电台, 播放的全是我们喜欢的音乐。
然而,哪怕是我们最先进的机器和电脑
也会在这个问题上犯难。
所以今天我在这里, 向大家做个进度汇报:
关于我们在计算机 视觉方面最新的研究进展。
这是计算机科学领域最前沿的、
具有革命性潜力的科技。
是的,我们现在已经有了 具备自动驾驶功能的原型车,
但是如果没有敏锐的视觉, 它们就不能真正区分出
地上摆着的是一个压扁的纸袋, 可以被轻易压过,
还是一块相同体积的石头, 应该避开。
我们已经造出了超高清的相机,
但我们仍然无法把 这些画面传递给盲人。
我们的无人机可以飞越广阔的土地,
却没有足够的视觉技术
去帮我们追踪热带雨林的变化。
安全摄像头到处都是,
但当有孩子在泳池里溺水时 它们无法向我们报警。
照片和视频,已经成为 全人类生活里不可缺少的部分。
它们以极快的速度被创造出来, 以至于没有任何人,或者团体,
能够完全浏览这些内容,
而你我正参与其中的这场TED, 也为之添砖加瓦。
直到现在,我们最先进的 软件也依然为之犯难:
该怎么理解和处理 这些数量庞大的内容?
所以换句话说, 在作为集体的这个社会里,
我们依然非常茫然,因为我们最智能的机器 依然有视觉上的缺陷。