李飞飞的两次 TED 演讲

一、2015年《我们怎么教计算机理解图片？》

我先来给你们看点东西。

（视频）女孩：好吧，这是只猫，坐在床上。

一个男孩摸着一头大象。

那些人正准备登机。

那是架大飞机。

李飞飞：这是一个三岁的小孩

在讲述她从一系列照片里看到的东西。

对这个世界，她也许还有很多要学的东西，

但在一个重要的任务上，她已经是专家了：

去理解她所看到的东西。

我们的社会已经在科技上取得了前所未有的进步。

我们把人送上月球，我们制造出可以与我们对话的手机，

或者订制一个音乐电台，播放的全是我们喜欢的音乐。

然而，哪怕是我们最先进的机器和电脑

也会在这个问题上犯难。

所以今天我在这里，向大家做个进度汇报：

关于我们在计算机视觉方面最新的研究进展。

这是计算机科学领域最前沿的、

具有革命性潜力的科技。

是的，我们现在已经有了具备自动驾驶功能的原型车，

但是如果没有敏锐的视觉，它们就不能真正区分出

地上摆着的是一个压扁的纸袋，可以被轻易压过，

还是一块相同体积的石头，应该避开。

我们已经造出了超高清的相机，

但我们仍然无法把这些画面传递给盲人。

我们的无人机可以飞越广阔的土地，

却没有足够的视觉技术

去帮我们追踪热带雨林的变化。

安全摄像头到处都是，

但当有孩子在泳池里溺水时它们无法向我们报警。

照片和视频，已经成为全人类生活里不可缺少的部分。

它们以极快的速度被创造出来， 以至于没有任何人，或者团体， ​

能够完全浏览这些内容，

而你我正参与其中的这场TED，也为之添砖加瓦。

直到现在，我们最先进的软件也依然为之犯难：

该怎么理解和处理这些数量庞大的内容？

所以换句话说，在作为集体的这个社会里，

我们依然非常茫然，因为我们最智能的机器 依然有视觉上的缺陷。​

李飞飞的两次 TED 演讲​