Content #
◆ 在未来的某一天,杨立昆(Yann LeCun)会成为脸书的人工智能首席科学家,但在我们到达美国时,他在新泽西州霍姆德尔的贝尔实验室的研究生涯才刚刚起步。他为人谦逊但雄心勃勃,近些年引发了不小的轰动,因为他展示了“神经网络”(neural network)算法在准确识别人类笔迹方面的能力。尽管这项技术仍然相对较新,远未达到日后的普及程度,但与之前数十年的人工智能传统已经截然不同。神经网络算法的目标不是用离散的规则来描述笔迹(1是直的,2是弯的,3是对称的,诸如此类),而是从数据中推断出模式。杨立昆从美国邮政署拿到了7200多个手写邮编的扫描件,涵盖各种风格、质地,甚至包括常见的错误。他向神经网络算法展示这几千个真实的人类笔迹,让机器也能像人类一样学习相关模式,形成内化的直觉。这套直觉很难用传统计算机程序的形式表达,但它使得算法能够以前所未有的方式理解真实世界的复杂混乱。杨立昆的研究取得了巨大的成功。算法的识别非常精准,在短短几年内,它就被广泛应用于全美的自动提款机上,用来读取支票上的数字。在距离达特茅斯研究提案中首次提出人工智能概念几十年后,人工智能领域终于取得了极具实用性的成就。此前的几代人试图用规则详尽描述智能,算法相对僵化,这种人工智能通常被称为“符号人工智能”(symbolic AI);20世纪80年代末到90年代初,潮流开始转向更自然的方法。杨立昆的成果就预示着一个大胆的未来。随着时间的推移,行业研究重点从“通过明确编程来解决问题”转变为“从示例中发现模式”。换言之,算法不是被告知该做什么,而是去学习该做什么。研究人员给它起了一个贴切的名字:“机器学习”(machine learning)。
◆ 2025/05/09发表想法
那个时期出国的人,给还在国内的朋友留下了完美的背影,他们无法理解这背后的代价。李飞飞是成功了,但那可能只是百分之一,其余的99个或许被剥夺了正常成长的机会。
原文:晚上放学回家后,父母知道了我的无助,也许他们的感受比我更强烈。尽管他们明显也感到不满,但我能感觉到,在面临如此迫在眉睫的暴力威胁时,在这里孤立无援的生活只会让人感到更加无力。由于语言的限制,他们甚至都没有办法象征性地给校长打个电话。在如此艰难的生活环境中,在自己孩子的安全都不能得到保障的时候,他们也只能默默承受恐惧,别无他法。朋友被打之后,我们好几个星期都没有见到他。他的恢复期一定特别孤独。他被打得鼻梁骨折外加脑震荡,康复之后,终于重返学校。我们一见到他,就立刻感觉他完全变了一个人,再也不是我们熟悉的那个男生了。以前他虽然英语不好,但总是幽默开朗,而现在变得孤僻阴郁。挨打的那一刻是残酷的——身体的疼痛、精神上的屈辱、纯粹的身体侵犯,但让人感觉最不人道的还是这种转变:他与生俱来的积极乐观被剥夺了。
◆ 2025/05/09发表想法
这位母亲是幸运的。
原文:时隔数年,我才真正完全理解这一刻的重要意义,我父母也是一样。虽然母亲在听到这个消息后表现得非常冷静,但我知道这件事对她意味着什么。她生命中的每一个里程碑都在提醒她,她站在了那些无法弥合的鸿沟的错误一边。几十年来,她已经习惯了假装自信,但我知道,她从未真正感受到自信。现在,也许是有生以来第一次,她终于有理由相信这个故事可能没有如此简单。她已经押上了所有,至此才有了一种真正如释重负的感觉,而这种感觉我永远无法完全感同身受。
06 北极星
◆ 研究早期的突破包括发现了“梭状回面孔区”(Fusiform Face Area, FFA),这是颞叶的一个皮质区域,大小不超过一立方厘米,似乎是为识别人脸而量身定做的。接下来是附近的“海马旁回位置区”(Parahippocampal Place Area, PPA),在识别熟悉的地点(比如自家厨房或常走的道路)方面发挥着类似的作用。另一个发现是“纹外躯体区”(Extrastriate Body Area, EBA),可以对周围人的手臂和腿等部位的摆动情况做出反应,帮助我们感知他们的身体方向。这些被称为视觉神经关联的结构有一些特别之处:它们似乎都是为特定目的专门打造的。每个结构都能且只能识别特定类别的事物,如面孔、熟悉的地点、身体姿势等。这就解释了为什么我们在完成特定的识别任务时,能够达到惊人的感知速度。我们不需要从头开始,逐个细节地进行解码;我们神经系统的一个专用功能会立即启动,几乎在瞬间就能完成识别任务。从我们的感受来看,这种识别是毫不费力的。
◆ 我很荣幸能为这项看起来正在对该领域产生影响的研究做出贡献,但最大的收获在于哲学层面。我们的研究成果跻身过去几十年的成果行列,表明人类视知觉的核心是一个简单的概念:我们的视觉基础在于识别定义明确的类别,也就是对事物的识别。彼得罗神情微妙,但他的喜悦之情明白无误地写在脸上,说明他也认同我的观点。我越发相信,我们即将揭开一切的奥秘。
◆ :视知觉依赖于分类。我们的大脑会自然而然地将我们所看到的细节归类为更广泛的概念,如物体、人物、地点和事件等。例如,在现实生活中,我们看到的不仅仅是简单的绿色和蓝色的图案,而是会看到在天空映衬下的一棵树。视觉在更高、更有意义的层面上发挥作用,用知识武装我们的头脑——我们可以想象树叶随微风摇曳的样子或夹在指间的感觉,我们也可以立刻估计出一根树枝的质地和重量,这两者都与高悬在数英里高空的不可触摸的大气层和彩色光线截然不同。
◆ 分类的能力赋予了我们难以估量的力量。视觉没有把我们埋没在光线、颜色和形状的无数细节中,而是把我们的世界变成了可以用语言描述的离散概念。有用的观念像地图一样排列在我们周围,把复杂的现实简化成我们可以一望便知、在瞬间做出反应的世界。我们的远古祖先就是这样在纯粹的混沌环境中生存下来的,世世代代的艺术家们就是这样从日常生活中提炼出美感和精华的,即使在今天,我们也是这样在这个日益复杂的世界中找到自己的方向的。
◆ 大脑在生理上倾向于快速、稳健地检测已知的视觉概念。
◆ 飞机被成功识别出来了。这是一个激动人心的时刻,但并非因为算法的成功识别,而是因为它的运作方式。以往的算法会首先学习数百张飞机的照片,涵盖尽可能多的颜色、风格、角度和光照条件,但在这次研究中,我们只给算法展示了一张飞机的图片。与此同时,我们还向它展示了数百张完全不相关的图片,包括有斑点的丛林猫、摩托车、人脸(我们用彼得罗新买的高级数码相机拍摄了实验室伙伴的笑脸),还有一些从谷歌图片上随机下载的图片。我们的假设是,先让算法充分接触视觉世界里丰富繁杂的各类事物,它就更好地具备了学习特定事物的能力。因此,虽然算法被训练识别过各种各样的事物,但它刚刚识别出的那架飞机是它见到过的第二架飞机——自它被设计出来后见到的第二架。我们的创造只是概念验证,仍然存在一些错误。但我们的目标是证明算法和人类一样,能够通过看到更多的现实世界而广泛受益。现在,北极星已成为我视野里的一个坐标点,我们已经朝着这个方向迈出了真正的一步。我们将这种技术称为“单样本学习”(one-shot learning)。这种技术与当时主流的图像识别方法背道而驰,但我们是从一个众所周知的能力中获得了启发。作为人类,我们天生就有一种神奇的本领,那就是可以仅凭对陌生事物的一瞥,再次遇到时就能认出来,不管是一样新的乐器、一种我们从未见过的动物,还是一位新当选的政治家。我们可以对这种能力做出多种解释,但其中最简单、最有力的解释是,即使面对全新的事物,无论多么新奇,我们也会借助一生的经验来加以理解。我们所看到的几乎一切都深深地融入了过往的经验——轮廓、光影、纹理和图案等熟悉的细节,以至我们很难想象能真正孤立地看到任何东西。
10 似易实难
◆ “有一种特别的东西……我不知道,也许可以叫作‘关怀之举’,无论是护士帮助我母亲坐起来,还是专家制定治疗策略,都感觉很特别,充满了人文关怀。这也许是我们所能做的最人性化的事情。我无法想象人工智能来取代它,我甚至不希望人工智能取代这一点。今天,科技在维持我们的生命方面发挥着重要的作用,我很感激,但毫不夸张地说,我和母亲能熬过这一切,真正的原因是人,是像你们这样的人。”
◆ “你知道吗,飞飞,”她轻声说,终于看向了我,“当病人……太可怕了……太可怕了。不光是疼痛,还有失控。在那个房间里,我的身体,甚至我的思想都不属于我。房间里有那么多陌生人,我知道他们是医生和护士,但他们对我来说都是陌生人,而我却要听从他们的每一个命令……我受不了。”我继续听着。“就连你也命令我!”我俩都笑了起来,气氛一下子轻松了许多。“我知道你是想帮忙,”她补充道,“我知道你们都想帮我,我知道这些东西对我的健康很重要,但到了某一个临界点,我就没有办法再满足这些要求了。”然后,她又想了一会儿,找到了背后的原因。“我一点儿尊严都没有了。彻底丧失了。在那样的时刻……”她似乎有些语无伦次。我正想鼓励她继续说下去,她就接着说完了:“甚至健康都不重要了。”
11 无人可控
◆ 人工智能正在成为一种特权,一种排他性极强的特权。
◆ 由此带来的后果特别令人担忧,这就是一种被称为“对抗攻击”的新型威胁。在对抗攻击中,输入内容的唯一目的是迷惑机器学习算法,以达到反直觉甚至破坏性的目的。举例来说,一张照片看上去是描绘了某种明确的事物(比如蓝天下的长颈鹿),但可以通过单个像素颜色的细微变动进行修改。尽管这种像素颜色的变化是人类肉眼无法察觉的,却会在神经网络中引发一连串的故障。如果对抗攻击设计得当,虽然原始图像看起来没有任何变化,但算法会把“长颈鹿”这样的正确分类变成“书架”或“怀表”等错误分类。先进技术无法辨认野生动物照片的场景可能会让人觉得好笑,但如果对抗攻击的目的是愚弄自动驾驶汽车,导致汽车对停车标志,甚至人行横道上的儿童进行错误分类,就绝对不能用好笑来形容了。
From #
《我看见的世界:李飞飞自传》 [美]李飞飞