欧洲研究者设计出一种类似大脑的人工神经网络,该网络能够在没有任何明确的训练或预编程的前提下具备数字和空间认知,以及书面语言处理的能力。他们基于生成模型的机器学习方法的成果显著推动了自我学习人工智能的发展,同时也加深了对人类认知的理解。
该研究由帕多瓦大学(University of Padova)的 Marco Zorzi 领导,并从一开始就得到了欧洲研究中心(ERC)的资助。这个名叫 GENMOD 的项目表明建立一个能够基于感官数据观察世界并生成世界的内部表征的人工神经网络是可能的。比如说,该网络可以依靠自己发展出近似的数感(number sense)——确定基本数字性质的能力,比如更大或更小——而且还不需要实际理解这些数字本身,就像人类和婴儿和一些动物一样。
Zorzi 说「我们的研究显示,在概率框架内的生成学习可以成为开发人类认知的更合理的神经网络模型的关键步骤。」
视觉数量感(visual numerosity)的测试显示了该网络的能力,同时也为人类和动物在没有任何预先存在的数字或算术知识的基础上出现判断一个集合中的物体数量的能力提供了见解。
Zorzi 及其同事向这个自修正网络(self-revising network)输入了数万张图像,其中每张图像都包含了 2 到 32 个大小不同的随机排布的物体;然后研究人员发现在这个遵循无监督学习的深度神经网络中涌现出了对数量感(numerosity)的感知。在响应每一张图像时,该网络会强化或弱化神经元之间的连接,以使其数字敏锐度(即精确度)可以根据其刚刚观察到的模型进行精细调节;这个过程独立于物体的总体表面积,确保了其神经元确实是在检测数量。
实际上,该网络开始为估计图像中物体的数量生成自己的规则和学习过程,其所遵循的神经元活动模式也曾在猴子的顶叶皮层中被观察到过。顶叶皮层是大脑中涉及数字和算术知识的区域,这表明 GENMOD 模型可能近似反映了真实大脑的工作方式。
像一个孩子那样学习数字敏锐能力
「一个六个月大的孩童有相对较弱的近似数感:比如说,他可以区分 8 个点和 16 个点之间的差异,但却无法区分 8 个点和 12 个点之间的差异。辨别能力在整个童年都在提升。我们的网络在数字敏锐度上表现出了相似的过程——其观察的图像越来越多,同时其确定物体数量的能力也随时间逐渐提升。」据 Zorzi 说,他计划在 7 月 26 日的欧洲科学开放论坛 2016(EuroScience Open Forum 2016)中的「Can we simulate the human brain?(我们能模拟人类大脑吗?)」研讨会上讨论他的研究。
该项目在数字认知上的成果可能对神经科学和教育有重要的意义,比如理解患有计算障碍(dyscalculia)的孩子数感受损的可能原因,年龄增长对数字技能的影响和增进由脑损伤引起的病理的研究。
凭借其在机器视觉、神经信息学和人工智能方面的应用,GENMOD 在其它一些领域甚至还可能会有更为深远的影响。
「之前利用人工神经网络建模人类认知的许多成果都基于监督式学习算法。这样的算法除了在生物学上不合理之外,还要求在每一个学习事件中都有外部的教育信号可用,并且表现出了一种值得怀疑的假设:学习在很大程度上是判别式的。」Zorzi 解释说,「相反,生成模型在没有任何监督或奖励的前提下学习感官数据的内部表征。也就是说,物体的图像等感官模式不需要进行标注来告诉网络输入中呈现了什么或它应该如何做出反应。」
人类感知建模中的突破
该 GENMOD 团队还利用深度神经网络开发了第一个全面的、真实的字母感知(letter perception)计算模型,该模型以完全无监督的方式从不同字体、样式和大小的数千张字母图像中进行了学习。通过预先输入的自然场景的随机图像,该网络学会了随时间定义线条、形状和图案。当它随后被用于观察书面文本时,它应用了相同的过程来区分字母,并最终区分出了单词。
「这支持了关于人类如何发展出书面语言的假设。大脑中没有一部分是为阅读而发展的,因此当我们需要识别对象时,使用的是相同的认知过程,」Zorizi 说。「这个生成模型方法是建立人类感知和认知模型的一个重大突破,这与神经生物学理论强调大脑中混合自下而上和自上而下的相互作用相一致。」
无监督学习神经网络也可能被用于各种各样的应用中,这些应用中的数据都是未被分类且没有标签的。比如,该网络可以用来在功能磁共振成像中识别人类大脑活动的特征,这对于其他技术或人类观察者来说是不可能的。它甚至可以用来制造真正智能的智能手机,把像智能检测,学习和决策克服日益严重的网络过载问题这样的认知能力灌输到移动设备中。
「我们的发现证明了生成模型代表了前进中关键的一步。我们希望我们的工作能影响更广泛的认知建模社区,激发其他研究者在未来的研究中去拥抱框架,」Zorzi 说。