炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:新智元)
新智元报道
编辑:元宇
【新智元导读】MIT神经科学家Ev Fedorenko通过扫描约1400人的大脑,识别出一个类似「生物版ChatGPT」的语言网络,它不负责思考或情绪,只专注于将词语与意义映射、拼成句子,该研究揭示了语言与思维的分离,让我们重新审视大脑中隐藏的奥秘。
如果告诉你:你的大脑中正跑着一个「生物版ChatGPT」,你会相信吗?
这不是打比方,而我们的大脑中真有这样一套专门用来处理语言的神经系统:
它不负责思考、也不负责情绪,只负责一件事——把词和意义对上号、再把它们拼成句子。
这个系统被神经科学家Ev Fedorenko称作「语言网络」(language network)。
大脑天生的LLM系统
很多人可能会有这种感觉:语言和思考是同一过程,找词的过程本身就是思考。
但人类的语言和思维是一回事吗?
语言究竟是思维的核心,还是一个完全独立的过程?
对此,Fedorenko提出了一个有点反直觉的观点:
语言不等于思考,它更像是思考的「接口」和「外包装」。
对许多人来说,找到合适的词本身就是思考的重要组成部分,而不是某个独立系统的产出。
她把这个独立于思考之外的专门系统称为「语言网络」,用来映射词语与其意义之间的对应关系。
Fedorenko将之想象成一个加强版的解析器:
「它就像一张地图,告诉你大脑里哪一块地方存着哪一类意义,也好比一个加强版的解析器,帮我们把语言拼起来。」
至于真正的思考和有趣的东西,则全部发生在这个语言网络之外。
事实上,早在ChatGPT出现之前,过去的15年里Fedorenko一直在收集人类大脑中语言网络的证据,并且发现它和大模型(LLM)之间有不少相似之处。
在某些意义上,我们确实随身携带着一个「生物版的ChatGPT」:一个不具备心智的语言处理器。
Fedorenko的研究,也许会让人觉得有一些安慰:一台机器虽然可以生成一段流畅的文字,但是它还是不会思考。
在麻省理工学院的实验室里,Fedorenko已经花了15年时间积累关于语言网络的生物学证据。
不同于大模型,人类的语言网络不会把词随便串成听起来像那么回事的句子。
它更像是连接外部输入(听到的、看到的、甚至手语)和大脑其他区域意义表征(如情景记忆、社会认知,而LLM并没有这些能力)之间的翻译器。
而且人类的语言网络并不大,如果把相关组织都聚在一起,只有一颗草莓大小。
虽然很小,一旦它受损影响却十分巨大。
比如,受损的语言网络会导致各种失语症,这种情况下人的复杂思维依然存在,却被困在无法表达的脑中;有时甚至连别人说的词都难以区分。
Fedorenko在MIT与博士后研究员Andrea de Varda (左) and Halie Olson (右)
扫描1400人大脑
她发现了人脑中的「语言网络」
Fedorenko上世纪80年代在苏联长大,自幼便对语言萌发了兴趣。
她在母亲的要求下,学会了俄语、英语、法语、德语、西班牙语和波兰语六种语言。
成绩优异的她最终获得了哈佛大学全额奖学金。
她在哈佛大学主修语言学,但在学习过程中,她发现了语言学的局限性。
「这些语言学课很有趣,但更像是在解谜,而不是在解释现实世界到底是怎么运作的。」
于是她又学习了心理学。
2002年,她从哈佛大学毕业,获得心理学与语言学学士学位。
随后,Fedorenko进入麻省理工学院(MIT)攻读认知科学与神经科学的研究生课程,并于2007年获得博士学位。
在此期间,她开始与Nancy Kanwisher合作,后者首次发现了梭状回脸区,这个区域专门负责识别人脸。
Fedorenko想找到语言在大脑中的对应区域,但当时这方面的研究基础相当薄弱。
在对大约1400名受试者的大脑扫描中,Fedorenko识别出一个普遍存在的语言网络,她将之定义为「始终负责语言计算的组织」。
在不断累积的研究成果之后,2024年Fedorenko在《Nature Reviews Neuroscience》上发表了一篇综述。
她将人类语言网络定义为一种「自然类别」——一个天然、独立成型、专门处理语言的功能单元,存在于「每一个典型的成年人脑中」。
Fedorenko办公室里的三个大脑模型突出了语言网络。从上到下:紫色的是Laura Bundesen的刺绣作品;红色的是Hannah Small的十字绣;红色的是3D打印模型。
什么是语言网络?
在成年人大脑中,有一组核心区域作为一个互相连结的系统,负责计算语言结构。
它们存储词语与意义之间的映射关系,以及如何把词组合成句子的规则。
我们在学习一门语言时,学的就是这些东西。
只要掌握了它们,我们就能很灵活地使用这种「代码」:只要你会一门语言,就能把一个念头转换成词序。
Fedorenko表示,语言网络和人类身体的其他器官一样,是一个自然类别,拥有一个能指出具体位置的物理结构。
比如,梭状回脸区就是一个可以明确界定的功能单元。
而在语言网络里,大多数人的额叶皮层都有三个区域,都位于左额叶的侧面。
另外,还有几个区域沿着中颞回的侧面分布,那是一大片厚厚的组织沿着整个颞叶延伸。
这些构成了语言网络的核心部分。
我们可以从多个角度看到它们的整体性。
例如,把人放进fMRI扫描仪里观察语言处理与对照条件的差异,这些区域总是一起变化。
Fedorenko称到目前为止扫描了大约1400人,已经能建立一张概率地图,显示这些区域最可能出现的位置。
虽然个体之间略有差异,但整体模式非常一致。
在这些额叶和颞叶的大区域里,每个人都会有一些组织在可靠执行语言计算。
语言网络,与其它已知与语言相关的脑解剖区域,如布罗卡区(Broca’s area)不同。
Fedorenko认为布罗卡区更多是一个发音动作的规划区域。
它主要是根据语音的声音表征,计算出说出这些声音所需的动作,指挥嘴部肌肉的活动,属于语言网络下游,接收语言网络传过去的结构化语言信息。
语言网络既不负责发声,也不负责思考,它在本质上是低层级的感知与运动系统,是与高层级的抽象意义和推理系统之间的接口。
Fedorenko提到人类主要用语言做两件事。
第一是表达:脑子里蹦出一个模糊的念头,你再从词汇库里(不仅是词,还有更大的结构和组合方式)挑出一套词序,把这个念头表达出来。
然后语言网络把这个词序交给运动系统,让你说出来、写出来或打手语。
第二是理解:声音进耳朵或光线进眼睛后,感知系统先把输入处理成词序。
然后语言网络解析它,在词序里找熟悉的块,再把它们指向存储在别处的意义表征。
对于表达和理解,这个系统都是一个不断更新的「形式到意义的映射仓库」。
掌握了这套代码后,我们既能把想法说出来,也能理解别人说的话。
语言网络的功能是为了交流,那么语言网络的专门化究竟细到什么程度,是否存在专门对某些话语反应的细胞?
Fedorenko认为语言依赖上下文,因此推测语言网络系统内的编码方式会有些分布式,可能存在对语言某些特定方面反应特别强的神经元。
比如,语言网络区域的一些细胞对书面语和听觉语言也会有类似反应。
谈到语言网络的模式或者特征,Fedorenko认为大脑的一般物体识别机制和语言网络的抽象程度非常接近。
这和下颞皮层里储存物体形状片段、梭状回脸区储存「一张脸的模板」是类似的。
我们利用这些表征来识别现实世界中的物体,但它们本身与我们的世界知识并无直接联系。
以一句无意义句子「无色的绿色想法愤怒地沉睡」为例,我们可以大致能听懂它的结构,却完全无法把它对应到任何现实知识上。
Fedorenko和其他团队的研究证实,语言网络对这种无意义句子的反应强度,和对那些有意义的句子几乎一样。
这并不意味着语言网络「笨」,而是说明它确实是个比较浅层的系统。
Fedorenko认同「每个人脑子里都有个LLM」这样的说法。
她认为语言网络在很多方面都很像早期的大模型:学习语言的规律,以及词和词之间的关系。
在现实中,你可能会遇到一个说话特别流畅的人,但听了一会儿会发现他们根本没讲什么内容,而他们的大脑也没任何损伤。
这说明他们只调动了大脑中语言网络部分的功能,而思考部分完全没有用上。
虽然,人类语言来自一个类似ChatGPT那样「无意识」的系统,这听起来有点不符合直觉。
而且,Fedorenko在研究早期也认为语言是高级思维的核心,但后来她的研究并不支持这一假设。
早在2011年,她已经很清楚,语言网络的所有部分都高度专门化用于语言。
「对于科学家来说,只能更新认知,继续向前探索。」
参考资料:
https://www.quantamagazine.org/the-polyglot-neuroscientist-resolving-how-the-brain-parses-language-20251205/
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标,锁定新智元极速推送!