2024-09-10
作者:
浏览次数:10
2024年9月8日,观通学社第100期暨清源学社名家讲坛——“生成式大语言模型距人类语言有多远——生成式语言大模型与人类语言生成的比较”,在成均苑4幢311会议室顺利举办。本次讲座由江苏师范大学杨亦鸣教授主讲,浙江大学文学院张广海副教授(观通学社副社长)主持,浙江大学生仪学院丁鼐研究员、浙江大学外国语学院杨静教授、浙江大学文学院史文磊教授(观通学社社长)、浙江大学公共管理学院方恺教授(清源学社社长)参与对谈。与会师生来自文学院、外国语学院、生仪学院、公共管理学院、竺可桢学院、心理学系等不同院系,共聚一堂,一同聆听了这场讲座。
杨亦鸣教授首先回顾了语言学和大语言模型的发展史,指出语言学的研究对象,经历了从语言行为到语言能力的重大转变。自然语言模型则经历了从最初的“词典+规则”的符号派范式到如今的Transformer模型等多次迭代。杨亦鸣教授指出,大语言模型经历的从小模型到大模型,再到多模态模型的三个阶段,只是计算水平和自然语言处理能力的不同,本质上都基于概率统计。
随后,杨亦鸣教授对比了大语言模型与人类语言的差异,具体表现在语言学习机制的差异和语言处理机制的差异两方面。在语言习得方面,大语言模型必须依据语言数据进行学习,而人类语言习得具有遗传机制,新生儿对语言具有敏感性,通过少量语言刺激输入即可习得语言能力。在语言处理机制方面,大模型与人类在信息输入、信息加工、信息理解、输出内容方面都存在差异,人类能够接受多模态信息输入、理解语义,并推动语言的创新,而大模型并不具备这些内容。大模型并不具备人类语言的生物学机制,只是对人类语言行为的模仿。
杨亦鸣教授分析了大语言模型的问题,包括大语言模型的训练需要大量数据、大语言模型需要消耗大量计算资源、训练过程中存在错误信息和违背人类价值观的风险、内部组织架构有待完善、缺乏自我监督而产生“幻觉”等。在指出大模型的问题后,杨亦鸣教授提出了AI未来发展的方向,包括与物理世界互动、与人类社会互动、融入人类社会等发展方向。同时,杨亦鸣教授提出了大语言模型发展的另一条路线,即模仿人类语言的生物基础,建构以“预装”为基础的“算法脑”。
最后,杨亦鸣教授呼吁未来的语言学家走出象牙塔,面向脑科学和经济、社会发展,推动大语言模型进一步发展。
讲座结束后,杨亦鸣教授与在座师生进行了深入交流。
方恺教授就“机器生成的语言是否会影响人类语言”和“机器能否产生自主意识”两个问题向杨亦鸣教授请教。杨亦鸣教授指出,机器生成的语言存在影响人类语言的可能性,但是生成的优质内容也可以促进人类语言内容的更新。在目前的情况下,机器并不与物理世界产生联系,因此不太可能存在自主意识,在未来经过具身发展后或许存在可能。
丁鼐研究员提出了“为何大语言模型能够习得许多语言,而人类学习外语难度较大”和“大语言模型能否帮助人们探索语言产生的原因”两个问题。杨亦鸣教授指出,人类和机器的语言学习模式和语言处理模式存在本质区别,这决定了人类和机器在语言习得上的难度差异。对人类语言产生原因的研究,则需要从生物模式角度进行进一步研究。
杨静教授提出“在AI冲击外语学科的背景下,是否会给外语学科带来新机遇”和“在大语言模型出现后,语言学的名词和动词之争是否还有意义”两个问题。杨亦鸣教授指出,大语言模型目前仍存在许多问题,需要进行人工干预,外语学习不只是对语言的学习,也是学习其他文化和锻炼自身思维的过程,机器并不能取代人类对文化和思维的习得。在大语言模型出现后,语言学要积极拥抱其他学科,进行交叉研究,才能更好应对AI的影响。语言学的名动之争尽管不能应用于大模型,但却是语言学研究本身需要的,对于研究人类语言的词类是否具有物质基础等重要问题具有重要意义。
史文磊教授就“语言学理论研究在语法分析中很有用,但却无法应用于大语言模型,未来语言学家如何介入大语言模型的研究”这一问题提出疑问。杨亦鸣教授指出,语言学研究需要在垂直领域内深耕,对语法理论和人脑语言能力的研究,是对人类语言实质的研究,也可以在未来弥补大语言模型的固有缺陷,语言学领域仍存在许多应用性的现实问题有待语言学家的交叉研究。
浙江大学文学院边田钢特聘研究员就“机器学习是否能够帮助学者进行语音材料整理”和“大语言模型能否辅助音韵学学习”两个问题提出疑问。杨亦鸣教授指出,在经过专门训练后,大语言模型可以在近代韵书音系的地域性和材料比对等方面为研究者提供辅助。音韵学的学习,更重要的是教师的授课。杨教授认为,目前的大模型更像一个解决问题的工具,如何辅助推广普及等方面值得进一步思考。
本次讲座深入探讨了大语言模型的发展历程、大数据与预训练的重要性以及多模态整合的前景,涉及到语言学、计算机科学、神经科学、心理学、临床医学等多学科的交叉融合问题。讲座现场座无虚席,对谈环节气氛热烈,杨亦鸣教授对现场师生的提问进行了细致而深入的回答,为我们带来了一场专业而深刻的交叉学科讲座。
文:刘金翔、贾明卓
图:杨婷婷、贾明卓