2023年8月24日, “大语言模型离人类语言有多远:新一轮科技创新与产业革命的风口”学术研讨会在江苏师范大学云龙校区顺利举行。本次论坛由江苏师范大学、语言能力省部共建协同创新中心主办,语言能力省部共建协同创新中心机器语言能力平台、江苏师范大学语言科学与艺术学院、江苏省重点培育智库语言能力高等研究院、江苏省人工智能学会自然语言处理专委会承办。来自清华大学、北京大学、中国人民大学、复旦大学、武汉大学、百度、科大讯飞、出门问问等数十家高校、科研机构和企业界的近百名专家学者和业界人士参加了本次论坛。
大会开幕式由江苏师范大学副校长娄峥嵘教授主持,江苏师范大学副校长商亮教授向与会嘉宾介绍语言能力协同创新中心的学科发展情况并致欢迎辞。江苏省教育厅科学技术与产业处副处长徐宁致辞,高度评价了语言能力协同创新中心在加强基础研究提供政策依据、推普脱贫攻坚和服务社会发展等方面的代表性作用。教育部高等学校中国语言文学教学指导委员会副主任委员、北京语言大学原校长刘利教授代表教指委致辞,江苏师范大学语言学学科已成为我国新文科建设的突出代表。
与会专家围绕大语言模型的成长及功能、大语言模型与脑科学的互动、人与机器语言理解的比较分析、人工智能技术与智慧教育、语言加工认知机制的计算建模研究等议题展开深入讨论,共奉献了19场特邀报告。在与会专家的报告中,大语言模型与人类语言的比较分析成为热议的话题。
教育部长江学者特聘教授、江苏师范大学语言能力协同创新中心主任杨亦鸣教授指出,以ChatGPT为代表的大语言模型的出现是人类科技发展史上的重大突破,它开启了全球第四次科技革命——“智能化”——的浪潮。不同于以往模型需要依赖标注大数据,大语言模型克服了知识瓶颈,仅需要少量微调就能应用到特定应用领域,表现出超强的学习迁移能力,大语言模型已经跨越了智障阶段,进入了情感陪伴和智力共生阶段,一种可以逐步“解放大脑”的智能型生产工具已出现,人的脑力效率将得到极大提高。百度公司技术委员会主席吴华研究员介绍了百度公司的知识增强大语言模型“文心一言”,并就大模型能力和应用范式进行了探讨。科大讯飞副总裁汪张龙研究员展示的科大讯飞星火认知智能模型在赋能智能语言学习全场景表现出色,开启了智能语言学习新时代。出门问问副总裁李维博士介绍了该公司的一站式AIGC产品矩阵,剖析了大语言模型的本性及内容创作新范式。这些国内顶尖科技公司的生成式人工智能大模型在逻辑思考、数学证明、智能编程、文档问答与摘要、图表生成、图片理解等领域展现出惊人的天赋与优良的性能,受到与会专家的高度好评。
清华大学人工智能研究院常务副院长孙茂松教授展示了大语言模型在具备一定规模之后涌现出的类似于数学符号推导的推理“创新”能力,他认为语言生成模型之所以具有强大的生成能力,其深刻内因在于它使用了向量语言,进而可实现“万物皆向量”。
然而,与会专家也不回避大语言模型的局限性和面临的挑战。他们认为,尽管大语言模型在处理语言任务方面表现出色,但与人类语言相比仍存在差距。与人类相比,大语言模型在理解抽象概念、基本常识、逻辑推理以及上下文的能力上有待提高。北京大学计算语言学研究所副所长詹卫东教授在对大语言模型进行的智能水平测试中发现,大语言模型表现出明显的计划能力缺陷。浙江大学生物医学工程与仪器科学学院研究员丁鼐教授的实验结论显示大语言模型对形容词的理解能力与人脑存在明显差异。江苏师范大学吴燕京教授研究表明人类与生俱来的“语言习得装置”接触少量语言刺激即可习得相应的语言能力,人类语言习得并非基于大数据的训练。北京师范大学认知神经科学与学习国家重点实验室丁国盛教授认为,大语言模型比之以往是一个非常大的超越,但和人相比还是不足,大语言模型不能真正理解语义。向量语言模型生成的“语言”语义和人类的语言语义之间仍存在难以逾越的鸿沟。
人类有着天赋的语言机制,这一机制有许多大语言模型无法模拟的方面。杨亦鸣教授指出,大语言模型的语言“创新”与人类语言的创新存在本质区别。大语言模型是将人类加工过的语言及其衍生品(文本、图片等)转化为数字信息并依据同现概率等统计信息进行进一步处理的,大语言模型涌现能力的呈现依然受人类的影响,如人类对度量方式的选择、微调指令的不同等,而非模型特性上的根本性变化,这与人类语言所呈现的自主创新存在本质不同。正如洪堡特所说,“语言产生自人类的内在需求”,即人类内在精神需求驱动其载体——语言的创新,人可以说出想说的内容,婴幼儿能够说出之前没听过、没说过的言语,每次语言行为的结果(语言作品)都是创新的,是自主创造的,不是数据的重复。
北京外国语大学王克非教授、武汉大学赵世举教授等也指出,正是由于大语言模型与人类语言存在本质不同,过度依赖大数据和云计算也造成了,如能源消耗过高,数据资源即将耗尽,价值观、道德观的偏离,由于自我监督缺乏而导致的“一本正经地胡说八道”等问题。
最后,与会专家们对大语言模型的未来发展进行了展望。中国科学院院士、清华大学人工智能研究院院长张钹教授指出,大语言模型的未来发展路径之一是扩展多模态,扩大模型规模,研究与发展GPT语言,但其生成式方法的局限性决定了大语言模型并不适用于确定性答案、逻辑推理等语言应用领域,需要研究者另辟蹊径。杨亦鸣教授指出,人脑“预装”的语言机制是大语言模型难以超越人类语言的根本原因,应当从分子、细胞、行为、功能层面开展全方位的语言脑机制研究,破译人脑语言加工之谜,以此建构可以“预装”的“语言脑”,可能是我国人工智能发展的一条创新路径。开辟独创独有、引领发展的科技创新方向,或可突破目前的大语言模型的局限,进一步解决人工智能本身机理不清问题,抢占下一代人工智能战略制高点,才有可能真正模仿类人智能,实现真正的通用人工智能。
本次会议聚集了多学科领域的顶级专家共同聚焦当前科技前沿,激发出更多关于大语言模型发展方向创新思路的想法,为更好的把握科技创新和产业革命的风口、推动大语言模型与人类语言更进一步开风气之先,具有重要的现实意义,受到人民日报、光明日报、新华日报、中国教育电视台等多家媒体的关注与报道。
江苏师范大学副校长娄峥嵘主持开幕式
江苏师范大学副校长商亮致欢迎辞
江苏省教育厅科学技术与产业处副处长徐宁致辞
教育部高等学校中国语言文学教学指导委员会副主任委员刘利致辞
中国科学院张钹院士作特邀报告
语言能力协同创新中心主任杨亦鸣教授作特邀报告
清华大学人工智能研究院常务副院长孙茂松教授作特邀报告
百度公司技术委员会主席吴华作特邀报告
科大讯飞副总裁汪张龙作特邀报告
出门问问副总裁李维作特邀报告