查看原文
其他

圆桌|杨旭:语言学观照下的ChatGPT

杨旭 摩登语言学 2023-06-17

2023年2月15日,武汉大学言吾学社举办了“ChatGPT来了:人工智能如何改写人文社会科学的教学与研究”的圆桌论坛,“摩登语言学”将陆续分享各位老师的发言。以下是杨旭老师的部分。

我先介绍三个名人的观点,再提出自己的一些疑惑或想法。

第一个是特德·姜(科幻小说家),他在《纽约客》发表了一篇题为“ChatGPT是网络上的一个模糊的JPEG文件”的文章,引起了很大的反响。JPEG相对RAW是一种压缩后的格式,会丢失很多重要的信息或数据,他认为ChatGPT转述信息就是一种压缩,如果将来AI产生的语言也被喂进模型,那么丢失的信息或数据会越来越多,这就好比一张照片经过无数次复印会变得越来越模糊不清。

第二个是乔姆斯基(语言学家),他说ChatGPT是一种高科技抄袭和避免学习的方式。从乔姆斯基嘴里说出这句话,好像显得有点平庸,因为好多媒体都在讨论AI剽窃的问题。但我个人认为这也是一种隐喻,就是说,ChatGPT并不像人类语言一样具有创造性,它只是基于大语言模型的概率模式生成语言,但不理解语言,也无法创造思想——这种认识其实和特德·姜类似。

第三个是Jieun Kiaer(牛津大学韩语教授),她在新近出版的著作《与AI同行:一位语言学家对ChatGPT的回应》中讨论了ChatGPT带来的种种问题,尤其是从语言学视角提出了AI的两个缺陷:其一是缺乏语言多样性,即AI的主要语言是英语,在非欧洲语言中的运行效果并不好;其二是缺乏语用多样性,即AI尚无法重现人类交际过程中微妙而复杂的语用意义。

下面是我个人的疑惑或想法:

(1)人类沟通很重要的基础是社会认知能力,就是说我们会在交流中有意无意地猜测他人的知识、意图和信念,以此来决定如何交流。李昱老师提到一个研究,说ChatGPT的达芬奇-003(davinci-003)可以解决93%的心智理论任务,与9岁儿童的表现相当,表明其可能发展出了一定的心智理论,这值得我们进一步探究。

(2)那么我们是如何猜测他人的心理状态的呢?我们是通过身体感觉到的各种线索,就是常说的多模态。但是ChatGPT目前只能进行文字交流(所谓“聊天”只是书面聊天,好比过去的短信),如果线索的种类没有那么丰富,那么ChatGPT猜测我们心思的能力就很值得怀疑,进而运用语言进行交流的能力(而非语法能力)也会存在问题。

(3)AI除了缺乏语言多样性和语用多样性,还缺乏变体多样性。ChatGPT的训练数据主要是书面语言,语言学史中的书面偏见阻碍了语言学进步,如果不认识到这一点也将阻碍AI的进步。事实上,书面和口语二元对立无法涵盖所有的语言变体,还包括各种社会方言、情景方言、个人方言等变体,这都是AI暂时难以胜任的地方。

(4)AI可以成为语言学家的助手甚至合作者,比如Jieun Kiaer就邀请了ChatGPT成为了她的合作者。AI掌握了大量的语言数据和语言学知识,因此可以协助语言学家处理各种语言学难题,比如对已有的“三千万种语法理论”(来自James D. McCawley所著的图书书名Thirty Million Theories of Gramma)进行反思,为AI的下一次升级提供来自语言学的智慧。

(5)在AI的发展中,语言学或语言学家好像缺席或隐身了。我问了ChatGPT这方面的问题,它说参考了语言学的一些成果,但没有采用某个具体的理论(ChatGPT的全称是Chat Generative Pre-trained Transformer,即聊天生成式预训练转换器,里面出现了“生成”和“转换”的字眼,但和转换生成语法没有什么关联),而是采用了一些不同于传统语言学中的方法和技术。我们都听过“每当我们解雇一名语言学家,我们的系统都会变得更准确”的说法(来自IBM的工程师Frederick Jelinek),个人感觉这将进一步加重语言学的危机感,或者说会推动语言学发生范式变化甚至革命。

(6)ChatGPT的火热也给语言学带来很多新的议题,比如ChatGPT等聊天机器人产出了一种新的语言,值得我们对语言的定义和本质进行更深入的思考。ChatGPT虽然基于自然语言,但无论是底层逻辑还是表层形式,都不同于人类语言。此外,ChatGPT还带热了古已有之的对话体,很多文章都以截图或转录的方式直接呈现对话记录,这证明了它不止是一种工具,更是一种数字人(Digital Human)的角色,可以以主体身份参与到我们的创作活动中。

作者介绍

杨旭,男,语言学博士,任职于武汉大学文学院,主要从事现代汉语语法、认知语言学和构式语法研究。在《语言教学与研究》《语言研究集刊》等期刊发表论/译文若干,出版译著《思维是平的》(2020),教授课程“现代语言学”“认知语言学”等,主持2022年度武汉大学海外人文社会科学研究前沿追踪项目“经验事件及其构式的类型学研究”。

往期:



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存