MOSS负责人：短期暂停训练更强AI模型没实质意义，关键要对齐人类价值观

想和chatgpt一较高下吗？请看这道填空题——

长颈鹿的声带很特殊，其声带中有一个浅沟，发声的时候就比较困难，而且要肺部、胸腔以及膈肌的共同帮助下它才可以发声，但是由于其脖子很长，这些器官相隔就挺远的，所以它也就没有办法_____

此处要准确地预测出“咳嗽”，需要对前面语句的语义和逻辑关系进行捕捉。这对于人类而言，也非易事。

chatgpt狂飙背后的关键技术是什么？我国首个类chatgpt模型moss怎么样了？4月1日晚，复旦大学计算机科学技术学院教授、moss系统负责人邱锡鹏，在复旦大学管理学院主办的“复旦科创先锋论坛”发表演讲。

【大型语言模型具备“涌现能力”】

2022年11月30日，openai发布了chatgpt。仅仅两个月，其月活跃用户已达1亿，是史上用户增速最快的消费应用。微软联合创始人比尔·盖茨认为，像chatgpt这样的ai聊天机器人将与个人电脑或互联网同样重要。

“很多人可能会说，chatgpt在技术上并没有太多创新，因为它背后的技术都是已有的，但对于它到底怎么做出来的其实并不清楚。chatgpt目前尚未开源，其参数规模和技术细节都没有对外公布，因此有人调侃它是‘closeai’。”邱锡鹏介绍

“在自然界，当物质的数量达到一定程度，会表现出不一样的性质。大型语言模型也具备这种‘涌现能力’。”邱锡鹏说，这里有一个“信息压缩”的概念，当大型语言模型被训练用较少的参数记住大量的数据，这就迫使它去发现文字背后蕴藏的规律，以更好地理解人类语言和世界知识。当模型规模大到一定阶段，大概在100亿参数规模以上，它的能力就会发生一个突变。

在涌现能力的背后，隐含着三个非常重要的技术。第一是情景学习，大型语言模型可以直接和人交互，这从产品角度来说也是一个很大的创新。有了情景学习，还可以大幅降低下游开发成本。第二是思维链，不仅给出答案，也给出逻辑推导。第三是自然指令学习，要让机器明白我们的情感和真实意图，以前是从大数据中学，现在可以直接从指令中学。

【moss和chatgpt有何异同】

“moss系统将在4月中旬开源发布。”邱锡鹏透露。今年2月，复旦大学自然语言处理实验室发布国内首个类chatgpt模型moss。至今，他被问得最多的问题就是——moss什么时候开源给大家用，以及是否会商业化。

邱锡鹏说，我们之所以很容易有“卡脖子”问题，因为缺乏一个好的行业生态。就拿chatgpt来说，openai公司只需专注做好模型，算力、数据和系统则交给其他公司。反观国内，很多公司在做大型语言模型时所有环节都需要自己做，每家的数据和算力也有限，结果是每家都做不大。“我们考虑把moss开源而不是商业化，就是希望改善这种生态，有了这样一个基座，大家就不用重复开发底层技术，可以在上面接不同的细分领域。”

moss和chatgpt有何异同？据介绍，moss模型有200亿参数，这意味着它也具有思维链、情景学习等涌现能力，能够执行人类的指令。这一参数大概是chatgpt规模的十分之一，因此moss的预训练成本会低很多。

moss也可以直接与人类对话，根据人类反馈进行迭代优化，并与人类的价值观、思维方式对齐。“moss和chatgpt具有相近的通用语义理解能力，每句话都能理解，但完成度还不高。”邱锡鹏说，相比chatgpt的千亿参数模型，moss在思辨推理和事实类知识方面有一定差距，这主要是由于参数规模不同造成的，可以通过扩大模型规模来实现。“我们一直在改进它，相信下一代版本会更强大。”

【关键要让机器对齐人类价值观，否则很危险】

最近，马斯克等人呼吁立即暂停训练比gpt-4更强大的 ai 模型，为期至少6个月。对此，邱锡鹏认为，暂停6个月没有什么实质意义，也很难停下来。

人工智能之父图灵最早提出人工智能概念时，就有过“机器的迭代会快于我们”的类似描述。“对此我还是比较乐观的，到目前为止，人工智能还限于工具层面，是可控的。后面进一步发展ai时，关键要让机器对齐人类的价值观，否则很危险。”

在邱锡鹏看来，大型语言模型不仅将加速通用人工智能的实现，还将引爆数字经济，为社会治理、生物医药、智慧金融、医疗健康和智能教育等提供新动能，并催生海量的商业新模式。“科幻电影里的人工智能可能很快就会实现，不管其以真实形态还是以数字人形态，将会参与到我们的生活中来。”

至于chatgpt是否会替代人，邱锡鹏认为chatgpt类似于通才，但距离细分领域的专业化还是有差距。“未来，人工智能会替代一部分工作，但永远不会替代能够利用人工智能的人，人的思考和判断会变得更重要。”

【gpt-5什么时候会出来】

“复旦科创先锋论坛”结束后，邱锡鹏接受了解放日报·上观新闻记者的专访。

解放日报·上观新闻：大型语言模型的涌现能力是怎么实现的？

邱锡鹏：这是一个量变引起质变的过程，当训练数据多到一定程度，它可能就融会贯通了。

解放日报·上观新闻：融会贯通的能力，是它自己进化的吗？是相当于从猿到人这样的进化吗？

邱锡鹏：这不是一个层面的概念。人工智能算法的进化，是它自己习得的，通过预测未来以实现对以往知识的理解。比如，在预测下一个单词时，预测得越准，就代表了对以前知识的理解越深。

解放日报·上观新闻：您预测gpt-5什么时候会出来？

邱锡鹏：可能一年吧，具体时间很难把握，在这之前应该还会有一个类似于gpt-4.5的版本，技术上越往后挑战越大。

解放日报·上观新闻：如何让机器对齐人类的价值观呢？

邱锡鹏：训练时，让一些专门经过培训的人给这些答案打分，对于模型产生的符合人类价值观的答案，会不断给予正向鼓励。

解放日报·上观新闻：这是一种新职业吗？

邱锡鹏：是的，这就是数据标注员。还有提示工程师，也是一种新职业，他们为机器生成的内容添加关键词和提示。这些新职业并不要求有人工智能知识背景。

解放日报·上观新闻：您在演讲中两次用了“乐观”一词，在这次人工智能革命中，中国有何机会？

邱锡鹏：我确实比较乐观。场景丰富或应用创新，一直以来是中国人工智能的一个特色。在这波aigc（利用人工智能生成内容）和大型语言模型浪潮中，应用驱动也很重要。

本文作者：黄海华

题图来源：邱锡鹏。复旦管院提供