“聊天”是人工智能的新机遇吗？

2023-01-12 09:23:29 来源： 《环球》杂志

2022年3月1日，一名女子在西班牙巴塞罗那2022世界移动通信大会上通过虚拟现实技术在“元宇宙”中体验音乐会

　　“聊天”似乎即将在人工智能领域带来一场全新的盛宴，只不过这一次坐在餐桌上的玩家，与20年前互联网兴起时相比，可能需要缴纳更多的入场费。

文/彭天放

编辑/乐艳娜

　　2022年12月，一款名为ChatGPT的人工智能聊天程序在全世界火出了圈。一时间，不只是计算机从业者，来自各行各业的人们，都忍不住上手和这个人工智能程序聊几句——除了想亲身体验一下跟算法“聊天”的感觉之外，更多的人还想看看是否可以从“聊天”中，挖掘出人工智能市场的新机遇。

ChatGPT的功能似乎深不见底

　　这款ChatGPT程序由美国的人工智能企业OpenAI在2022年11月30日正式发布，并开放了测试接口。很快，数以万计的测试者涌入了该公司的服务器。特斯拉首席执行官马斯克在推特上称赞其“好得令人害怕”。无数神奇的对话功能被测试者接二连三挖掘出来。

　　ChatGPT之所以拥有如此高的热度，最直接的原因是其拥有非常强大的“对话”能力以及非常简单的使用方法——用户只需在一个类似微信的对话框中输入一段话，程序就会给出回复。而且，这种对话可以是连续的，如果用户一直聊下去，程序会记住和用户之前的对话，并且做出恰当的回应。更重要的是，这些由程序做出的回应并不是闲聊或者模棱两可的回复，而常常是很能满足人类用户预期的答案。

　　比如，当用户输入一段科技论文，要求程序总结其中的关键信息时，ChatGPT可以给出十分标准的要点提炼；当用户输入一段文稿，要求程序修改其中表达不当的地方时，ChatGPT不仅会输出一段修改好的文字，还会耐心对每一处修改给出原因；甚至，当用户要求程序编写一段实现特定功能的计算机代码时，它也能够以相当高的正确率输出一段已经写好的程序。

　　该程序的测试者们也经常在网上发帖分享自己同该程序的聊天技巧。不像传统的程序在发布时就附带有明确的功能说明，ChatGPT似乎成为一个深不见底的宝库，需要测试者不断打磨自己的对话能力和提问水平，才能从它的“口中”得到更好的答案。人们不禁开始期待，ChatGPT这个看似“万能”的对话程序，会不会带来新的人工智能产业机遇。

“聊天”人工智能似乎生逢其时的意义

　　上一次人工智能如此受到公众关注，可能还要追溯到2016年AlphaGo战胜李世石的那一刻。彼时，公众惊讶地发现在复杂智力游戏上，围棋这个堪称人类最后的堡垒也被人工智能攻破。而在获得了公众的惊叹之后，便是一轮人工智能创业的大浪潮到来。如今资本市场上鼎鼎大名的许多人工智能企业，都是在2016年的那次惊叹后，走上了高速增长的轨道。

　　到了2022年，许多在上一轮人工智能浪潮中获得了很高估值乃至市值的企业，在如今的营收上却并没能满足公众在6年前的预期。诸如图像识别、语音识别、辅助驾驶等领域，虽然已经在相当程度上采用了以深度学习为代表的人工智能技术，但并没能带来“革命性”新产业。2022年11月，美国硅谷的科技公司大规模裁员，仅一个月内就有超过4万名员工从科技公司离职，创下了历史纪录。其中，很多企业高薪聘请的人工智能工程师就首当其冲被裁员——这也反映出在当前世界范围内，科技公司对人工智能技术的投入不再大手大脚，而是开始更加注重其盈利能力。

　　有趣的是，科技和商业的节奏似乎总是会差几拍。就在行业迫切寻找新的增长点时，2022年人工智能的进展，只能用大放异彩来形容。其中，有在蛋白质结构预测领域横扫天下，剑指药物研发行业的AlphaFold模型，也有在艺术创作领域掀起革命的扩散（Diffusion）模型，更有年底这个彻底火出圈的ChatGPT。行业开始期待，人工智能的新一轮浪潮是不是要来了？

　　ChatGPT之所以让整个行业如此期待，除了其惊艳的效果之外，还有另一层原因——即“聊天”作为人工智能的一种能力，在科研人员的心中有着非常独特的地位。1950年，人工智能的“祖师爷”之一阿兰·图灵发表了《机器人能思考吗？》一文，首次提出了大名鼎鼎的图灵测试，大意是：如果有30%的人类，以对话的形式，无法在5分钟之内分辨对话的对象是人还是计算机程序，就可以认为这个程序通过了图灵测试。而图灵测试，被相当一部分从事人工智能研究的科研人员认为是计算机程序通往“智能”，甚至“通用智能”的金标准之一。

　　除了背负重大的历史意义之外，聊天技术在当今的人工智能版图中，也占有非常独特的地位。这主要是因为，聊天是一种相当泛化的能力——正如上面所介绍的，人类用户既可以闲聊，也可以提出一些指向性非常强的任务，比如要求程序帮忙写一篇报告、搜索一个信息、解答一道题目，甚至提出一些人生建议。而很多其他我们较为熟悉的人工智能领域，比如自动驾驶、图像识别、语音识别、博弈推理等等，其标准的任务目标是相当聚焦的。

　　这种泛化的潜力使得在某种意义上，聊天成为一种非常高级的智能功能，因为人类所有的知识无非是用语言和符号进行交流的。于是，聊天也就成为了可以承载无数技术乃至商业期待的一项人工智能功能。这正是ChatGPT一出现，就能够火出技术圈的重要原因。

ChatGPT的强大功能是如何实现的？

　　这种看起来十分万能的聊天能力在技术上之所以能够实现，是基于近几年在自然语言处理（NLP）领域快速兴起的大型语言模型（LLM）技术。简单来说，这是一种用规模打败复杂性的方法——即用动辄参数量成百上千亿的大模型，来解决与人类对话这种高度复杂和宽泛的任务。

　　但大模型并不是ChatGPT的全部。早在2020年，OpenAI公司就发布了ChatGPT的前身——GPT-3模型，其参数量达到了惊人的1750亿，换算成存储空间估计大约有700GB。当时，GPT-3模型就已经可以实现非常出色的闲聊、写作文等功能，在科技圈引发一波不小的关注。时隔两年多，这次发布的ChatGPT最重要的技术进步，是引入了一种新的打磨大模型的方法：基于人工反馈的强化学习方法（RLHF）。

　　为什么要用这种新方法呢？主要原因是，先前版本的GPT在对话内容的指向性上表现不理想，回答的答案往往过于宽泛，只能和人类用户就一些目标不强的问题进行闲聊。而当用户有一些明确的需求时，很难第一时间给出所需要的回应。

　　而这一次使用的RLHF方法，简单来说就是给GPT模型加入了一个答案评价机制。以往的GPT模型在面对人类提问时，通常只是从自己生成的很多回答中随机抽取一个。这些备选答案里，有的是认真的回应，有的则是插科打诨，有的甚至是反问。而GPT在过去难以判断什么是人类用户真正期待的回答。RLHF方法则另外通过人工标注的数据，训练了一个“答案评价器”，对GPT做出的回答进行评价，从而不断打磨该模型，直到最终使其可以很高概率地输出人类想要的答案。

　　由于在新的训练思路下展现出了解决真实人类需求的能力，大型的语言模型似乎已经不只是科技公司用来炫耀技术实力的项目，产业界已经在认真思考它是否会引发一轮新的产业机遇了。

　　业界最大胆的猜测是，ChatGPT会不会逐渐取代谷歌等搜索引擎企业，成为未来人类用户查找问题答案的新渠道？这一猜测的背景，主要是基于它在回答人类问题时，非常符合人类对话习惯的回答方式，远比在大量排序的答案中慢慢寻找让用户感到满意的答案更方便。除此之外，业界同样在猜测ChatGPT及后续的其他语言模型，会不会进一步对文书、客服甚至游戏行业产生颠覆性的影响。

　　尽管看起来很有希望，但是要想抓住上述行业猜测的许多新机会，ChatGPT还有其他的大型语言模型看起来至少还面临着两个挑战。首先是技术上的，目前ChatGPT虽然在很多问题上能够给出令人满意的回答，但是答案的细节上往往会出现一些问题，比如三位数的加减法这种需要逻辑运算的问题，以及搜索一些冷门信息时，用户经常会得到斩钉截铁但又似是而非的答案。

　　其次在经济层面，目前这些大型的语言模型的训练成本十分昂贵，以ChatGPT的前身GPT-3为例，训练一次所要消耗的成本高达近8400万元人民币。可以想象，任何想基于这类大型语言模型定制的商业功能，首先都需要迈过训练成本这个门槛。这无疑减缓了很多针对大型语言模型的大胆尝试。

　　不论如何，“聊天”似乎即将在人工智能领域带来一场全新的盛宴，只不过这一次坐在餐桌上的玩家，与20年前互联网兴起时相比，可能需要缴纳更多的入场费。

　　（作者系清华大学精密仪器系博士）

来源：2023年1月11日出版的《环球》杂志第1期

《环球》杂志授权使用，如需转载，请与本刊联系。

更多内容敬请关注《环球》杂志官方微博、微信：“环球杂志”。