ChatGPT那人那事

2023-07-27 11:39 中国经济导报-中国发展网

摘要：从2022年11月发布到之后差不多半年的时间，ChatGPT所引起的关注、产生的影响，可能已经超越了信息技术历史上的几乎所有热点。

刘江

从2022年11月发布到之后差不多半年的时间，ChatGPT所引起的关注、产生的影响，可能已经超越了信息技术历史上的几乎所有热点。

它的用户数2天达到100万，两个月达到1亿，打破了TikTok之前的记录，而在2023年5月它上架苹果应用商店后，也毫无悬念地冲上了免费App榜榜首。

许多人平生第一次接触如此高智能、知错能改的对话系统。虽然它很多时候会非常自信、“一本正经地胡说八道”，甚至连简单的加减法也算不对，但如果你提示它错了，或者让它一步步地来，它就会很“灵”地变得非常靠谱，有条不紊地列出做事情的步骤，然后得出正确答案。对于一些复杂的任务，你正等着看它的笑话呢，它却会不紧不慢地给你言之成理的回答，让你大吃一惊。

众多业界专家也被它征服：原本不看好它甚至在2019年微软投资OpenAI的决策中投了反对票的盖茨，现在将ChatGPT与PC、互联网等相提并论；英伟达CEO黄仁勋称它带来了AI的“iPhone时刻”；OpenAI的山姆·阿尔特曼（Sam Altman）将它比作印刷机；谷歌CEO孙达尔·皮柴（Sundar Pichai）说它是“火和电”……这些说法都与腾讯创始人马化腾认为ChatGPT“几百年不遇”的观点不谋而合，总之都是说它开启了新时代。阿里巴巴CEO张勇的看法是：“所有行业、应用、软件、服务，都值得基于大模型能力重做一遍。”以马斯克为代表的很多专家更是因为ChatGPT的突破性能力可能对人类产生威胁，呼吁应该暂停强大AI模型的开发。

2015年，30岁的山姆·阿尔特曼和28岁的格雷格·布罗克曼（Greg Brockman）与马斯克联手，召集了30岁的苏茨克维等多位AI顶级人才，共同创立OpenAI，希望在谷歌、Facebook等诸多巨头之外，建立中立的AI前沿科研阵地，并且雄心勃勃地把构建与人类水平相当的人工智能作为自己的目标。那时候，媒体报道基本上都以马斯克支持成立了一家非营利AI机构为标题，并没有多少人看好OpenAI。甚至连苏茨克维这样的灵魂人物，在加入前也经历了一番思想斗争。

前3年，他们在强化学习、机器人、多智能体、AI安全等方面多线出击，的确没有取得特别有说服力的成果。以至于主要赞助人马斯克对进展不满意，动了要来直接管理的念头。在被理事会拒绝后，他选择了离开。2019年3月，山姆·阿尔特曼开始担任OpenAI的CEO，并在几个月内完成了组建商业公司、获得微软10亿美元投资等动作，为后续发展做好了准备。

2020年，GPT-3横空出世，NLP（Natural Language Processing，自然语言处理）小圈子里的一些有识之士开始意识到OpenAI技术路线的巨大潜力。在中国，北京智源人工智能研究院联合清华大学等高校推出了GLM、CPM等模型，并积极在国内学术界推广大模型理念。

2020年底，OpenAI的两位副总达里奥·阿莫迪（Dario Amodei）和丹妮拉·阿莫迪（Daniela Amodei）（同时也是兄妹）带领GPT-3和安全团队的多位同事离开，创办了An-thropic。达里奥·阿莫迪在OpenAI的地位非同一般：他是伊尔亚·苏茨克维之外，技术路线图的另一个制作者，也是GPT-2和GPT-3项目以及安全方向的总负责人，而随他离开的，有GPT-3和规模定律论文的多位核心人员。

一年后，Anthropic发表论文“A General Language Assistant as a Lab-oratory for Alignment”，开始用聊天助手研究对齐问题，此后逐渐演变为Claude这个智能聊天产品。

2022年6月，论文“Emergent Abilities of Large Language Models”发表，第一作者是仅从达特茅斯学院本科毕业两年的谷歌研究员Jason Wei（今年2月，他在谷歌的“精英跳槽潮”中去了OpenAI）。他在论文中研究了大模型的涌现能力，这类能力在小模型中不存在，只有模型规模扩大到一定量级才会出现——也就是我们熟悉的“量变会导致质变”。

当年11月中旬，本来一直在研发GPT-4的OpenAI员工收到管理层的指令：所有工作暂停，全力推出一款聊天工具，原因是有竞争。两周后，ChatGPT诞生。这之后的事情已经载入史册。

业界推测，OpenAI管理层应该是得知了Anthropic Claude的进展，意识到这一产品的巨大潜力，决定先下手为强。这展现出核心人员超强的战略判断力。要知道，即使是ChatGPT的核心研发人员也不知道为什么该产品推出后会这么火（我爸妈终于知道我在干什么了），他们在自己试用时完全没有惊艳的感觉。

2023年3月，在长达半年的“评估、对抗性测试和对模型及系统级缓解措施的迭代改进”之后，GPT-4发布。微软研究院对其内部版本（能力超出公开发布的线上版本）研究的结论是：“在所有这些任务中，GPT-4的表现与人类水平接近得惊人……鉴于GPT-4的广度和深度，我们认为它可以合理地被视为AGI系统早期（但仍然不完整）的版本。”

此后，国内外的企业和科研机构纷纷跟进，几乎每周就有一个甚至多个新模型推出。但在综合能力上，OpenAI仍然一骑绝尘，唯一可以与之抗衡的，是Anthropic。

很多人会问：为什么中国没有产生ChatGPT？其实正确的问题应该是：为什么全世界只有OpenAI能做出ChatGPT？他们成功的原因是什么？

对此的思考，到今天仍有意义。（作者系图灵公司联合创始人、总编，文章摘自《这就是ChatGPT》有删减）

责任编辑：张晶