ChatGPT那人那事
摘要:从2022年11月发布到之后差不多半年的时间,ChatGPT所引起的关注、产生的影响,可能已经超越了信息技术历史上的几乎所有热点。
刘江
从2022年11月发布到之后差不多半年的时间,ChatGPT所引起的关注、产生的影响,可能已经超越了信息技术历史上的几乎所有热点。
它的用户数2天达到100万,两个月达到1亿,打破了TikTok之前的记录,而在2023年5月它上架苹果应用商店后,也毫无悬念地冲上了免费App榜榜首。
许多人平生第一次接触如此高智能、知错能改的对话系统。虽然它很多时候会非常自信、“一本正经地胡说八道”,甚至连简单的加减法也算不对,但如果你提示它错了,或者让它一步步地来,它就会很“灵”地变得非常靠谱,有条不紊地列出做事情的步骤,然后得出正确答案。对于一些复杂的任务,你正等着看它的笑话呢,它却会不紧不慢地给你言之成理的回答,让你大吃一惊。
众多业界专家也被它征服:原本不看好它甚至在2019年微软投资OpenAI的决策中投了反对票的盖茨,现在将ChatGPT与PC、互联网等相提并论;英伟达CEO黄仁勋称它带来了AI的“iPhone时刻”;OpenAI的山姆·阿尔特曼(Sam Altman)将它比作印刷机;谷歌CEO孙达尔·皮柴(Sundar Pichai)说它是“火和电”……这些说法都与腾讯创始人马化腾认为ChatGPT“几百年不遇”的观点不谋而合,总之都是说它开启了新时代。阿里巴巴CEO张勇的看法是:“所有行业、应用、软件、服务,都值得基于大模型能力重做一遍。”以马斯克为代表的很多专家更是因为ChatGPT的突破性能力可能对人类产生威胁,呼吁应该暂停强大AI模型的开发。
2015年,30岁的山姆·阿尔特曼和28岁的格雷格·布罗克曼(Greg Brockman)与马斯克联手,召集了30岁的苏茨克维等多位AI顶级人才,共同创立OpenAI,希望在谷歌、Facebook等诸多巨头之外,建立中立的AI前沿科研阵地,并且雄心勃勃地把构建与人类水平相当的人工智能作为自己的目标。那时候,媒体报道基本上都以马斯克支持成立了一家非营利AI机构为标题,并没有多少人看好OpenAI。甚至连苏茨克维这样的灵魂人物,在加入前也经历了一番思想斗争。
前3年,他们在强化学习、机器人、多智能体、AI安全等方面多线出击,的确没有取得特别有说服力的成果。以至于主要赞助人马斯克对进展不满意,动了要来直接管理的念头。在被理事会拒绝后,他选择了离开。2019年3月,山姆·阿尔特曼开始担任OpenAI的CEO,并在几个月内完成了组建商业公司、获得微软10亿美元投资等动作,为后续发展做好了准备。
2020年,GPT-3横空出世,NLP(Natural Language Processing,自然语言处理)小圈子里的一些有识之士开始意识到OpenAI技术路线的巨大潜力。在中国,北京智源人工智能研究院联合清华大学等高校推出了GLM、CPM等模型,并积极在国内学术界推广大模型理念。
2020年底,OpenAI的两位副总达里奥·阿莫迪(Dario Amodei)和丹妮拉·阿莫迪(Daniela Amodei)(同时也是兄妹)带领GPT-3和安全团队的多位同事离开,创办了An-thropic。达里奥·阿莫迪在OpenAI的地位非同一般:他是伊尔亚·苏茨克维之外,技术路线图的另一个制作者,也是GPT-2和GPT-3项目以及安全方向的总负责人,而随他离开的,有GPT-3和规模定律论文的多位核心人员。
一年后,Anthropic发表论文“A General Language Assistant as a Lab-oratory for Alignment”,开始用聊天助手研究对齐问题,此后逐渐演变为Claude这个智能聊天产品。
2022年6月,论文“Emergent Abilities of Large Language Models”发表,第一作者是仅从达特茅斯学院本科毕业两年的谷歌研究员Jason Wei(今年2月,他在谷歌的“精英跳槽潮”中去了OpenAI)。他在论文中研究了大模型的涌现能力,这类能力在小模型中不存在,只有模型规模扩大到一定量级才会出现——也就是我们熟悉的“量变会导致质变”。
当年11月中旬,本来一直在研发GPT-4的OpenAI员工收到管理层的指令:所有工作暂停,全力推出一款聊天工具,原因是有竞争。两周后,ChatGPT诞生。这之后的事情已经载入史册。
业界推测,OpenAI管理层应该是得知了Anthropic Claude的进展,意识到这一产品的巨大潜力,决定先下手为强。这展现出核心人员超强的战略判断力。要知道,即使是ChatGPT的核心研发人员也不知道为什么该产品推出后会这么火(我爸妈终于知道我在干什么了),他们在自己试用时完全没有惊艳的感觉。
2023年3月,在长达半年的“评估、对抗性测试和对模型及系统级缓解措施的迭代改进”之后,GPT-4发布。微软研究院对其内部版本(能力超出公开发布的线上版本)研究的结论是:“在所有这些任务中,GPT-4的表现与人类水平接近得惊人……鉴于GPT-4的广度和深度,我们认为它可以合理地被视为AGI系统早期(但仍然不完整)的版本。”
此后,国内外的企业和科研机构纷纷跟进,几乎每周就有一个甚至多个新模型推出。但在综合能力上,OpenAI仍然一骑绝尘,唯一可以与之抗衡的,是Anthropic。
很多人会问:为什么中国没有产生ChatGPT?其实正确的问题应该是:为什么全世界只有OpenAI能做出ChatGPT?他们成功的原因是什么?
对此的思考,到今天仍有意义。(作者系图灵公司联合创始人、总编,文章摘自《这就是ChatGPT》有删减)
责任编辑:张晶