零一万物发布千亿参数模型Yi-Large，李开复呼吁关注TC-PMF

2024-05-14 14:21 中国经济导报-中国发展网

中国经济导报中国发展网讯 5月13日，在零一万物成立一周年之际，零一万物 CEO 李开复博士携带千亿参数 Yi-Large 闭源模型正式亮相，正式进军全球 SOTA 顶级大模型之首，在斯坦福最新的 AlpacaEval 2.0 达到全球大模型 Win Rate 第一。除此之外，零一万物将早先发布的 Yi-34B、Yi-9B/6B 中小尺寸开源模型版本升级为 Yi-1.5 系列，每个版本达到同尺寸中 SOTA 性能最佳。

在国际领先的底座模型之上，零一万物本月同步官宣了从应用到生态的产品线：2C 生产力应用 “万知” 正式提供服务、赋能 2B 生态的 “API 开放平台” 今日全球上线。借一周年发布会，零一万物公开了开源闭源双轨大模型的战略布局，低调许久的创始人李开复也首度现身说法，亲自解读发展蓝图背后的战略思路。

在中国大模型进入第二年之际，李开复提出，国内大模型赛道的竞跑从狂奔到长跑，终局发展将取决于各个选手如何有效达到 “TC-PMF”（Product-Market-Technology-Cost Fit，技术成本 X 产品市场契合度）。大模型从训练到服务都很昂贵，算力紧缺是赛道的集体挑战，行业应当共同避免陷入不理性的 ofo 式流血烧钱打法，让大模型能够用健康良性的 ROI 蓄能长跑，奔赴属于中国的 AI 2.0 变革。

据了解，零一万物以全球为目标市场，基于全球领先的 Yi 系列模型做出符合 TC-PMF 的B端和C端优质应用，进而与行业携手推进 AI 2.0 生态。中国市场的AI普惠必然到来，零一万物将结合国际经验，打造惊艳的国内 AI-First 应用生态，实现“让通用人工智能普惠各地，人人受益”的公司愿景。

去年11月，零一万物所发布的 Yi-34B 以开源社区“甜点级”尺寸就在权威榜单中超越了 Llama2-70B、Falcon-180B等大几倍的模型，成为当时世界范围内开源最强基础模型之一，引发国际开发者社区的热烈回响和采用，在国际开源圈破圈建立了全球化的技术品牌信任感。

半年后，零一万物正式发布千亿参数规模的 Yi-Large，在第三方权威评测中，零一万物 Yi 模型在全球头部大模型的中英文双语 PK 上表现出色。最新出炉的斯坦福评测机构 AlpacaEval 2.0 经官方认证的模型排行榜上，Yi-Large 模型的英语能力主要指标 LC Win Rate（控制回复的长度）排到了世界第二，仅次于 GPT-4 Turbo，Win Rate 更排到了世界第一，此前国内模型中仅有 Yi 和 Qwen 曾经登上此榜单的前 20。

在更全面的大模型综合能力评测中，Yi-Large 多数指标超越 GPT4、Claude3、Google Gemini 1.5 等同级模型，达到首位。在通用能力、代码生成、数学推理、指令遵循方面都取得了优于全球领跑者的成绩，稳稳跻身世界范围内的第一梯队。随着各家大模型能力进入到力求对标GPT4的新阶段，大模型评测的重点也开始由简单的通用能力转向数学、代码等复杂推理能力。在针对代码生成能力的 HumanEval、针对数学推理能力的 GSM-8K和 MATH、以及针对领域专家能力的GPQA等评测集上，Yi-Large也取得了具有绝对优势的成绩。

此外，从行业落地的角度来看，理解人类指令、对齐人类偏好已经成为大模型不可或缺的能力，指令遵循相关评测也越发受到全球大模型企业重视。斯坦福开源评测项目 AlpacaEval 和伯克利 LM-SYS 推出的 MT-bench 是两组英文指令遵循评测集，AlignBench 则是由清华大学的团队推出的中文对齐评测基准。在中外权威指令遵循评测集中，Yi-Large 的表现均优于国际前五大模型。

发布会上，李开复还宣布，零一万物已启动下一代 Yi-XLarge MoE 模型训练，将冲击 GPT-5 的性能与创新性。从 MMLU、GPQA、HumanEval、MATH 等权威评测集中，仍在初期训练中的 Yi-XLarge MoE 已经与 Claude-3-Opus、GPT4-0409 等国际厂商的最新旗舰模型互有胜负，训练完成后的性能令人期待。

去年零一万物选择以开源首发 Yi 系列模型，其优异的性能受到国际开发者的高度认可。Yi 开源版本2023年11月上线首月，便占据开源社区近5成热门模型排行，发布一个月后 Yi-34B 被 Nvidia 大模型 Playground 收录，成为国内唯一获选模型，也建立了 Yi 模型面向国际的科技品牌信任度。

以开源模型构建生态，以闭源模型展开 AI-First 探索，开源闭源双轨模型策略使得零一万物构建起了生态体系。开源模型服务于全球的科研院校、学生、开发者、创业者人群，推动百花齐放的应用滋长；API 开放平台提供企业商用，协助企业实践 AI 2.0 的智能化转型。同时，零一万物以优异的闭源模型能力，正在积极探索与世界 500 强企业的大型战略合作。开源闭源相互助力，确保零一万物本着 TC-PMF 的方法论，以更稳健的步伐奔向 AGI。

全球开发者们对开源模型的品牌认可，成为零一万物 API 服务的强有力支撑。零一万物宣布面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口，保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案，Yi API Platform 英文站同步对全球开发者开放试用申请。

能否实现价值落地是一切技术的试金石。大模型公司不仅要放眼 AGI，更重要的是要切实推动模型进入各行各业、进入日常生活，让每个人都能享受到 AI 2.0所带来的便利。

近期上线的一站式 AI 工作站“万知”（wanzhi.com 微信小程序“万知AI”）则是零一万物基于世界领先的闭源模型 Yi-Large 所做出的 “模应一体” 2C 生产力应用。依托零一万物闭源模型的强大能力，万知在通用问答、多模态、长文本方面都有着不俗表现。更令人惊喜的是，万知成为业内第一款真正实践了“AI-First”理念、创新性地将模型能力与应用场景完美融合的 2C 应用产品。

在零一万物 API 平台负责人蓝雨川看来，已经在海外充分得到商业模式验证的 API 会是更好的选择。作为标准化产品的 API 复用性更强，商业模式也更趋近于云服务。比起 AI 1.0 定制化重交付的模式，API 能够更快穿透千行百业，蓝雨川表示，零一万物提供世界第一梯队的模型、最佳性价比的方案，聚焦企业如何用 AI 为自身业务带来增长。

API 与万知等C端应用共同构建起了零一万物的商业落地版图，也成为零一万物追逐 TC-PMF 的重要实践。在李开复的规划中，零一万物将作为具有前瞻性的务实者一步步实现落地，并最终达到 TC-PMF，打造出 AI 2.0 时代的超级应用，实现让通用人工智能普惠各地，人人受益。

值得一提的是，无论是B端API 还是C端应用，零一万物都已开启海外的落地尝试。去年9月开始，零一万物便聚焦生产力、社交赛道于海外应用展开探索，已有 4 款产品陆续上线。目前零一万物海外生产力应用总用户接近千万，营收今年预期过亿元人民币，已实践出大模型 2C 产品的 TC-PMF——产品 ROI 为1，初步摆脱烧钱获客，成功验证了 AI-First 产品的用户订阅制商业模式。API 也将面向海外推出 Yi-Large、Yi-Large-RAG、Yi-Medium 等API，还未上线便已在开发者群体里引发关注。

李开复表示，ofo 式的补贴逻辑不再适用于 AI 2.0，希望大模型赛道的竞争聚焦于达成 TC-PMF。零一万物将以全球为目标市场，以更从容的姿态迎接必然被点燃的中国普惠AI市场。

责任编辑：潘晓娟