北京通用人工智能研究院发布研究成果
中国发展网讯 在3月29日召开的2025中关村论坛通用人工智能论坛上,北京通用人工智能研究院重磅发布北京通用人工智能研究院研究成果,覆盖通用智能体+行业智能体+社会智能体三大智能体矩阵。其成果以“原创技术-产业赋能-社会智能”三级联动模式,推动人工智能从单一智能向社会智能转变。
全球首个通用智能人“通通”2.0升级迭代
“通通”2.0在大会上重磅发布。相较于通通1.0版本,“通通”2.0在语言、认知、动作、学习、情绪、交互方面实现了多种核心能力的升级:
1、价值与心智驱动的多轮对话
当前,国内外诸多大语言模型通过指令微调和强化学习下的人机价值对齐等技术手段,虽然能够较好地完成人机多轮对话任务,但此类对话更多的是围绕用户的需求及观点进行,本质上缺乏自身相对连贯的价值观、世界观以及据此演绎出来的对话内容。
“通通”2.0版本实现了一个有自身价值观、世界观的小女孩,在理解对话目标意图的基础上,遵循自身价值和人格,利用对话策略来引导对话的走向,从而达到自身的目的。在价值调控对话生成、消除模型幻觉、保持对话前后连贯性以及“言行一致”等方面取得突破。
例如,当妈妈要求“通通”睡觉,或者吃她不喜欢的食物时,“通通”可以向妈妈耍赖,找理由磨蹭,并试图要求妈妈给予奖励,在多轮协商达成一致后才会实施对应任务。
2、基于交互反馈的推理和学习
通通生活在高度仿真的复杂、动态三维虚拟场景中,1.0版本的“通通”在任务执行过程中,如果周围环境时刻在发生变化,会导致她原本规划的任务无法顺利完成。但“通通”2.0可以实时响应外界场景的变化,进行反思和重新规划,对已有任务进行挂起、恢复、修改或取消等处理,同时动态生成新的任务规划,从而以更灵活、智能、多变的方式完成指令。
不仅如此,不同于当前大语言模型普遍采用的离线数据驱动的学习模式,通通在和场景交互(自主学)及与人类的多模态对话(他人教)过程中,能动态更新自身的知识库,价值函数和技能,使得它初步具备类人的持续反思和成长的能力。
例如,当通通想打开空调时,研究人员利用VR手多次改变遥控器位置,让她无法轻易拿到,通通进行了一系列尝试:先是脱鞋上沙发,然后再利用沙发上的靠垫,增加自身高度后最终拿到放在墙架上的遥控器;在按下遥控器,空调仍未打开时,我们可以教导她“电器需要插上插头才能使用”,通通在遵循教导,成功打开空调的同时能够更新自己的技能库,使得该项技能、知识被长期存储。
3、多智能体交互
研究人员为“通通”打造了幼儿园、六口之家等多智能体场景,并在场景中设置了各自独立,具备自身价值、能力、人设、状态的多个智能体,使通通拥有了自己的家人和朋友。
在这种多智能体场景中,通通不仅需要理解周围环境,还需要理解环境中其他智能体,识别他们的身份、性格和自身的关系、彼此之间的关系和物品的关系、当前动作、意图、气氛等,并在此基础之上进行自身的任务规划,包括发起和响应对话,实施帮助、捣乱等复杂行为交互。
例如:通通在做任务遇到困难时,能主动开口寻求帮助,并解释自己的困难;在和弟弟一起打扫房间时,她会实时观察弟弟,并根据弟弟的行为来调整自己的任务规划,从而完成合作。
随着“通通”的持续迭代,她的能力也在稳步提升,目前研究人员正利用认知心理学定义的5-6岁儿童应掌握的经典任务对她进行测试,通通已经通过了多项综合性强、复杂度高的任务考核。未来它将成为通用底座支撑各类垂直应用场景,进一步学习行业特定的知识和技能,形成千万个“通用智能人”赋能千行百业,同时与具身智能机器人相结合,为智能制造、智慧城市、养老陪护、数字助理、家用机器人等领域带来革命性的变化,更好地服务居民日常生活。
通智大脑联盟成立:“大脑”与“身体”协同研发,赋能生活与产业服务升级
2025年全国两会《政府工作报告》首次将“具身智能”纳入国家未来产业战略。报告明确提出,要加快具身智能技术的研发与应用,推动其在智能制造、智慧医疗、无人驾驶、智能家居等领域的深度融合。在北京市发布的《北京具身智能科技创新与产业培育行动计划(2025-2027年)》中指出,加速具身智能技术与产业的深度融合,推动形成具有国际竞争力的产业生态,为经济社会高质量发展提供有力支撑。如何赋予具身智能体完备的认知架构与价值体系,即为机器立“心”?为此,通研院积极链接具身机器人行业伙伴,将“通通”的技术优势,即人形机器人的“大脑”赋能到机器人本体上。
会上,通研院联合乐聚、宇树等多家人形机器人公司共同发起成立“通智大脑联盟”。该联盟通过打破技术壁垒,聚焦垂域场景的通智大脑和具身本体协同研发及应用,将实现在物理空间上具身智能体从感知到决策、从学习到执行的闭环,加速核心技术突破与成果转化。
联盟拟建设机器人数据采集工厂,并将企业研发中积累的建设经验、机器人集群运维经验及管理平台等相关技术,整合为技术服务,提供给制造业、服务业等多个行业。
此外,联盟致力于构建首个能从多模态人——机器人交互数据中在线学习丰富具身技能的智能体,技能涵盖具身推理、常识学习、偏好学习、导航操作学习等。相关技术作为“具身大脑”,可与通用机器人产业对接,为机器人提供更智能、更灵活的决策支持。
责任编辑:张洽棠