实在智能行业首发塔斯“Agent”智能体,续ChatGPT后成为最热AI焦点
近日,中国信通院正式发布并解读“2023人工智能十大关键词”,AI Agent、生成式AI等纷纷上榜。
随着ChatGPT的百花齐放,大模型之战的下半场拉开序幕,AI Agent成为了舞台上科技巨头们争抢的焦点。8月16日,人工智能准独角兽公司“实在智能”正式推出了行业首款的AI Agent落地产品“塔斯”智能体产品。
什么是Agent?在大模型语境下,可以理解成能自主理解、规划、执行复杂任务的系统。
AI Agent(AI智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的AI,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。
AI Agent 的工作仅需给定一个目标,就能够针对目标独立思考并做出行动,它会根据给定任务详细拆解出每一步的计划步骤,依靠来自外界的反馈和自主思考,为自己创建 prompt以实现目标。
在类别上,AI智能体分目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。自主智能体如Auto-GPT,能够根据人们通过自然语言提出的需求,自动执行任务并实现预期结果。在这种合作模式下,自主智能体主要是为人类服务,更像是一个高效的工具。
让大模型“看得见动起来”:行业首发TARS-RPA-Agent
实在智能进入超自动化赛道以来,不断将AI技术与RPA产品进行深度融合,持续推动创新应用。曾在业内首创“融合拾取”技术,支持顶层拾取与CV拾取无缝融合,使得传统RPA“拖拉拽”专家模式稳定丝滑;进而首创“智能屏幕语义理解”技术(ISSUT),支持对电脑、手机、平板等屏幕的理解,通过实在IPA开创“点选用”的小白模式。
大模型时代开启后,实在智能一直在思考如何将大模型与RPA产品相结合,通过文本指令或对话聊天的方式直接生成数字员工,操作PC电脑自主完成工作任务。从而在实在IPA“小白模式”基础上,将RPA使用门槛再进一步降低,直接进入到“所说即所得,你说,PC做”的“傻瓜模式”。
经过不断探索和尝试,实在智能在业界首发基于大模型的Agent产品,即TARS-RPA-Agent——这是一个基于“TARS+ISSUT”双模引擎,有“大脑”,更有“眼睛和手脚”的超自动化智能体。同时,也是能够自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验的RPA全新模式。
下面详细介绍TARS-RPA-Agent在设计过程中的解决的关键问题和创新特性:
①自主拆解任务:复杂问题,分而治之
在实际场景中,人类的复杂指令往往蕴含在非常简洁的语句当中,并不是通过大模型生成一段Python代码,或简单调用3-5个RPA组件就能实现。
TARS-RPA-Agent支持将表述简单但含义复杂的指令,进行Chain-Of-Thought式的自主拆解和细化,之后将拆解出的子任务和具体步骤与实在RPA的流程块和组件进行映射,最终完成一体化、高可控的复杂流程生成。例如,“我要买一台笔记本电脑,帮我推荐下”,TARS-RPA-Agent可将其拆解成“登录购物网站,查询笔记本电脑品牌、配置、价格等信息,完成产品推荐”等多个步骤并加以自动实现。
②感知当前环境:人类视角,理解屏幕
“如何在理解指令含义的基础上,精准找到所要操作的屏幕画面上哪里是输入框、登录按钮或者聊天窗口?如果不仅仅是基于浏览器的软件而是成千上万种不同CS架构的客户端软件怎么办……”
“你是我的眼”,基于计算机视觉大模型的“智能屏幕语义理解”技术(ISSUT)为TARS-RPA-Agent装上了感知世界的眼睛,带来真正基于人类视觉的电脑屏幕和操作对象理解。
ISSUT使得TARS-RPA-Agent可以“秒懂”屏幕画面,第一时间完成自动解析,无需人工介入参与。在无法解析网页源代码或者客户端软件不开放API接口的大量真实场景中,ISSUT的价值倍加凸显。
例如,理解指令并自动操作并不开放API接口的企业微信。
③执行并且反馈:环环相扣,单步寻优
PDCA(计划、执行、检查、处理)是人类优秀的工作习惯,在执行过程中不断反馈和修正是客观世界的一般规律。真实场景的意图理解和任务执行非常复杂,TARS-RPA-Agent同样需要保证每一步操作的正确性,避免因为理解偏差,或者操作失误,导致最终无法完成任务。
因此,TARS-RPA-Agent巧妙地设计了“基于强化学习的单步寻优策略和每步执行的反馈”相关机制,不断提高决策和执行过程的正确性、可控性。例如,基于之前动作的启发式寻优。
随着AI Agent的落地应用,未来假如人人都配备一个AI Agent,繁琐的办公任务不再是束缚,而是一个简单的口令就能够自动完成,人机协同也将升级为一个人类与AI Agent的自动化合作关系。实在智能期待与更多企业加入到国产大模型的应用和创新中,共同推动人工智能技术的飞速发展。
声明:本站作为信息内容发布平台,页面展示内容的目的在于传播更多信息,不代表本站立场;本站不提供金融投资服务,所提供的内容不构成投资建议。如您浏览本站或通过本站进入第三方网站进行金融投资行为,由此产生的财务损失,本站不承担任何经济和法律责任。 市场有风险,投资需谨慎。同时,如果您在中国发展网上发现归属您的文字、图片等创作作品被我们使用,表示我们在使用时未能联系到您获取授权,请与我们联系。
【本文资讯为广告信息,不代表本网立场】