Soul出圈!实时人像视频生成研究成果被CVPR2025录用
近日,AI领域再度传来重磅消息。新型社交平台Soul App的技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》,成功被人工智能领域顶会CVPR 2025录用。这不仅是Soul在技术研发上的一次重大突破,更意味着其在AI社交领域的探索,正逐步引领行业走向新的阶段。
CVPR作为计算机视觉与模式识别领域的标杆会议,一直以高水准的录用标准著称。根据会议官方统计,本次CVPR 2025会议总投稿13008篇,录用2878篇,录用率仅为22.1%,竞争可谓异常激烈。Soul App此次入选,彰显其技术实力得到了学术界与行业的高度认可。
事实上,这并非Soul在AI领域的首次亮相。2024 年,Soul多模态情感识别研究论文入选ACM国际多媒体会议研讨会,且在国际人工智能联合会议组织的挑战赛中,Soul技术团队在半监督学习赛道拔得头筹。从2016年上线基于AI算法的灵犀引擎,到2023年推出自研语言大模型Soul X,再到如今多模态端到端大模型的升级,Soul始终坚定不移地深耕AI社交领域。
此次被录用的论文,提出了全新的实时音频驱动人像动画自回归框架。该框架创新性地将talking head任务拆分为面部Motion生成和高效身体Movement生成模块,不仅大幅提升了视频生成效率,更显著优化了生成效果的自然度和拟人性。这一成果,是Soul在语音、视觉、NLP融合方面的一次积极探索,为打造更真实的AI社交交互体验奠定了基础。
此前,Soul基于多模态大模型上线的语音交互功能,收获了用户的广泛好评。如今,从语音到视觉的交互模态升级,无疑将为用户带来更为沉浸式的社交体验。未来,Soul计划将这一技术成果应用于实时视频通话、AI虚拟人情感化陪伴等多元场景,进一步提升人机交互的情感温度。
Soul在AI社交领域的持续创新,不仅为用户带来了更优质的体验,也为整个行业的发展指明了方向。在未来,Soul将凭借其在AI技术上的深厚积累,继续打造充满趣味与温暖的社交空间,推动AI社交迈向新的高度。(固原新闻网)
声明:本站作为信息内容发布平台,页面展示内容的目的在于传播更多信息,不代表本站立场;本站不提供金融投资服务,所提供的内容不构成投资建议。如您浏览本站或通过本站进入第三方网站进行金融投资行为,由此产生的财务损失,本站不承担任何经济和法律责任。 市场有风险,投资需谨慎。同时,如果您在中国发展网上发现归属您的文字、图片等创作作品被我们使用,表示我们在使用时未能联系到您获取授权,请与我们联系。
【本文资讯为广告信息,不代表本网立场】