以技术创新为桨,思必驰为智能语音产业应用护航
当前,我国经济发展方式已转向高质量发展的新阶段,依靠资源和要素投入的驱动力持续减弱,创新逐渐成为第一动力,源源不断地发展出新技术、新业态、新模式,持续提高劳动生产率,加快构建了以国内大循环为主体、国内国际双循环相互促进的新发展格局。
在过往的一年中,思必驰研发技术不断创新,推出发音人音色定制平台、DUI标注训练一体化平台、智云译芯平台、千语千训系统,并上线24K高保真音色,情感合成等技术,助力百业实现效率提升。同时,思必驰技术在多项比赛中获得大奖,充分印证了自己的技术创新实力。
01蝉联中文医疗权威榜单CBLUE
在医疗行业,人工智能、大数据技术等应用场景逐渐丰富,在帮助人类恢复健康中发挥了重要作用。人工智能技术也逐渐成为影响医疗行业发展和提升医疗服务水平的重要因素。过去的一年中,思必驰语言与知识团队在医疗领域再次取得关键突破,在CBLUE2.0月度榜单中蝉联冠军,分别夺得2月、3月榜单冠军。
基于千万量级的医疗领域语料,思必驰自主构建了医疗领域预训练语言模型和医疗知识图谱,针对下游任务微调并进行模型融合,在医疗行业应用中体现了重要价值。榜单任务形式多样,涉及知识抽取、意图分类、语义匹配,对话生成等多个基础NLP技术。
在此之前,思必驰已成功将医疗领域NLP技术在多个项目中落地,并在CBLUE1.0榜单中取得佳绩,此次登顶有效验证了思必驰语言与知识团队在医疗NLP技术的专业性与全面性。
02刷新Text-to-SQL语义解析任务多个榜单纪录
在日常生活和生产中,常会产生的海量的数据,这些数据被大量存储在结构化数据库中。此前,人们通过直接编写SQL语句和数据库进行交互,但此类方法效率较低。后来,人们开始使用基于自然语言发展起来的数据库查询接口(NLIDB)与数据库进行交互,该方法高效简洁,而NLIDB背后的核心技术就是Text-to-SQL语义解析。
思必驰-上海交大人机交互联合实验室团队在取得Text-to-SQL任务英文基准榜单Spider第一名后,过去的一年中,又取得Text-to-SQL任务中文千言榜单第一名。
千言榜单囊括了Text-to-SQL任务三个最经典的中文数据集DuSQL、NL2SQL、CSpider。本次刷榜的模型LGESQL+GTL是研究团队在之前提出的线图增强的Text-to-SQL模型LGESQL的基础上,进一步提出了结构化的动态解码方案GTL,使得模型既能很好地编码结构化的异构输入,同时也能够实现高效准确的结构化解码。
03荣获IWSLT 2022英中同声传译冠军
IWSLT是国际上最具影响力的口语机器翻译评测比赛之一,设置了同声传译、离线语音翻译等7个任务。思必驰-上海交大联合团队(AISP-SJTU)参加英-中同声传译任务,以优异的成绩获得Speech-to-Text赛道第一名。
思必驰-上海交大团队在充分总结前人经验的基础上,积极开拓创新,采用了引入预训练语言模型,大幅提升ASR性能、无限左看,随机右看等关键技术。
本次比赛,结合各种技术手段打造了英-中同声传译最优基线,也对端到端模型做了初步探索。端到端模型在速度和误差传导上比级联模型更占优势,未来思必驰-上海交大联合团队希望进一步研究有效的数据扩增手段,来提升端到端模型的翻译效果。
04登顶中文知识图谱问答权威榜单KgCLUE
在过去的一年中,思必驰语言与知识团队研发的AI-KBQA算法一举拿下了大规模权威中文知识图谱问答KgCLUE测评榜单第一名,这充分印证了团队对中文自然语言及知识图谱精确的语义解析、知识检索和知识推理能力。
在参与比赛的过程中,思必驰语言与知识团队针对KBQA任务的特点,从以下三个方面设计并优化命名实体识别、实体链接、属性匹配模块:
高细粒度知识图谱:团队预研了千万量级的高细粒度的中文知识图谱。在命名实体识别模块,高细粒度的知识图谱可以有效帮助模型识别同名实体,提升实体识别的准确性,同时可以有效减少因同名实体带来的实体链接错误。
多阶段实体链接:将实体的检索分为多个阶段,检索对象扩大至与实体相关的文本片段以提高模型的实体检索能力。
属性匹配增强:鉴于实体中往往具有不同值的相似属性,模型在对实体的属性进行预测时,不仅对单个属性进行预测,同时也会对全部的属性列表进行筛选,从而在相似属性上更具有区分度。
团队在参与比赛过程中,不断改进和优化模型,使用模型集成的方式来增强模型的泛化能力。AI-KBQA算法的得分由最初的94.81提升至98.78,在大规模中文知识图谱问答榜KgCLUE1.0 中排名第一,并且在多项子任务得分上同样取得了第一名的佳绩。
思必驰已经形成产学研一体化的成熟发展模式,始终坚持基础源头技术创新,不断巩固技术研发创新实力,未来思必驰将继续深耕技术研发,助力各行各业实现智慧化发展。
声明:本站作为信息内容发布平台,页面展示内容的目的在于传播更多信息,不代表本站立场;本站不提供金融投资服务,所提供的内容不构成投资建议。如您浏览本站或通过本站进入第三方网站进行金融投资行为,由此产生的财务损失,本站不承担任何经济和法律责任。 市场有风险,投资需谨慎。同时,如果您在中国发展网上发现归属您的文字、图片等创作作品被我们使用,表示我们在使用时未能联系到您获取授权,请与我们联系。
【本文资讯为广告信息,不代表本网立场】