ai换脸 奇富科技亮相INTERSPEECH 2024大会 方言识别时刻大家起初
近日,奇富科技受邀出席了在希腊举办的海外语音通讯与信号惩处顶级会议——INTERSPEECH 2024,并发表了题为Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition的主旨演讲ai换脸,全面展示了其在语音识别时刻界限着实立,为中国语音时刻走向天下、参与大家竞争诞生了新的标杆。
INTERSPEECH行动大家语音科学界最负著明的年度会议之一,荟萃了来自天下各地的顶尖学者、盘考东谈主员及行业首长,共同计划语音时刻的最新进展、挑战与改日趋势。这一平台不仅代表了语音时刻界限的最高学术水平,亦然新时刻、新理念调换与碰撞的绝佳风景,其巨擘性和影响力在业界至高无上。
图1:奇富科技在INTERSPEECH 2024会议作念主旨演讲
在演讲中,奇富科技先容了可同期赈济20多种方言的新一代奇富语音识别系统“QiFree”,这是国内金融行业内字错率最低的中语语音识别系统。在中语口音与方言语音识别界限的巨擘测试集KeSpeech的对比中,奇富科技凭借其在自动语音识别(Automatic Speech Recognition, ASR)界限的深厚积存,兑现了方言口音分类准确率的显赫提高,达到了79.10%,远超KeSpeech的基线水平61.13%,这一数据直不雅反馈了奇富科技在语音识别准确性上的不凡推崇。同期,在估量识别失实率的要道方针——CER(Character Error Rate, 字符失实率)上,奇富科技更所以8.08%的收获,远优于KeSpeech的10.38%,展现了其在中语方言识别界限的高效与精确。
表1:奇富科技“QiFree”性能效果与KeSpeech Baseline对比
奇富科技自研的中语语音识别系统“QiFree”,冲破了单一模子只可识别特定单一方言的窘境,通过翻新的层自符合交融结构,借助分享信息编码模块更高效的提真金不怕火方言信息,兑现了即说即译,进一步增强了语音机器东谈主的及时交互才气。值得一提的是,“QiFree”不仅在粗俗语识别界限的CER上保握起初地位,更在冀-鲁、江淮、胶-辽、兰-银等多个方言区域的识别性能上,比拟过往最好收获兑现了特出15%的显赫提高。这一突破性效果获取了INTERSPEECH三位孤立审稿东谈主的高度认同,他们一致认同奇富科技论文《Qifusion-Net:基于特征交融的流式/非流式端到端多口音语音识别框架》所展现的系统框架翻新性与识别性能的不凡推崇,并一致授予其“ACCEPT”的评定。
值得一提的是,在与国内一流公司(如某科技巨头及国内影响力最大的语音识别开源社区)的对比中,奇富科技雷同展现出了压倒性的上风。即等于在靠近参数限制更大、考研数据量更丰富的敌手时,奇富科技仍是能以更低的CER(8.08% vs 15.61% vs 26.55%)脱颖而出,讲授了当时刻架构的优胜性和算法优化的高效性。此外,与大家起初的语音识别系统(如Openai-whisper v2)比拟,尽管后者在通用谈话识别上具有显赫上风,但在中语方言识别这一细分界限,奇富科技仍是保握了显赫上风,这进一步印证了其在方言识别时刻上的大家起初地位。
表2: 奇富科技“QiFree”要道方针与国表里一流科技公司对比
奇富科技在INTERSPEECH 2024上的再一次精彩亮相,不仅是对其多年来在语音识别时刻界限深耕细作效果的一次全面展示,更是向天下宣告了中国企业在这一界限的雄壮竞争力和无穷后劲。奇富科技正以其不凡的时刻实力和翻新精神ai换脸,引颈着方言识别时刻的新一轮发展潮水,为大家语音通讯与信号惩处时刻的跳跃孝顺着中国理智与中国力量。