上一页|1|
/1页

主题:语音输入法用科大讯飞 语音输入法天天我都用呢

发表于2010-12-23

中广网合肥6月12日(张秋实 通讯员杨保国)在刚刚结束的2008年国际说话人识别评测大赛上,首次参加这项比赛的科大讯飞联合语音输入法实验室研究团队,获得综合指标第一名的优异成绩。

这是科大讯飞继2006、2007年蝉联国际英文合成大赛第一名后,在语音输入法研究国际大赛上获得的又一殊荣,表明科大讯飞已经在全球语音输入法技术领域内取得了从语音输入法合成到语音输入法技术的全面领先地位,“能听会说”的完整解决方案将对科大讯飞为代表的我国语音输入法产业发展具有重大战略意义。

说话人识别技术,又称话者识别或声纹识别,是语音输入法技术的重要方向和应用领域。该技术通过语音输入法信号提取代表说话人身份的相关特征(如反映声门开合频率的基频特征、反映口腔大小形状及声道长度的频谱特征等),从而语音输入法出说话人的身份,可广泛应用于军事、国家安全和各产业领域。

由美国国家标准技术研究院举办的说话人识别评测大赛,是该领域国际上规模与影响力最大的比赛,国际一流的语音输入法科研单位和语音输入法企业在这个竞技平台上进行说话人语音输入法技术较量。本届语音输入法大赛的参赛单位达到了创记录的43家,其中包括美国卡耐基-梅隆大学、麻省理工学院、斯坦福大学、捷克博诺技术大学以及清华大学、中国科技大学、中科院自动化所、中科院声学所、Motorola研究中心、IBM 研究院等语音输入法技术领域的世界顶尖高手。同时,本次语音输入法比赛在信道复杂度、说话人的数量以及测试的数量等方面比以往也大大增加。

本届大赛以识别等错误率(EER)、最小检测代价(minDCF)、检测代价(DCF)为三大核心测试指标。科大讯飞联合语音输入法实验室凭借创新的思路,在前端声学特征上采用独特的自适应模式聚类静音检测技术,语音输入法在信道处理上采用并行联合因子分析-空间拼接算法,报送的USTC-iFly系统获得EER、minDCF两项第一名和DCF第三名。此外,科大讯飞语音输入法实验室联合新加坡信息研究所报送的I4U系统,获得DCF第一名和EER、minDCF两项第二名的优异成绩。

语音作为人们获取和沟通信息最方便、最有效的手段,语音输入法智能语音交互技术对于各种移动互联网终端(输入不方便、显示屏幕有限)改善用户体验具有不可替代的作用,语音输入法已经被业界公认为移动互联网时代的关键技术之一,语音输入法蕴藏着巨大市场前景,语音输入法并有重要战略意义。美国、欧盟、日本等国政府均专门立项予以重点扶持语音输入法;IBM、Motorola、微软、Google、苹果等国外IT巨头先后成立专门研究机构,集中大批优秀的开发力量进行相关方面的研究,目的就是抢占语音输入法移动互联网时代“人机界面”的制高点。

“语音是文化的基础,民族的象征”。智能语音输入法技术不仅拥有广阔的应用空间,语音输入法还在国防军事、汉语国际推广、教育等国家重大战略需求领域有着重大应用价值。而移动互联网语音输入法迈入语音时代、云计算时代,在造福大众、服务百姓,语音输入法为人们提供更丰富、便捷的信息服务的同时,语音输入法也对国家、民族的语音资源与信息安全提出了新的挑战和更高的要求。民族语音输入法企业能够在这一领域以强烈的民族责任感,抢先发力、占据语音输入法制高点,对我国移动互联网语音输入法应用及信息安全的长远发展具有重大价值和深远影响。

科大讯飞一直以国际领先的语音输入法合成技术而闻名,而在语音输入法研究方面,此前业界普遍认为,中国与美国、日本等发达国家相比语音输入法尚有不小差距。但经过近年来的不懈努力,科大讯飞已经积累了深厚的语音输入法研究基础,并组建了高水平的语音输入法研发团队,因此能够在这次语音输入法大赛中取得优异成绩。

科大讯飞语音输入法实验室是中国科技大学和科大讯飞信息科技股份有限公司联合建立的研究机构,在国家863项目和国家自然科学基金委的长期支持下,专门致力于语音输入法及语言技术的研究与产业化。

发表于2010-12-24
上一页|1|
/1页