腾讯科技讯 9月20日上午9时,由联合国教科文组织指导,工业和信息化部、中国残疾人联合会、中国互联网协会、中国残疾人福利基金会共同主办,中国盲文出版社、中国视障文化资讯服务中心、工信部机关服务局信息无障碍推进中心承办的第八届中国信息无障碍论坛在北京·中国盲文图书馆隆重举行。本届论坛的主题为“推进共享· 引领创新”。来自美国、英国、加拿大、日本、越南、马来西亚等国内的嘉宾200余人参加了为期两天的论坛,共同探讨了信息无障碍在全球范围的最新发展趋势、技术应用及产品。
第八届中国信息无障碍论坛召开期间,还特开设中国信息无障碍体验区,来自各个国家和地区的知名企业、科研机构、残疾人组织将展示其为残障人士设计的技术、产品、解决方案参加展览,与国内外专家、学者、业界人士交汇一堂,在中国信息无障碍体验区这个国际化大平台上,关注信息无障碍技术发展的专家和厂商,将会在技术、产品、资本、市场、创新与服务等多个方面寻求到合作和共赢的机遇。腾讯科技对本次会议进行全程直播。
图为科大讯飞副总马冰演讲
以下为科大讯飞副总马冰演讲实录:
马冰:谢谢主持人。各位嘉宾,各位朋友,大家下午好,首先祝大家中秋、国庆快乐,另外也祝第八届中国信息无障碍论坛圆满举办。
我对信息无障碍是这么理解的,其实信息应该对我们大家来说,它的获取应该是公平的,应该不需要什么特殊的服务,举个例子,比如我要给我的叔叔买手机,看到很流行的一款,说要买这款,但我叔叔是盲人,服务员说没关系,你可以安装全程的语音交互软件,就可以给我们的盲人使用了。全球语音交互软件,就是我今天讲的主题,它是一个语音点亮生活的重要工具,也能助力我们的信息沟通无障碍。
我将从两方面描述我今天的演讲:首先看一看现在各种智能终端上的语音应用情况。前面有很多朋友,包括IBM的朋友,微软的朋友都讲了他们在这方面的工作和进展,现在最突出的应用是苹果上的应用,Window8上也会有相关的应用,通过语音获取更加方便。同样英特尔的超极本语音将作为它一个重要的应用。我们也看到苹果的TV,还有三星的TV,都把语音的交互作为用户体验提升的一个最重要的手段。我们看看国内的情况,围绕科大讯飞提供的语音的完整的交互解决方案,我们看到国内很多类型的产品都带上了语音助理的功能,界面上能看到的,面向手机、面向PC、PAD方面有很多语音类型的产品推出,包括联想的、华为的、步步高、最近发布的小米手机等等,另外我们也看到,现在我们给家电行业提供完整的语音解决方案,格兰士的微波炉等等都将推出语音加固版本,这些产品都能很好地解决信息获取的公平这样一个理念。同样还有其他的例子,我就不一一解释了,包括会说话的玩具,汽车导航,以及智能电视等等。
语音技术的应用、普及和人机交互理念不断突破,随着苹果介入手机领域,把人机交互的理念从传统的追求稳定的键盘模式变成了追求更加简单、更人性化的全触屏模式,因为从键盘的复杂性到触屏的简单性是人类获取信息的进步。另外,现在我们大多数人看到,语音是人类最自然便捷的沟通方式,所有信息设备能听会说是必然的趋势,乔布斯在走之前提供了最大一个题目,解决从触屏之后如何人机交互的问题,这个应用不光是语音合成和语音识别技术单纯的问题,还包含了这样一个理解的技术,能够让我们的语音交互变得更聪明、更具人性化。我们看到腾讯的那位先生给出了小Q机器人,里面其实很多很人性化的应用,都是和我们后台的核心技术提供是有关系的。举个例子,这个房间里面我觉得很热,我跟他对话说小海空调我很热,这是很人性化的对话,但是系统里把声音变成文字,并且把文字的意思表达给处理器,处理器就空调智能了。
所以未来各大人群中的应用,信息获取是完全公平的,能够很好地解决信息无障碍的问题。我写了一句话,是麦克汤普森说的,他认为几乎全球每一家语音设备都将具备语音的功能。大家的共识已经形成了,语音作为沟通的方式是必然趋势,但我们也看到这个趋势是有条件的,这个条件就是现在的智能终端已经非常智能了,无线网络已经非常普及,后台服务的内容已经非常丰富了,这样的环境从今天来看,基本已经具备了,但是我们香港的那位先生在描述香港的城市时,香港在每一个角落都已经具备了这样的条件。这样的条件达到以后,语音交互要达到用户可用的门槛是有一定条件的,我再给大家普及一下语音技术的基本知识,其实是三大核心:一是语音合成技术。二是语音识别技术,合成就是把机器装了一个人工的嘴巴,所有的读屏软件核心技术都是用语音合成技术。很荣幸我们为很多合作伙伴提供了这个核心产品。另外一个是语音识别技术,相当于给机器装上人工的耳朵,听进去的这句话,语音识别技术相当于把听进去的这句话理解出来,相当于人工的大脑。这三个技术从我们的经验来看,应该达到基本需求的我们列了一些指标,语音识别率达到90%,语音合成水平接近普通人说话的水平,自然语言理解技术在常规理解能力能达到85%以上不会出错。
从三方面来展示科大讯飞在语音从这三个方面展示科大讯飞在这三块核心技术的成熟度,科大讯飞不光在语音中文合成方面全球第一位,英文合成方面我们也连续七次参加了英文的暴风雪比赛,都获得了第一名,其实我们的很多合作伙伴也参加了这个比赛,大家都很清楚,我就不细讲了。另外是语音识别方面,我们横向对比了我们和合作伙伴的一些数据,这个是工信部测试的结果,最近我们和英特尔也在合作,三星测试的结果和这个也差不多。科大讯飞在语音识别核心技术方面,在中文相关的领域是领先得非常明显的,如果大家用过科大讯飞语音助理,用过我们的语音输入法,能体现出我们的进步。同样在语音识别特殊利用场景,包括中文识别,语种识别方面,我们参加了NIST历次比赛,每两年举办一次,我们连续两年获得了关于语种识别方面的测试第一名,当然这和国家安全、信息安全是相关的应用。
另外一个核心技术是自然语言的理解技术,这个展开可能是很大的篇幅,我就不细讲了。我举个例子,我们都知道南京市长江大桥,可以理解为南京市长“江大桥”,把语音办理文字以后,通过上下文的意思捕捉到到底想表达是一个桥还是一个市长,这就是理解技术。这样一个理解技术,应用是分领域的,特别是在我们的语音助理上,都有各种的领域,比如打电话,我可以说打电话给马丁,也可以说打马丁的电话,或者是我想给马丁打电话,复杂的说法可能有100多种,但这100多种说法都是指定,最终指定都是给马丁打电话的动作,所以我们称之为这一类型的理解的准确度,在中文程度上能达到85%,而不是让用户必须只能打电话给马丁,这样的应用我们认为是两年前的关键词的语音识别的应用,这个应用我们现在已经不用了,或者我们认为这种应用根本达不到使用。
同样的,围绕大家讲的科大讯飞核心技术的进展,为什么那么快,是因为科大讯飞的语音云在后台起了很大的作用。科大讯飞在2010年10月28日发布我们第一届语音云,今年3月22日在北京发布了新一代语音云,这一次语音云的发布起到了很好的促进作用。发布完之后,我们科大讯飞的整个语音应用数量从前年的一年时间只能达到一千万的用户数,到后来只需要不到六个月时间就接近一亿用户数,翻了10倍,只用了不到原来一半的时间,这表明目前智能化移动互联网的普及应用的丰富这三个条件的不断达成。我们可以看到一组数据,我们可以预测,再过两三年,我们的互联网和移动互联网合成用户数将接近12个亿,这是中国的数量。这12亿对于语音的需求来说是非常迫切的,所以我们认为语音的应用,无论是在各个领域都是具有非常好的价值的。同样我们把这个应用公布在网上,提供了非常标准的应用的接口供合作伙伴开发,欢迎大家到我们网上下载我们的语音应用接口对盲人应用软件的开发。
目前我们的合作伙伴已经超过了6千家,用我们的产品开发出来的各种应用。我介绍一下科大讯飞的情况,我们是1999年成立的,2008年上市,我们是国内唯一一家以语音为题材的上市公司,我们员工已经超过1600人,其中专业的语音团队超过1000人,目前来看市场占有率全球是最大的。我们也同时是国家各项语音技术的承接单位,给大家展示一些我们科大讯飞的情况,包括我们获得国家领导人的亲切关注,吴邦国委员长在今年两会期间专门批示要加快语音技术的产业化。科大讯飞相关的语音产品,也获得了习近平主席、周永康等领导的高度评价,这是我们的产品在西藏教学中的应用情况。同样我们获得国家各部委的高度支持,特别是工信部,我们2011年1月份国家智能语音高新技术产业化基地,同年9月,语音及语音信息处理国家工程实验室落户安徽合肥,是中国科大和讯飞共同承办的。8月1日,中国语音产业联盟正式成立,工信部的杨学山副部长亲自给我们题词。
同样我们也是国家的规划布局的重点软件企业,两次获得国家科技进步奖。科大讯飞联合国内做语音相关的科研单位、院校成立了产学研的体系,知识产权方面也走在了前面。我们近十年的发展目标,这可能比各位的大企业还差很远,但我们的理想是希望能够打造一个全球的语音产业基地,吸引100家以上企业进来,未来发展到10个亿以上的用户,市值超过一千亿,这是我们的规划情况,我们的楼逐步在盖了,已经启动了。
我们的使命和信息无障碍是紧密相关的,我们为了人类之间、人机之间信息沟通无障碍,这是我们一贯的目标。我相信我们的事业将影响中国的未来。
另外简单介绍一下科大讯飞面向信息无障碍的产品,包括讯飞的输入法,能够通过语音实现快速输入,解决信息的顺畅问题。另外是讯飞“语点”,能够实现全程的语音交互功能,解决手机智能终端信息获取、信息沟通的无障碍工具。我们相信科大讯飞的语点必将点亮信息沟通之门。我们的一些产品在网上都有下载,这里就不一一介绍,例如科大讯飞的手机语点,可以直接到安卓上下载讯飞语点这个产品。长虹、创维的电视都已经发布了他们的语音电视产品,还有汽车语点,奇瑞、江淮、上汽都有他们相应的汽车里面都安装了讯飞的语点的交互方案,能够使驾驶更安全,能够使车内信息获取更便捷。同样我们和各界的朋友提供了核心技术开发产品,我就不一一讲了。包括专用的盲人读屏软件,都是我们的合作伙伴。盲人的信息阅读器,以及盲人的手机,我们一直在坚持我们的方向,让信息的获取更加公平。
我们可以预见,未来任何一台手机,任何一台电脑,每一台电视,每一辆汽车,都必将能听会说,让信息获取、人机交互都能够人人平等。谢谢大家。