您好,欢迎来到中国视听网  服务热线:400-6789-360  请登录 | 免费注册 | 在线投稿|本站服务|RSS|网站地图|设为首页|加入收藏

86-755-27383670
首页|公司简介|产品展示|新闻资讯|商机信息|客户服务|人才招聘|诚信证书|客户留言|联系方式
您现在的位置深圳市亿晟科技有限公司首页 >> 新闻资讯 >> 【语音识别技术】的前世今生
产品分类

加微信号
打开微信扫一扫
加为微信好友
深圳市亿晟科技有限公司新闻资讯
【语音识别技术】的前世今生
文章来源:深圳市亿晟科技有限公司  发布日期:2019-1-15 16:43:20

微信图片_20190115164146.jpg

与机器进行语音交流,让它听明白你在说什么。语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比“机器的听觉系统”,该技术让机器通过识别和理解,把语音信号转变为相应的文本或命令。

语音识别技术缓慢发展的昨天
在1952年的贝尔研究所,Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年英国的Denes等人研制了第一个计算机语音识别系统。

大规模的语音识别研究始于上世纪70年代以后,并在小词汇量、孤立词的识别方面取得了实质性的进展。上世纪80年代以后,语音识别研究的重点逐渐转向大词汇量、非特定人连续语音识别。

同时,语音识别在研究思路上也发生了重大变化,由传统的基于标准模板匹配的技术思路开始转向基于统计模型的技术思路。此外,业内有专家再次提出了将神经网络技术引入语音识别问题的技术思路。

上世纪90年代以后,在语音识别的系统框架方面并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展。比如,DARPA是在上世界70年代由美国国防部远景研究计划局资助的一项计划,旨在支持语言理解系统的研究开发工作。进入上世纪90年代, DARPA计划仍在持续进行中,其研究重点已转向识别装置中的自然语言处理部分,识别任务设定为“航空旅行信息检索”。

我国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。由于当时条件的限制,中国的语音识别研究工作一直处于缓慢发展的阶段。直至1973年,中国科学院声学所开始了计算机语音识别。

进入上世纪80年代以来,随着计算机应用技术在我国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语音识别技术在经过了多年的沉寂之后重又成为研究的热点。在这种形式下,国内许多单位纷纷投入到这项研究工作中去。

1986年,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。在“863”计划的支持下,中国开始组织语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。自此,我国语音识别技术进入了一个新的发展阶段。

语音识别技术突飞猛进的今天

自2007年开始,因为移动设备和云计算的广泛使用,使得那些拥有巨大数据处理中心的巨无霸们,如谷歌亚马逊等,有了从亿万对话中学习人类语言的机会。

微信图片_20190115164149.jpg

换言之,当我们每天用手机说话的时候,系统就会听我们的声音学习我们的话语。

基于软件系统的自我学习能力,海量的各类口音俗谚俚语都不再需要人工输入,语音识别系统技术正以非凡的速度在完善强大自己。

2016年,微软的语音识别技术在听懂并理解谈话方面,已经达到了与人类同步的水平,错词率仅有5.9%,比父母同熊孩子交谈还要顺畅。

目前,语音识别技术在民用方面的主要应用领域,是消费购物。

2017年8月,谷歌同美国最大的零售商沃尔玛达成合作伙伴关系,消费者可利用谷歌语音识别软件从沃尔玛直接购物。

当然,语音识别也有它的短板,那就是对极其偏僻生冷的字词容忍度很低,很可能会拒绝识别。

老话说,事有反常必为妖,连天量数据的语音识别软件都无法识别的词和字,会不会真的是妖言呢?

语音识别技术造福人类的明天

微信图片_20190115164151.jpg

在人类通讯习惯越来越从短信漂移向语音时,我们的购物手段也在向语音靠拢。

美国一家机构预测,到2020年,几乎一半的购物搜索,都会通过说话的语音形式完成。让消费行为更加便捷快速的语音识别技术,对购物者来说是锦上添花。

而对那些有读写障碍的文盲半文盲,语音识别,通过说话做事情,则是雪中送炭,让他们解脱文字的桎梏,具有更为完全的民事行为能力。

比如,美国人正在构想,如何通过语音识别技术,让那些不会读/写的成年人,利用一部便宜的手机,用说话的方式,填写各种社会机构/政府部门的表格,开设银行账户。


今天的中国,随着AI技术的发展,语音识别已经被整合到了AI智能产业链的一环,与人脸识别一起成就了今天的商显3.0时代。

微信图片_20190115164152.jpg

今天,智能终端不再单方面传递信息给用户,而是强调用户与终端的互动。如何互动?传统的键盘,触摸已经满足不了今天人们对信息的高速获取和选择的需求了。语音识别作为一种快捷输入操作满足着人们对于互动交流的需求。同时声纹作为一种独一无二的“识别码”可以保证我们设备和账号的安全性,语音识别将会同人脸识别一起成为中国AI智能领域强劲的风口,为商显市场这头“猪”带来飞翔着的明天。

 

深圳市亿晟科技有限公司  E-mail:yingkundpf@126.com  公司电话:86-755-27383670   传真:86-755-27383670
  公司地址:福永镇新田大道立新湖高新产业园研发中心9楼
免责声明:平台仅提供信息汇集作用,内容的真实性、准确性和合法性由发布企业负责,如有侵权请即时联系处理。
官方网站