非开挖施工厂家
免费服务热线

Free service

hotline

010-00000000
非开挖施工厂家
热门搜索:
行业资讯
当前位置:首页 > 行业资讯

云知声CEO黄伟用技术和大数据提升语音识别率

发布时间:2021-01-21 04:10:14 阅读: 来源:非开挖施工厂家

4月12日,由云知声牵头的国内首家全智能交互联盟在北京成立。首批联盟成员云知声、哦啦、亮风台和Face++创始人齐聚一堂,共同参与了主题为“云知声:全智能交互新起点”的开发者沙龙,并分别就其专注领域语音、语义、图像、人脸识别作了主旨演讲。

图为四位联盟成员代表(从左至右):Face++创始人唐文斌、亮风台创始人廖春元、云知声CEO黄伟、哦啦创始人赵子松

技术团队升华至商业团队

云知声CEO黄伟的演讲主题为“智能交互的趋势和现状”。他认为一些新技术由诞生到普及需要一个过程,如Pad和Google Glass等,但发展趋势不可阻挡。同样虚拟、无界面、非接触的智能交互发展也是趋势使然,云知声生逢其时,成立至今不足两岁,已完成四次内核升级,实现了技术上的四大突破。

但黄伟也表示国内技术类公司创业面临的困境在于:技术成熟,而商业化能力不佳,有没有用户愿意买单是个问题。为此,云知声将更重视拓展市场份额,挖掘商业价值。目前,云知声拥有3000多家合作伙伴,通过免费开放的语音云平台与用户合作,以培养用户使用习惯。今年三月份云知声实现了单月签约额破千万的业绩,可见市场及用户对其的认可度,也标志着云知声在短时间内从技术团队升华至产品和商业团队,成为成长最快的语音初创公司。

图为:云知声CEO黄伟演讲现场 谈技术上的四大突破

深度神经网络技术+大数据=提升语音识别率

云知声成立于2012年6月,9月推出业内首个公共语音开放平台,12月底,完成了第一次重大升级,即引入深度神经网络技术,将其应用到语音识别领域,并把这个系统部署到公共服务。其后,云知声持续通过引擎升级,包括一些数据迭代,来提升语音识别引擎性能。目前,平均识别率已接近97%,是业内最高水准。

当然,黄伟也表示单纯比较识别准确度对用户体验意义不大,因为它只代表高度,还存在广度的问题,如不同语种,方言口音,性别及年龄段识别等等。目前,云知声已提供中、粤、英三语识别服务;并致力于性别和年龄段的识别服务以满足电商需求,进行精准广告投放;同时支持云端识别和全离线语音识别。

黄伟称,正是由于创业的饥饿感,加之对技术的极致追求,才实现了语音识别高度广度的重大突破。

语音识别在实验室条件下能达到非常高的准确率,但在真实场景中通常会遇到方言口音、环境噪音、话题专业性等问题,而影响了用户的体验,那么如何提升用户体验的稳定性?黄伟在回答快鲤鱼记者提问时表示,语音识别最直观的反应是识别率,其实90%以上的识别率10年前就做到了,但那是在实验室安静的环境中,采用播音员清晰标准的发言数据。而实际应用中,由于汉语本身语音语调、方言口音、噪音环境等一系列因素的干扰,的确会影响到用户体验。

但随着互联网兴起,Google Now, Siri等已证明语音可以更智能,之前提到的识别率97%是线上平台收集的用户真实数据,云知声之所以能做到这点,主要归功于应用场景的吻合及深度神经网络技术的引入。传统神经网络受限于数据不足,硬件功能不强大等因素;而深度神经网络则有几十上百层,每层有很多节点,更逼近人脑的思维能力,同时借助于大数据,极大地提升了语音识别准确率。

博雅娱乐下载值得信赖

妖怪金手指破解版

皇家奇兵手游