语音识别技术受追捧,无法独立工作的“速记神器”何时才能成为新亮点?

2017 年 8 月 9 日 镁客网 伶轩


从当前来看,速记神器确实为特定人群所需。


近日,搜狗召开发布会,正式推出其自研的速记神器——搜狗听写。这是一款能够将语音实时转变成文字的速记工具,拥有转写和听写两种模式,主要面向记者、编辑、作家等文字工作者。

由搜索而知名的搜狗

在人工智能领域似乎也玩的风生水起


众所周知,搜狗以搜索业务起家。除搜索业务外,其在近年还因搜狗输入法、搜狗高速浏览器等在行业内颇具名气。

如果仅从以上这些来看,搜狗此次推出“搜狗听写”似乎显得有些无厘头。然而,搜狗CEO王小川曾表示,搜索本身也是一种AI。

回顾搜狗的发展史,除去初期产品,搜狗在其产品迭代或新品中都或多或少的运用到了人工智能技术,例如搜狗云输入法、加入了云计算技术的搜狗输入法5.0版本、儿童智能手表“糖猫”等。

很显然,这一次搜狗将目光瞄准了语音识别领域,也似乎做出了点成绩。搜狗语音交互技术中心总经理王砚峰表示,搜狗听写中涉及到了大量前沿技术,例如大规模的优质语音数据训练和深度学习的技术能力积累等,不仅可应用于多个场景,其语音识别准确率也高达97%以上。

产品并无明显差异化竞争优势

搜狗听写要拿什么去竞争?


从搜狗方面的介绍看,搜狗听写可提供两种服务,语音转写和语音听写。此外,它还同时具备了边听边改、无线标重点、多端同步、信息分享等多个功能。而这样的语音转写工具,似乎在行业内并没有什么明显的差异化竞争优势。

除新鲜出炉的搜狗听写之外,科大讯飞的云犀、思必驰的语音输入板等,都是能够将语音转换成文字的工具。此外,仅在中国,除去普通话,大方言就有八种,各小地区方言更是多不胜数。这其中所涉及到的语音识别、语义识别、深度学习、算法训练等多个人工智能尖端技术,难度不可谓不大。

很显然,与一直致力于语音识别领域技术开发的企业相比,搜狗在专业程度及行业经验方面都有不做。而除去这些专业性企业和产品之外,当下很多输入法及搜索工具也有类似的功能,搜狗并没有赋予搜狗听写具有差异化竞争力的功能。在市场逐渐开拓的当下,搜狗想要凭借搜狗听写搏得一方市场,显然不容易。

技术+人工

AI至今未能真正做到全智能


在语音转化文字方面,除去偏C端的工具外,专业性系统或软件也有很多,例如科大讯飞的听见智能会议系统。在大多数的专业性会议,主办方都会聘请的专业速记人员。而与前几年相比,现今的速记工作已经有了更多人工智能的参与。

只是这其中存在着一个的现象,当前的语音转写技术并不能一力承担整场专业性会议,还需要有专业速记员全程盯着,实时进行纠错没有识别出的内容、标点等。

科大讯飞负责会议现场速记的一位专业速记员表示,在以科大讯飞听见智能会议系统为主导、没有纯正方言的情况下,正常会议速记工作的人工参与率是5%—10%。

不过,在人工智能相关技术不够成熟的当下,这样的人工参与率已经是很低的了。虽然目前我们并不能做到完全智能,但仅就速记AI领域来说,有了专业速记员的配合,不仅能够保证速记内容的精准,还能为开发者提供更为直观的现场反馈,为技术的进一步发展助力。

总结


随着人工智能相关技术的发展与前景的逐渐明朗,似乎所有行业都想在这一领域插上一脚,大公司更是不例外。当然,企业发展需要新鲜元素的加入,但如果只是为了与“AI”沾亲带故以获得“宣传”的理由,对于行业来说,这样的企业或从业者也许就是毒瘤。

从当前来看,速记神器确实为特定人群所需,但想要让这类产品成为刚需,还需行业者切实考虑用户需求,尽快让AI成为真正的全智能技术。

/- 推荐阅读 -/


▲  「深度」千篇一律的智能音箱,为何它们就是对显示屏“不感冒”?


▲  锤子前CTO钱晨:我没有退休,只是跟老罗有些“剪不断理还乱”


▲  「深度」手势识别已起步,行业者还需找准刚需厚积薄发

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技第一产业媒体

提供最有价值的行业观察

登录查看更多
2

相关内容

搜狗凭借对前瞻性技术趋势的把握和敏锐的市场嗅觉,已经成为中国互联网的创新典范,也是最具发展潜力的公司之一。搜狗的产品围绕互联网的最基础应用,其中输入法、浏览器、搜索三大产品均名列前茅。2010年8月9日,在引入阿里巴巴集团和云峰基金等战略投资者之后,搜狗从搜狐分拆,成为独立运营的公司,王小川出任搜狗首席执行官。
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
300+阅读 · 2019年12月23日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
Mozilla发布开源语音数据库和语音识别模型
Python程序员
3+阅读 · 2017年12月1日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
Arxiv
8+阅读 · 2019年2月15日
Arxiv
7+阅读 · 2018年6月8日
Arxiv
6+阅读 · 2018年2月26日
Arxiv
11+阅读 · 2018年1月15日
VIP会员
相关VIP内容
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
300+阅读 · 2019年12月23日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
相关论文
Top
微信扫码咨询专知VIP会员