对话|搜狗王砚峰:知音OS+智能硬件,搜狗加速抢占IoT入口

2017 年 8 月 9 日 智东西 Lina

“搜狗在能做智能硬件的品类下做智能硬件,电视、手机等(不适合搜狗做的)场景下,说服好的合作伙伴进行合作。”

智东西  文 | Lina

智东西8月8日消息,今天,搜狗推出了一款实时语音转文字速记工具“搜狗听写”,使用了搜狗知音引擎的长时语音转写技术,为文字工作者提供会议、采访、写作等场景下的速记要求,用户可以在App商店免费下载。

会后,搜狗公司语音交互技术中心总经理王砚峰与智东西等媒体就搜狗听写、搜狗AI技术、知音OS、以及搜狗智能硬件做了相关交流。

一、一款专注采访场景的笔记产品

正如智东西之前的报道中写道,目前市场上已经有同类的产品,比如讯飞录音宝等,搜狗听写跟其他家的差异点在哪里呢?在回答智东西的这个问题时,王砚峰表示,搜狗听见与其他的差异在于两点:

1、其他产品不能像搜狗听写那样支持长时间录音+免费转写支持;

2、搜狗听见更面向垂直场景,在记者采访、作家写作等场景下进行了功能优化(比如加入远程蓝牙标注重点技术),为用户带来更好的产品体验。

在会后的采访中,王砚峰补充道,除了语音文字转录外,搜狗听写还有对笔记进行分享、记事、管理等功能,其实更类似一个云笔记,是专门为了解决文字工作者切身遇到的问题而打造的产品。

二、远场噪声环境下的识别转录


记者在发布会现场体验了,发现“搜狗听写”在吵杂、远距离环境下的语音识别效果其实并不是太理想,这其实也是市场上不少语音转录产品所存在的共同问题之一——在安静、近距离环境下的转录效果很好,但处理远场、噪声、尤其是发布会上经由麦克风及扬声器处理过一遍的声音时效果很差。

为此,王砚峰提出了两点解决方案:一是继续进行数据积累与产品迭代,在嘈杂噪音环境中累积更多数据用于模型训练,才能提升准确率;二则是搜狗听写中有“转写”模式,系统可在离线状态下录音,录音完成后一次性获取文字结果,此时因为不需要实时转录出结果,引擎速度不需要那么快,因此可以搭建更深、更复杂的模型,从而也能有更好的识别效果。

不过,由于搜狗听写App使用的是手机麦克风,手机本身的收音硬件差异也会导致识别效果差异。目前搜狗听写尚不支持外部录音导入,只能依靠手机进行录音。

三、智能硬件是搜狗目前的战略重心之一


搜狗知音是搜狗一年前发布的语音交互引擎,主打“自然交互+知识计算”的技术战略。王砚峰海表示,知音引擎指的是技术:语音识别、机器翻译、语音合成等技术的集合,对于搜狗来说是语音AI的技术平台。

基于知音引擎,搜狗打造了“知音OS”语音交互平台,这是一款面向手机、电视、可穿戴、车载设备等智能设备的语音交互平台。目前,知音OS已经在小米、魅族、创维、海尔等产品中落地应用。

王砚峰海表示,智能硬件现在是整个搜狗的战略重心之一,随着移动互联网时代逐渐向IOT时代进军,智能硬件已经成为抢占用户入口的最重要渠道。在未来一年里,搜狗还将会在可穿戴、车载、客厅场景内自主研发更多搭载知音OS的智能硬件,并进一步推广知音OS平台与其他厂商的合作。

“搜狗在能做智能硬件的品类下做智能硬件,电视、手机等(不适合搜狗做的)场景下,说服好的合作伙伴进行合作,形成用户入口。”

(本文系网易新闻·网易号“各有态度”特色内容)



延伸阅读

点击下方图片直接阅读


往期回顾

硬创先锋(2017)

共享经济

Hi电 | 云冲吧

人工智能&大数据

先声互联

康夫子 异构智能 医拍智能 彩云AI 神策数据

竹间智能 | 深鉴科技 | 钢铁侠科技 | 蓦然认知 | 达闼科技

VR/AR

VeeR RealMax | ObEN | 所思科技

汽车

天瞳威视 | Auto X 速腾聚创 Vector.ai

智行者 | WayRay 游侠汽车 | EZZY | 开云汽车

聚焦特写

共享经济

共享充电宝真相:惨不忍睹

共享电动车卷土重来

失控的共享单车

企业观察

李彦宏的24门客:离开百度,野蛮生长

出行教父李斌和他的隐秘帝国

智能快递柜为何陷入困境?

汽车智能后视镜的地下江湖

易到的生死危局

VR寒冬论言过其实

滴滴快车之死

百度大清洗

陆奇上任百度的51天 连烧六把火

微软亚洲研究院英雄谱



登录查看更多
1

相关内容

搜狗凭借对前瞻性技术趋势的把握和敏锐的市场嗅觉,已经成为中国互联网的创新典范,也是最具发展潜力的公司之一。搜狗的产品围绕互联网的最基础应用,其中输入法、浏览器、搜索三大产品均名列前茅。2010年8月9日,在引入阿里巴巴集团和云峰基金等战略投资者之后,搜狗从搜狐分拆,成为独立运营的公司,王小川出任搜狗首席执行官。
新时期我国信息技术产业的发展
专知会员服务
70+阅读 · 2020年1月18日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
25+阅读 · 2019年11月19日
知识图谱更新技术研究及其应用,复旦大学硕士论文
专知会员服务
103+阅读 · 2019年11月4日
怎样用声纹识别,提升智能硬件产品的用户体验?
人人都是产品经理
6+阅读 · 2018年8月27日
打造AI证券助理,竹间为兴业证券带来的不仅是客服
未来产业促进会
5+阅读 · 2017年12月26日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
【智能商务】海量商品查找利器—苏宁搜索系统
产业智能官
5+阅读 · 2017年12月1日
智能语音成“AI四大项目” 千亿市场待开发
IT时报
3+阅读 · 2017年11月26日
Arxiv
6+阅读 · 2020年4月14日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
QuAC : Question Answering in Context
Arxiv
4+阅读 · 2018年8月21日
Arxiv
7+阅读 · 2018年4月24日
Arxiv
9+阅读 · 2016年10月27日
VIP会员
Top
微信扫码咨询专知VIP会员