今天,腾讯开源这些技术,希望能帮助到有需要的人

2018 年 3 月 28 日 腾讯研究院 腾讯

之前,我们介绍过这样一个功能,可以让视障者也能“看见”图片


一直以来,当视障用户使用智能手机时,都能通过自带的读屏功能听到文字。


可一旦碰上图片动态,他们就只能听见“图片”、“图片”、“图片”......


而我们做了一个尝试,希望这些图片也能“说话”。


在最新安卓版QQ空间APP中,增加了「图片语音即时描述功能」。它能识别图片的内容,并“说出”一句文字描述。就像这样——




一位参与内测体验的视障小伙伴说:


可能你不会觉得有什么,但对我而言却仿佛打开了一扇全新的大门。



QQ空间这个功能,来源于2017年产品团队与合作伙伴深圳信息无障碍研究会的一次交流。而同年,我们试着开放了高精度图像识别服务能力。


令人惊喜的是,许多国内PC和手机读屏软件接入后实现了对图片的朗读,一定程度上让视障人士有了更多选择。


这也让我们更加坚信,AI 不仅要 “IN ALL”,更需要 “FOR ALL”。


于是今天,我们在科技无障碍发展大会上宣布,在中国残疾人联合会的支持下,正式启动“AI无障碍:QQ空间无障碍技术开源项目”。


我们会开放这样一批AI技术,让更多企业、开发者能够自由接入并使用——


  • 能听的图片:图片转语音技术


它能通过深度神经网络识别图片的内容,然后组织语言,以通顺并符合人类语言习惯描述图片,并通过语音说出来,就像QQ空间里能“说话”的图片一样;



  • 看图识字:OCR识别技术


它可以识别图片上的文字,比如身份证、指示牌、一张PPT的照片等等,能让你对文本信息的获取更为便捷,不仅在日常生活中很实用,结合语音技术还能为许多障碍人群提供便利;



 

  • 多角色定制语音:语音合成技术


它能通过机器学习训练,将文字以特定角色的声音诵读出来,让语音合成更加真实有情绪、获取信息更加容易,未来也许能用你的声音为奶奶念出一份说明书;


这些技术,你都可以在小程序 “多媒体AI平台” 中找到。



我们还为这些特别适用于无障碍场景的AI技术开辟了专门的入口:




腾讯从2009年开始就进入到无障碍产品的改造中。


在探索中,我们越来越强烈地意识到,所有用户都有权利更方便地获取信息、更自由地交流,而这绝不是一个人就能走下去的道路。


所以,我们希望无障碍技术的普及,能降低产品应用新技术的门槛,让越来越多的行业和企业都加入这项探索中。


这样,我们才能一起消除前方的障碍,为更多人打开新的大门。


来源:腾讯


登录查看更多
3

相关内容

腾讯 QQ,是腾讯公司于 1999 年 2 月 11 日推出的一款免费的多平台即时通信软件,支持文字、语音和视频聊天,还附带有邮箱、游戏等服务。
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
264+阅读 · 2020年6月10日
【北航】面向自然语言处理的预训练技术研究综述
专知会员服务
112+阅读 · 2020年4月23日
专知会员服务
99+阅读 · 2020年3月19日
专知会员服务
199+阅读 · 2020年3月6日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
苹果首次披露Siri声纹识别技术
AI前线
6+阅读 · 2018年4月17日
AI潮流之中,你该关注这些公众号
人工智能头条
3+阅读 · 2017年7月28日
自然语言处理技术(NLP)在推荐系统中的应用
CSDN大数据
4+阅读 · 2017年6月29日
On Feature Normalization and Data Augmentation
Arxiv
15+阅读 · 2020年2月25日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Feature Denoising for Improving Adversarial Robustness
Arxiv
15+阅读 · 2018年12月9日
Arxiv
5+阅读 · 2018年9月11日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
3+阅读 · 2018年5月28日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关VIP内容
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
264+阅读 · 2020年6月10日
【北航】面向自然语言处理的预训练技术研究综述
专知会员服务
112+阅读 · 2020年4月23日
专知会员服务
99+阅读 · 2020年3月19日
专知会员服务
199+阅读 · 2020年3月6日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
相关资讯
讯飞来了,一大批人将面临失业!
创业财经汇
5+阅读 · 2018年4月25日
苹果首次披露Siri声纹识别技术
AI前线
6+阅读 · 2018年4月17日
AI潮流之中,你该关注这些公众号
人工智能头条
3+阅读 · 2017年7月28日
自然语言处理技术(NLP)在推荐系统中的应用
CSDN大数据
4+阅读 · 2017年6月29日
相关论文
On Feature Normalization and Data Augmentation
Arxiv
15+阅读 · 2020年2月25日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Feature Denoising for Improving Adversarial Robustness
Arxiv
15+阅读 · 2018年12月9日
Arxiv
5+阅读 · 2018年9月11日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
3+阅读 · 2018年5月28日
Arxiv
7+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员