英语流利说 CTO 胡哲人:AI 英语老师与你一起进化

2018 年 1 月 17 日 EGONetworks Echo Tang

胡哲人是英语流利说的联合创始人兼 CTO ,也是 EGO上海分会会员。2012 年 9 月,胡哲人与中央「千人计划」专家、普林斯顿大学计算机博士、Google 前产品经理王翌和 Google 美国总部的研究科学家林晖共同创立了英语流利说。近期,美国科创网站 TechStartups 发布了 2017 十大主流人工智能创业公司榜单,英语流利说是唯一一家上榜的中国企业。

英语流利说的联合创始人兼 CTO - 胡哲人

作者 | Echo Tang

目前,英语流利说 App 注册用户高达 6000 万,付费用户已经超过 100 万,覆盖了全球 175 个国家,全国 379 个城市。值得一提的是,流利说已经实现了规模化盈利,成为中国以及世界范围内在线教育领域第一家实现这一目标的公司。

语音识别引擎 + 精准写作打分引擎 + 深度自适应 —— 流利说 AI 的三柄利剑

十几年前,清华大学研究生毕业的王翌第一次飞往美国,落地美国后,托福几乎是满分的他竟然无法在机场旁边的麦当劳点餐,因为服务员根本听不懂他在说什么。这场尴尬的对话让王翌意识到之前的英语学习是有问题的。而 2012 年他准备回国时发现,国人的英语学习状况仍然没有改变。

王翌在普林斯顿大学读博期间修读过一门“高科技创业”课程,这让他感觉到创业很有意思,因为一个优秀的产品,可以改变一大群人的生活。而英语学习正需要一个优秀的产品。于是,王翌拉上了大数据公司 Quantcast 的资深软件工程师胡哲人,以及 Google 美国总部的研究科学家林晖开始创业,英语流利说这个创业项目也由此诞生。


为了打磨更好的产品,为用户提供更优质的服务,英语流利说自主研发了世界领先的英语语音识别引擎、精准写作打分引擎和深度自适应英语学习系统。英语流利说打造的世界首创的 AI 英语老师就是基于这三项技术。AI 英语老师可以根据用户的基础水平和学习轨迹为每一位用户提供个性化的学习课程。

英语流利说官方最新数据显示:英语流利说拥有 800 万小时中国人说英语的数据,基于这个英语数据集,英语流利说训练出一个最强的、能够识别中式英语的引擎。大部分中国人说英文并不像美国英语那么标准,多数都是带口音的。对此英语流利说的识别准确率相当高,即使是带着口音或者是方言的英语,流利说也能识别。胡哲人认为,这是流利说最突出的特点。

语音识别之后要对语义进行理解,精准写作打分引擎就是为了去理解识别出来的内容。从进入学习开始,把每一个用户的英语学习动作打上数字化标签,英语流利说大量自动化的工具会收集带标签的语音数据,最终通过语音识别技术和 AI算法提高口语打分的精准度。基于这个庞大的中国人英语语音数据库,流利说打造了一款能够听懂中式英语的语言识别系统。

在流利说的人工智能语音存储系统里,即便是 1 秒的语音也被切割成了许多小片段,使得机器能精准辨识并纠正细节的发音错误。


流利说的明星产品之一「雅思流利说」就运用了这项技术。我们知道,雅思考试都是开放性命题,考官会提出相应的问题,参加考试的同学根据这个问题来描述。这里面就涉及到两个问题:第一,要用语音识别引擎去识别同学说了什么;第二,去理解语音识别出来的内容,分析学生的词汇量、语法水平,更多的自然语言理解。

最后一步是深度自适应,英语流利说的 100 万付费用户产生的数据的点是以百亿为单位的,流利说根据这些数据的点,根据这些用户的行为去用深度模型建模,根据学生之前的学习路径、优缺点以及跟他水平差不多的学员大概是个什么样情况,然后再去规划一个最合适他的学习路径。流利说利用深度自适应让教育非常的个性化。

懂你英语:语言学习的革命

打造一款领先的教育产品,除了过硬的技术支撑,胡哲人认为内容和数据同样缺一不可。首先,内容对于教育来说非常重要,在制作成本和制作时间上需要很大的投入。然而,好的教育内容生命力非常长,一本《新概念英语》教材有接近 40 年的历史就是个很好的例证。但是,传统教育内容发展到今天,也暴露了很多问题:第一,纸质书实在太重; 第二,这些内容都是写死的,所有人都用同样的内容学习,很难做到个性化定制和个性化学习。

胡哲人表示:“流利说在开始设计系统课的时候,也曾尝试跟全世界一些最好的出版社合作,希望他们已有的内容和系统化课程能够为我们所用。 但是我们很失望的发现,这些内容都很陈旧,即使有些内容是数字化的,也只能在 PC 终端上实现,很难满足在移动端。 ”

一位美国老先生启发了英语流利说团队,他就是现在流利说的资深教学顾问 —— 兰斯 · 诺茨( LanceKnowles ),兰斯 · 诺茨有多年的课程教授经验。结合他的一些关于 RHR(层级递归认知理论)的理论,流利说自主研发了一套符合移动端逻辑的英文原创教材,并将其数字化,将原本只存于书本上的内容通过原创插画、动画、语音等形式在移动端重构。

有了好的内容,再利用产品上大量自动化的工具收集带标签的语音数据,通过对这些有效数据的分析和处理,进一步提升英语流利说评测引擎的准确度与反馈速度。最后,公司的算法团队引入了全球领先的深度自适应学习系统,根据每一位用户的学习轨迹,进行相应的课程推荐。

2016 年 7 月,英语流利说推出历时两年斥巨资打造的世界领先的人工智能老师 —— “懂你英语”,为每个用户提供个性化的学习内容和计划,被业界称为一次语言学习的革命。

“懂你英语”这个产品就是内容、技术和数据的整合。胡哲人解释说:“用户能直观感受到的是内容本身,但内容的背后有很多技术,包括:互联网产品的技术,机器学习的技术以及数据,懂你英语会提供个人的能力曲线,这些能力曲线都是数据算出来的。因为有技术,才能够让我们做内容,因为有内容,用户学得好,我们才能够拿到数据,拿到数据我们才能够更好的提高技术,更好的优化这个产品。这三者缺一不可。”

胡哲人认为,在语言教育领域,传统教学一直存在一些明显却无法解决的问题,比如有限的师资、高昂的培训费用、低下的学习效率以及依托物理空间而产生的距离问题等等。这就意味着,对于一个学生而言,如果他要最大化节约时间成本,最佳的选择就是周边有限的学习场所,而这个选择背后的教材、时间、老师等诸多资源就更有限了。

流利说首创的 AI 英语老师,拥有强大的深度学习技术,可以从听说读写多个维度为每一位用户提供个性化、自适应的英语学习方案。而这种学习方式经欧标( CEFR )对比认证,其学习效率较传统真人教学可提高三倍以上,而费用只需要每天一杯咖啡的钱。

居安思危:美国人工智能实验室

胡哲人告诉记者:“我们在获得 100 万付费用户的同时,又保持了收入的高速增长。在过去 12 个月时间里,我们每个月的收入增长率超过 30% 以上。也就是说,我们差不多每个季度的收入都是上一个季度收入翻一番还要多。 ”

2017 年 7 月,英语流利说完成了近亿美元 C 轮融资,获得了资本市场的认可。不过,流利说在取得了令人瞩目的成绩和突破的同时,也依然面临着很多挑战。胡哲人认为最大的挑战来自于用户本身。

教育行业是过去一百年,甚至更久时间没有太大变化的行业。比如,技术革命让医疗行业取得了很大的变化,CT 、MRI 、超声波等科技产品的出现让医疗手段不断升级。然而教育行业并没有明显的改变,一百年前是一个老师在写板书,一百年后的现在还是一个老师在写板书,可能多了些投影仪、CD 等辅助设备,但本质没有变化。

在教育领域,消费者求的是稳,是可靠,消费者希望自己投入时间和金钱,能够学会某些知识,中国人学英语的传统方法:背单词,背完单词看语法,这个方法虽然不够好,但貌似几十年下来也很可靠。要改变用户的观念非常难。所以接下来公司也会在市场方面加大投入,让更多的英语学习者了解流利说提供的高效率学习方法。

在技术上,英语流利说也没有止步不前。2017 年 10 月,公司对外宣布正式成立美国人工智能实验室。流利说 CEO 王翌表示,该实验室的研究方向很明确,打造世界上最智能、最高效的 AI 英语老师。胡哲人也对 EGONetworks 透露,融资的部分资金将用于在硅谷吸纳人才增强实验室研发力量。

就在前不久,英语流利说还宣布成立顾问团,美国工程院院士、普林斯顿大学教授李凯,认知神经科学家、耶鲁大学心理学教授尼古拉斯 · 图克 · 布朗( Nicholas Turk - Browne )以及教育学家、斯坦福大学教育研究生院院长丹 · 施瓦茨( Dan Schwartz )加盟。王翌表示,人工智能在教育领域已进入实际应用阶段,英语流利说成立顾问团,是希望更进一步。

在文章开头提到的“ 2017 十大主流人工智能创业公司榜单”中,TechStartups 评审组为英语流利说给出的上榜理由是:“通过尖端的 AI 技术和杰出的产品设计,流利说帮助用户高效的学习英语、沟通世界。基于业界领先的 AI 技术,流利说为来自全球 175 个国家,全国 379 个城市的超过 6000 万用户提供了定制化的学习体验。”如今,英语流利说开创的“ AI + 教育”的新兴学习方式正快速席卷全球。

- End -



点击下图进入「 上海 E 家宴专场 」报名通道


点击下图进入「 杭州 E 家宴专场 」报名通道


登录查看更多
3

相关内容

被苹果官方评为App Store“2013年度精选”App(语言类唯一入选App)
【论文】欺骗学习(Learning by Cheating)
专知会员服务
26+阅读 · 2020年1月3日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
《“10后”漫游人工智能指南》
商汤科技
3+阅读 · 2019年5月16日
知乎高赞回答:有什么相见恨晚的学英语方法?
深度学习与NLP
5+阅读 · 2019年4月16日
95后“过控”专业转行AI工程师打卡!
人工智能头条
5+阅读 · 2018年6月1日
盘点2017年度AI领域大事件
大数据文摘
5+阅读 · 2017年12月9日
“独角兽”:开工资,我们不比BAT低
IT时报
4+阅读 · 2017年7月16日
Arxiv
6+阅读 · 2019年9月25日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
11+阅读 · 2018年9月28日
Meta-Learning with Latent Embedding Optimization
Arxiv
6+阅读 · 2018年7月16日
Arxiv
6+阅读 · 2018年6月20日
Arxiv
10+阅读 · 2018年4月19日
VIP会员
相关资讯
《“10后”漫游人工智能指南》
商汤科技
3+阅读 · 2019年5月16日
知乎高赞回答:有什么相见恨晚的学英语方法?
深度学习与NLP
5+阅读 · 2019年4月16日
95后“过控”专业转行AI工程师打卡!
人工智能头条
5+阅读 · 2018年6月1日
盘点2017年度AI领域大事件
大数据文摘
5+阅读 · 2017年12月9日
“独角兽”:开工资,我们不比BAT低
IT时报
4+阅读 · 2017年7月16日
相关论文
Arxiv
6+阅读 · 2019年9月25日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
11+阅读 · 2018年9月28日
Meta-Learning with Latent Embedding Optimization
Arxiv
6+阅读 · 2018年7月16日
Arxiv
6+阅读 · 2018年6月20日
Arxiv
10+阅读 · 2018年4月19日
Top
微信扫码咨询专知VIP会员