今天是三月八日国际妇女节,人们和往常一样,将目光聚焦女性,关注她们的需求和发展。随着科技渗透到社会各方面,在常被贴上男性标签的科技领域,女性从业者的优势正逐步显现,她们为产品研发注入多元视角,将感性体验赋予理性科技,在展现出科技女性强大同理心的同时,也让科技和生活更加亲近。
贴近生活的科技产品已经来到我们身边。前不久,在由央视新闻联合微软推出的交互产品《你的生活,AI为你唱作》中,微软智能女声晓晓倾情演唱,项目上线一周内,在央视全媒体矩阵上获得近2亿曝光,并在2小时内承载了超过300万人次的交互请求,成为了春节期间的人工智能现象级产品,让百万用户聆听了自己照片的歌声。
在得到公众喜爱的智能女声晓晓背后,少不了微软女性的力量,今天,笔者采访到了晓晓声音背后的两位优秀女性,和大家一起领略微软科技酷女孩的精彩人生。
“我认为女生在科技行业是一件很酷的事情,我希望做一个酷酷的产品经理。”
——刘越颖
微软亚洲互联网工程院语音组产品经理
微软人工智能女声晓晓语音产品负责人
越颖在工作会议上倾听他人发言
牵手微软,聆听女声
越颖的大学专业是通信工程,研究生的方向是激光通信,始终是一名“理工女”。2016年初,刘越颖成为微软语音组实习生;2016年7月,越颖研究生毕业,正式加入微软,成为微软亚洲互联网工程院语音组产品经理。
微软的实习经历让我觉得语音领域既时尚又有趣,不仅会与数据和模型打交道,还需要声音鉴赏的素养,我喜欢这里工作的氛围。
越颖负责的第一个项目是为视障人士提供读屏功能的Narrator Windows系统产品线。这个项目中,她接触到从0到1做一个语音合成声音,参与了包括语言调研、词典收集、分句分词、语义理解、录音收集、模型训练、测试上线等在内的全部流程,这也为今后人工智能女声晓晓的开发打下了基础。
2018年,越颖成为微软智能女声晓晓的产品经理,作为微软公开的首个中文深度神经网络智能合成声音,晓晓可以说是“身怀绝技”。
越颖说:
晓晓背后是基于微软 Azure 云上发布的创新性技术突破——端到端的深度神经网络语音模型,这不仅能让声音更逼真和自然,语音合成还可以扩展到多种说话的风格。
在《你的生活,AI为你唱作》产品中,晓晓为大家演绎了精彩的说唱风格,日后还可能会增加情感故事、客服助理等应用场景。
作为一名女性产品经理,在语音产品研发的过程中,越颖常思考如何为产品注入同理心,这也是贯穿微软企业文化的关键词。
在录音数据采集时,我会想象自己在使用语音产品,思考用户在进行语音体验的情感诉求是什么,努力做到感同身受。
除此之外,越颖也格外关注细节:
女性在细节把握方面比较有优势,我们不仅优化语音发声,连喘气声的优化也格外重视,这也是晓晓的声音更自然的原因。
越颖主持微软Build2018开发者大会的直播
激情合作,多元精彩
让越颖惊喜的是,在微软多元文化环境中,她不仅接触到了众多技术大牛,还结交了许多有音乐背景的同事。技术与音乐的碰撞让越颖和同事们一起迸发出了许多灵感和创意的火花。
他们既有专业知识,又有艺术鉴赏力,有的还会自己写歌谱曲。在语音产品设计的过程中,我经常会跟他们沟通。
多元化的文化孕育出了多元化的产品,微软智能女声晓晓的名字同样富有双重含义,越颖告诉我们:
一是拂晓,寓意崭新的一天带来美好的希望;二是知晓,寓意人工智能语音技术能帮助我们探索更多未知。
如何将工作与生活平衡,经常是困扰职场女性的难题,而越颖的工作与生活同样多元而精彩。利用闲暇时间,她参加了北京服装学院的“服装设计与制版”培训课程,从款式设计到工艺制作,亲手制作自己的“毕业礼服”,并在在结业秀上完美演绎;她报名参加了中国传媒大学的播音主持培训课程,向专业老师学习请教,探索声音背后的情感表达。越颖对旅游同样抱有热忱,她曾踏上冰岛神奇的火山土地,拍摄下舞动的北极光;也曾在西雅图海岸边安静地思考,与小仓鼠进行对话。
对于越颖来说,这些或许都是酷女孩想去做的事,“酷”是柔软和硬核的反差,一种不随波逐流的气质。
越颖身穿自己设计制作的毕业礼服参加北京服装学院结业秀
越颖在冰岛瓦特纳冰川
从无人之境,到落地应用
“我们的眼睛已经过于疲累,而声音的魅力尚未被充分发掘。相信追求美、追求精致和温暖的人性的你,一定可以给语音科技带来不一样的视角和影响力。”
——廖勤樱
微软亚洲互联网工程院语音合成产品总监
本硕期间,勤樱在北京大学主修社会学。社会学是一个用系统的方法研究社会行为和人类群体的学科,解决的是人与自我、与他人、与周遭、与社会如何关联的问题。研究生期间一个偶然的机会,勤樱进入IBM中国研究院实习,开始用社会学的方法研究人和人群如何与技术相互关联,从此和科技产生了不解之缘。硕士毕业后,勤樱正式加入IBM研究院,专注人机交互领域,在国际顶级人机交互学术会议上发表了多项研究成果。随后,勤樱加入微软,担任微软中国创新研究组用户体验研究员,现任微软亚洲互联网工程院语音组产品总监,负责微软云AI语音合成相关产品。
勤樱在圣塔巴巴拉海边
从事了多年研究工作的勤樱,职业转向到产品开发的背后是对技术转化的思考:
研究是对科学无人之境的长期探索,但我也想让更多研究成果转化落地,所以我选择加入微软。
微软的创新是多维度的。任何一个灵感的火花都可能成为公司创新的源泉。在2016年Hackathon(骇客马拉松)上,勤樱与自然语言处理组和语音组的同事合作,打造了Song-bot唱图应用的雏形,这也成为《你的生活,AI为你唱作》产品的创意源泉。
在微软中国创新研究组担任用户体验研究员时,勤樱曾参与到Azure认知服务平台(Azure Cognitive Services)最初的项目设计。如今,微软认知服务已经成为众多开发者的加速器,借助提供的API,开发者可以创造出更智能、更有吸引力的产品。例如,小鱼天气借助Azure的数据与服务,为用户提供精准到每平方公里的空气质量报告及预测;晓晓作为微软面向全球发布的通用声音,可以通过微软认知服务平台提供的API接口进行实时调用。
勤樱在微软Build2018开发者大会
以“晓”见大,以“AI”之名
从语音组产品总监的视角,勤樱向我们解释了智能女声晓晓的独特之处,勤樱说:
晓晓的定位有些与众不同,她是平台化的声音,是微软的技术标杆,也是行业的品质标杆。
这里的标杆有两层含义,一是让用户通过晓晓多样风格的演绎、跨越场景的能力,看到微软的语音技术的丰富可能,并可以直接把晓晓接入到自己的产品中;二是通过晓晓独特的声音能力,向大家展示微软个性化的语音定制服务,结合用户的数据,微软可以创造出千百个不同的“晓晓”,满足用户的多元需求。
语音技术是最被看好的人机交互方式之一,随着语音技术在人工智能领域的不断突破,我们也将迎来全新的听觉体验。勤樱提到,声音具有无限魅力,不仅是人机交互,它还可以让我们走向真正的人际交互。
在人类眼睛过度劳累的今天,声音是获取信息的新维度。在未来,通过AI技术的不断提升,我们希望能以更加自然的交互方式,提供沉浸式体验,让用户更好地专注于声音本身。
的确,让每个企业甚至个人,能够听到声音的色彩,品出声音的滋味,正是微软语音技术所追求的方向。
作为一家平台公司,微软希望以技术赋能,让每一个开发者能够利用这些先进的技术,开发出属于他们自己的人工智能体验,享受人工智能技术带来的益处,并能够营造一个良好的人工智能生态。在未来,勤樱相信这样的一个平台,以及平台上的技术,能够对世界、社会、用户做出更大的贡献。
AI将延展人类能力,因此需要以人为先,在产品的系统设计中融入人类创造力与理性,而作为一名女性,勤樱也有着感性的精彩日常生活。OW潜水证(Open Water Diver)、厨房角落的烤箱与面包、画板上的水彩和跃然纸上的柠檬,点滴细节记录着她美好的生活。
对于勤樱来说,对生活的美好和精致的追求,为她从事科技行业带来了更加人性的视角和丰富的体验。
勤樱的手工曲奇和她的绘画作品
最重要的事:女神节快乐!
采访结尾的时候,勤樱对大家说,“科技不意味着疏远和冰冷,它可以充满炫酷和温暖,希望有更多的女生可以加入科技领域。”
越颖则说,“希望程序媛们可以一酷到底,做喜欢的事,做不一样的事。”
这让笔者想起一句话,放弃不难,但坚持一定很酷。在这里,笔者也想对始终心怀热情、深耕科技行业的千万女性说:
女性的力量,在任何时候都能闪耀巾帼光芒。
亲爱的你,女神节快乐!
想了解晓晓智能女声如何调用的,看这里:
https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/language-support#text-to-speech
System.out.println("点个好看吧!");
console.log("点个好看吧!");
print("点个好看吧!");
printf("点个好看吧!\n");
cout << "点个好看吧!" << endl;
Console.WriteLine("点个好看吧!");
Response.Write("点个好看吧!");
alert("点个好看吧!")
echo "点个好看吧!"
点击阅读原文,发现更多精彩!