新智元报道
清早,小飞醒来,撕下昨天的日历。
作为梅西的铁杆球迷,小飞昨晚经历了一个伤心之夜。
第五次出战世界杯的梅西,首战折戟。
好在,还有安安安慰他。
是的,他有一个既能变身、又能变声的虚拟人解说员安安。
安安颜值又高,又会跳舞,业务能力还强。她解说球赛时,既专业又有文采,还声情并茂。
在现实生活中,机器人已经逐渐开始走进每个人的家庭。
AI早已不是传说中那个高大上的科技词汇,而是真正成为了每个人的水和电——没有AI,生活中就会寸步难行。
小飞是一名算法工程师。他的小家里,有各式各样你想象不到的高科技。
而给他的生活带来最大改变的,当然就是百变的虚拟人小助手安安了。
会变身的虚拟人助理
随后,小飞充分发挥自己的想象力,用软件调试了很多个版本的虚拟人,头发、肤色、五官都可以自由设置,然后搭配上软件标配的身材。
更绝的是, 还能配上最适合虚拟人形象的声音。
比如这个萌妹子Luya,她的声音就十分清纯可爱。
而御姐一聆的声音就很成熟干练。
当小飞漫步林荫路时,虚拟人助理会用字正腔圆的「播音腔」为他读新闻。
当小飞结束一天的工作,准备入睡时,虚拟人助理会为他轻声细语地朗读散文。
当小飞驱车去公司上班,虚拟人助理会用他最喜欢的歌手的声音,告诉他走哪条路不堵车。
当小飞看纪录片时,虚拟人助理会为纪录片中不同的人物配音。
如此一来,合成音的效果,几乎可以「媲美真人」。
看图作诗的机器人,可太会了
在科学家们看来,机器人不仅应该能完成人类的指令,还应该有自己的大脑,能理解、会思考,应该是它们必备的技能。
小飞的目标是,给机器人展示一幅画时,它不光能看懂画里是什么东西,还能把画里的内容描述出来,更绝的是,还能让它就这幅画的内容吟诗作对。
这个功能听起来就很厉害。要知道,很多人类还达不到这样的水平呢(😂)。
而要让机器人做到这些,涉及到的关键步骤可太多了。
再进一步,小飞需要让它根据这幅画创作诗词,再利用图片风格迁移功能,给古诗词配上水墨、油画等各种风格的图片,这样就能生成诗图并茂的明信片。
小飞现在就要试试,这个AI在看图说话上的表现会如何呢?
怀着激动又忐忑的心情,小飞给AI展示了一幅梵高的名画——《红色葡萄园》。
AI开始描述——
小飞惊呆了,这AI的文采可太好了,秒杀「语死早」的自己。
接下来,小飞让AI写一首诗词。
AI张口就来——
西园晚霁浮嫩凉,开尊漫摘葡萄尝。
小飞是彻底地心服口服了。
其实,他心里还有个小愿望:自己从小写作文就很烂,有了这个才高八斗的AI当辅导老师,他以后的孩子写起作文来就不愁啦!
有了这么厉害的认知能力和表达对话能力,就可以赋能元宇宙里的虚拟人物,实现更自然便捷的沉浸式体验,还能为机器狗、机器人进入每一个家庭提供基本的支撑。
小姐姐带我「沉浸式」旅游
自从发现了科大讯飞研制的裸眼3D成像和虚拟人等技术,他把自己的家变成了一个小小的时空体验馆。
五岳归来不看山,黄山归来不看岳。小飞一直对黄山心生憧憬。
在虚拟人导游的指引下,他来到了美丽的黄山。
游览完了黄山,他又到了三星堆博物馆,通过手势互动「把玩」了三星堆青铜面具。
以后,小飞还计划用裸眼3D成像去走遍祖国的大好河山。
机器会像人一样感觉?
今天,小飞需要赶着出去办事。
在地铁里,他只靠动嘴,就买到了一张票。
办完事,小飞回到了家。
像他这样的开发者,时常会跟进最新的论文,并且记下详细的笔记。
此时,就用到了自由绘写系统。
这是一款屏上书写系统,无论是中英文、数理化公式、有机分子式,还是表格、流程图,只要手写出来,它都能实时识别,即写即转。
甚至,小飞还能用眼神打字。
基于这个想法,科大讯飞研发出了一个可以将唇形和语音技术相融合的多模态语音交互系统,让语音识别在高噪音场下做到了实用。
这个AI,居然这么懂?
在空闲的时候,小飞喜欢开脑洞,探索一些科学百科问题。
地球自转会引起什么?
火鸡、土豆、奶牛、鸡,哪个来源于植物?
这些脑洞大开的问题,AI总是能给他最精彩的回答。
其实,这些问题,就涉及到了AI的深度理解。
小飞很关心国家的教育问题。他深刻地感受到:深度理解的进步,能让我们在对儿童的教育中,更深入地触及教育的本质。
爱因斯坦说过,当你把课本上的所有知识都忘记之后,剩下的东西才是教育的本质。
因为小飞是全家最聪明的人,他经常需要辅导小侄子超超的功课。
他发现,用科大讯飞的知识图谱,能够精准分析超超对于初一的各门功课的掌握程度,对他已经掌握的部分减少无效练习,对他还没掌握的部分进行强化练习。
超超的成绩提高了,全家都很高兴。
而如获至宝的小飞,又发现了另外两个「宝藏」 ——讯飞的儿童脑智发育检测平台和AI学习机。
通过这些工具的加持,超超的注意力水平明显提升了,成绩突飞猛进。
另外,科大讯飞还研发了儿童脑智发育检测平台和儿童注意力系列的训练课程,通过后者,儿童提高了37%的注意力水平。
能帮你搬快递的机器狗,长了个「超脑」
小黑配备了激光雷达、深度相机、嗅觉传感器,能导航,能负载,能爬坡,能识别各种各样的味道,还能拍照告诉主人垃圾箱满了没有。
现在,小飞正带着小黑参加机器狗大赛。
小黑现在已经是决赛圈的选手了,如果得了冠军,还能给主人赢回10000元大奖。
看小黑的势头,万元奖金已经如在囊中了!
小黑的动作为何如此「丝滑」?
那是因为,它长的可不是普通的狗脑子,而是机器人超脑。
而因为有了机器人超脑,机器狗拥有了更实时的地形自适应能力、更快速的全局定位搜索能力、更精确的地图构建能力和更高性能的AI运动控制。
抱着万元大奖,小飞带着小黑开开心心地回到家,继续看起了球赛。
回到现实:1024开发者节
原来,自己逛了一天的1024全球开发者节科博展之后,坐在休息区的椅子上睡着了。
而刚刚「梦里」的那些技术,其实都是他在科大讯飞全球1024开发者节上看到的。
这几天,合肥体育中心格外热闹,科大讯飞1024全球开发者节科博会展上,各种硬派科技闪亮登场,大大满足了与会者对于AI和科技的好奇心。
在这场科技的狂欢节上,孩子们被现场多姿多彩的AI智慧震撼到了。
超超这次也跟着小飞一起来了。
见证了各种酷炫的技术之后,超超两眼发光,心里暗自下定决心:我一定要学会更多知识,在未来也成为这样厉害的开发者。
是的,追星就追科学家!
做超脑,科大讯飞是认真的
未来十年,是一个虚拟世界和现实世界深度融合、人机协作深度耦合、机器人走进千家万户的世界,人工智能将深刻改进人类的生产和生活方式。
今年年初,科大讯飞正式发布了超脑2030计划。目标是要让人工智能「懂知识、善学习、能进化」,让「软硬一体」机器人走进每个家庭。
做超脑,讯飞是认真的。绝不仅是说说而已。
第一阶段的目标是,在2022-2023年,造成可养成的宠物机器人,来陪伴孩子成长。这需要突破仿生机器人本体、多模态感知及表达、主动对话等关键技术。
到了2023-2025年的第二阶段,讯飞希望能用外骨骼机器人辅助行动不便的老人独立行走。而这同样需要突破多传感融合运动控制技术、多模态情感理解及持续学习技术。
第三阶段,也就是2025-2030年,服务机器人就能走进每一个家庭了。这时就需要突破机器人的复杂场景融合决策与柔性驱动、跨模态融合自主学习、常识推理及联想决策等技术。
为了实现「超脑2030计划」的三个阶段,科大讯飞目前已经在多模感知、深度理解、多维表达、运动智能这四个技术上都取得了关键突破。
具体的细节,我们都在小飞的梦里见识过了。
闭馆时间到了,小飞还在沉浸式虚拟世界里流连忘返。
在科技馆的出口,他用人脸、声纹、视线唤醒3D虚拟人,跟他们说再见,而这些虚拟人听出了他语气中的依依不舍,安慰他说下次1024开发者节再见~