解密阿里妈妈“AI 智能文案”:1 秒钟 20000 条背后的奥妙

2018 年 6 月 21 日 雷锋网

▲点击上方 雷锋网 关注

文 | 刘伟

来自雷锋网(leiphone-sz)的报道

继作诗、填词后,AI又学会了一项新技能——写文案。

6月20日,阿里妈妈在戛纳国际创意节上正式发布“AI智能文案”产品,结合淘宝、天猫的海量优质内容与自然语言算法,可基于商品自动生成高品质文案。



安能辨我是人机?



文案是一个重复性非常强的工作。在电商环境中,即使同一件商品,在广告推广、店铺装修、活动报名等场景,对文案的需求也不尽相同。每一个商品至少需要5-10条不同的文案,令创作人员不胜其烦。

阿里妈妈希望在阿里海量优质内容的基础上,结合算法与设计能力,在繁复的营销工作中,帮助商家更高效地写出更走心的文案。

据悉,“AI智能文案”目前主要聚焦于商品文案,可实现三项核心能力——高度模拟人写文案、自由定义字数、实时在线样本学习。基于“AI智能文案”,商家只需要填入淘宝/天猫的商品详情页链接,便可获取几组不同内容的智能文案,让以往繁重的脑力活变成了轻松的选择题。

阿里妈妈方面介绍,“AI智能文案”已经突破了傻瓜式的机器模式,生产出来的文案与人类创作的文案并无二致,顺利通过了图灵测试。

同时,它还支持描述型、特价型、实功效型、逗趣型、古诗词型等八种不同风格的文案写作,而且风格类型还在不断扩充中。

AI根据商家需求创作不同长度、风格的文案

商家实际创作商品文案时,常常需要针对同一商品,创作不同长度的文案。为此,“AI智能文案”做了针对性的突破,无论是几个字的短标题,还是60字左右的商品描述,都可以一键生成。以最基础的短标题文案为例,阿里妈妈“AI智能文案”的生产能力已达到1秒20000条。”

光说不练假把式,下面就带大家来看一组“AI智能文案”的作品:

AI创作的文案

“一表人才,就是你。”“开始印象,表里如一。”相信绝大多数人都分辨不出两条腕表文案中,究竟哪条出自AI之手,也很难判断究竟孰优孰劣。

有了如此强悍的“AI智能文案”,商家今后就可以将一部分文案工作交给AI来完成了。人类只需要从机器生产的多条文案中选出最合适的一条即可,生产效率将大幅提升。



1秒钟20000条背后的奥妙



那么,如此强大的“AI智能文案”究竟是如何炼成的呢?它背后到底有哪些玄机?对此,雷锋网采访到了阿里妈妈产品技术部算法专家乞颜。

乞颜介绍,“AI智能文案”基于深度神经网络的sequence2sequence模型,融合了注意力机制、位置编码、copy机制等,实现了对商品逐词生成文案。相对于检索式文案推荐方式,逐词生成的方式可控性更好,可探索的解空间更大,但是也对生成文案的准确性、可读性、性能有极高的要求。

“AI智能文案”本质上是在模拟人类写作文案,因此训练数据分外重要,它直接决定了模型效果的好坏。目前阿里妈妈共获取了约上亿条文案数据,但这些数据良莠不齐,需要通过人工+机器半自动清洗,最终筛选出数百万条优质文案用于训练。这些文案几乎覆盖了淘宝平台上的所有类目和商品。

模型通过对位置信息进行编码,改变每个词生成时的概率分布,可实现长度可控。“因为目前生成的粒度是基于词而不是基于字,所以目前只能做到词数可控”,乞颜向雷锋网介绍道。

值得一提的是,作为一项深度学习逻辑下的产品,阿里妈妈“AI智能文案”支持实时在线学习,可以通过不断增加的优秀文案样本量,来提升自身的文案产出能力,满足用户的需求。

智能文案服务于商家和运营的同时,商家和运营的选择结果也会回流。回流的数据被用来训练一个二分类的质量控制模型,有点像对抗生成网络里的判别器,对智能文案生成网络的结果进行二分类判别。这个质量控制模型本质上是在拟合人对生成结果的判断。随着数据的不断积累,质量控制模型对结果的判断会更加准确,同时可以更好的指导生成网络的迭代。

短标题的生成机制和智能文案有所不同。乞颜向雷锋网介绍,目前短标题生成基于规则和理解,后台需要对输入商品进行分析,识别出其中的品类词、材质、风格、品牌等属性信息,而后按照一定的模版进行拼接,最后对候选集合进行可读性打分,选出可读性得分最高的文案。

这种设计的初衷是因为短标题句式比较简单,同时词数较少。用模版的方法效率很高,大大高于基于深度神经网络的方式。同时,在保证命名实体识别准确的前提下,模版+规则的方法准确率也高于基于神经网络端到端的方法。

据雷锋网了解,目前阿里妈妈“AI智能文案”每天的使用量接近百万,除了淘宝天猫的广告主与商家,也服务于聚划算、魅力惠、1688等电商平台,并跟达摩院有一些文字应用、视频字幕相关的合作。阿里妈妈方面介绍,“AI智能文案”目前正在扩展文案风格,做一些不同语种的尝试,后续会在阿里的服务市场中,作为单独的工具对外开放。



将技术与创意融合


这款“AI智能文案”产品隶属于阿里妈妈海棠创意中心,是海棠创意中心将技术与创意融合的又一次重要尝试。去年,海棠创意中心曾推出了一项“智能banner”功能,帮商家大幅提升了Banner的设计效率与投放效果。

无论是UI、icon或Banner,尺寸适配一直是头疼的问题。App与icon要兼容不同分辨率的尺寸。Banner也同样,要兼顾许多不同的广告位。设计师在耗费巨大精力适配尺寸的同时,需要承担尺寸变更的风险。譬如淘宝改版改变了广告位尺寸,商家就要修改所有的Banner尺寸,这是一项非常繁重的工作。

为了突破这个瓶颈,海棠创意中心推出了“全尺寸智能适配”功能,支持数以千计的Banner模板全智能适配,并且保证设计的高度还原、无错位,任意尺寸的图形都足够高清。

“AI智能文案”让阿里妈妈在将技术与创意融合的道路上又迈进了一步。不过阿里妈妈也清楚地认识到,现阶段智能文案生成的内容,都是基于对人类创造的海量优质内容进行深度学习的结果,人类的创造力是机器的奠基石,机器暂时还无法取替人类的创造力。营销AI的使命是帮助更多人,降低优质内容的生成门槛,释放重复工作的劳动力,达到营销效果的最大化,让人类可以有更充沛的精力投入到富有创造性的工作中。

登录查看更多
5

相关内容

阿里妈妈是阿里巴巴公司旗下的一个全新的互联网广告交易平台。主要针对网站广告的发布和购买平台。它首次引入“广告是商品”的概念,让广告第一次作为商品呈现在交易市场里,让买家和卖家都能清清楚楚地看到。
【CVPR2020】时序分组注意力视频超分
专知会员服务
30+阅读 · 2020年7月1日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
【CVPR2020-Facebook AI】前置不变表示的自监督学习
专知会员服务
46+阅读 · 2020年4月19日
怎样用声纹识别,提升智能硬件产品的用户体验?
人人都是产品经理
6+阅读 · 2018年8月27日
【前沿】AI文案通过图灵测试!一秒生成2万条广告神器问世
阿里给程序员准备的开源年货,你收到了吗?
前端大全
3+阅读 · 2018年1月23日
21个经典案例带你解密机器学习2.0
AI前线
7+阅读 · 2017年11月28日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Arxiv
4+阅读 · 2018年12月20日
Arxiv
8+阅读 · 2018年11月27日
Arxiv
3+阅读 · 2018年10月25日
VIP会员
相关资讯
Top
微信扫码咨询专知VIP会员