「2018AI自适应教育行业研究报告」于2019年1月14日新鲜出炉,目前早鸟优惠价¥599,截止到1月20日恢复原价¥699,教育科技研究者、创业者、教育从业者、投资人必看,扫码了解详情。
▲点击上方 雷锋网 关注
文 | 王金旺
来自雷锋网(leiphone-sz)的报道
机器人记者要崛起了……,看到这个消息,首先,我是拒绝的。
据纽约时报报道,目前,彭博社发布的新闻内容中约有三分之一是使用一款名为Cyborg的AI写作机器人完成的,该机器人能够协助记者每季度完成数千篇公司财务报告相关文章。
据悉,目前,Cyborg可以自动对一份财报进行剖析,并提炼出相关事件和数据迅速成文。据彭博社主编John Micklethwait透露,“目前,AI写作机器人应用于金融领域相对更成熟。”
机器人记者的概念早已提出,目前包括彭博社、美联社、华盛顿邮报、洛杉矶时报都有应用。澳大利亚版卫报在今年1月31日首次尝试使用机器人辅助写作,并发表了一篇名为《Political donations plunge to $16.7m – down from average $25m a year》,部分摘录如下:
Australian political parties declared donations worth $16.7m in the 2017-18 financial year, according to the latest figures from the Australian Electoral Commission.
This amount is lower than usual, with donations averaging $25.2m a year over the past 11 years.
The largest donation overall, $2.3m, was made by Vapold Pty Ltd to the Liberal party.
The party with the most donations was the Liberal party, which declared $7.6m, followed by the Labor party with $7.1m.
The Labor party also declared $33.2m in “other receipts”, which includes money received from investments, but also includes money from party fundraisers where people pay for event tickets in lieu of donations.
可见,在语法准确性上水平已经很高,当然,正如前文提到,现在机器人写作虽然在金融领域应用相对较为成熟,但在一些大型稿件中,主流观念仍是提倡「人机协作」的概念,即机器人辅助写作。
不仅在国外,国内也早早开始尝试应用AI写作机器人。据雷锋网了解,早在2015年,新华社就已推出可以批量编写新闻的写作机器人「快笔小新」,「快笔小新」的写稿流程由数据采集、数据分析、生成稿件、编发四个环节组成,这一机器人适用于体育赛事、经济行情、证券信息等快讯、简讯类稿件的写作。
随着传统媒体转型及自媒体的崛起,新闻写作中的“抢发”成为被尤其突出的特点之一。由于在写作标准化消息时,机器人写作拥有快速成文的特点,国内媒体也逐渐引入写作机器人。
2015年9月,腾讯财经发布写作机器人「Dreamwriter」;
2016年5月30日,第一财经发布写作机器人「DT稿王」;
2016年8月,里约奥运会期间,今日头条写稿机器人「张小明」以2秒的生成时间发布着赛事报道,平均每天发布30多篇稿件;
2017年1月17日,南方都市报社写作机器人「小南」正式上岗,推出第一篇共300余字的春运报道。
在工作效率方面,2016年韩国一家新闻机构投入使用的机器人0.3秒写出一篇股市行情稿件;2016年8月,里约奥运会期间,今日头条的「张小明」2秒内生成稿件并完成发布;2017年1月,《南方都市报》写稿机器人「小南」首篇300余字的稿件在一秒内成文;第一财经的「DT稿王」,每秒写28个字, 一分钟写1680字。
目前为止,机器人跟记者之间的关系是一种分工协作的关系。机器人现在不具有逻辑思维的能力,也不具备深度总结的能力,机器人只能把一个基本的新闻事实描述清楚,但是记者就可以写深度报道,比如说中国足球,记者可以经过自己的分析,写中国足球这几十年来落后的原因,也可以总结出几条观点,但是机器人就很难实现这样的能力。所以记者应该是从事有创造性的、高智商的稿件的创作,而把一些重复的、低层次的稿件创作的活动交给机器人完成,即记者和机器人是一种分工协作的关系。
另外一个不同点是,记者在写一个稿件的时候,很清楚地知道自己在写什么,知道自己要表达的语义。但实际上机器人在写稿件的时候,虽然机器人把每一个句子都写出来了,但它不知道自己要写什么,这是最大的一个不同。即机器人没有理解自己的稿件,包括机器人写诗,或者写各种歌词的时候,它虽然把那个语言写出来了,但是它并没有真正理解其中语言,所以这是一个比较大的不同。
北京大学计算机科学技术研究所研究员万小军参与研发了国内包括今日头条的「张小明」和南方都市报的「小南」在内的多款机器人记者,在此前接受雷锋网采访时表示,“在我眼里,写稿机器人就是一个程序,目前看到的更多的还是不足。”
现在的机器人写稿仍以摘选稿件中句子为主,与现在记者能力相差甚远,而且主要仍在金融领域应用。在2017年接受雷锋网采访时候,万小军表示,因为现在做摘要也好,综述也好,主要还是直接把句子挑选出来,对句子没有改动,下一步希望对句子做很大的改动,保持语义不变,这就是复述。我们期望做到语言风格的转换,例如古龙的风格还是金庸的风格。另一个是在写稿中加入态度和立场,让稿件更加生动和具有人性。
其实,机器人记者与我们日常所见的足式机器人或轮式机器人有很大不同,目前的机器人记者更应该称为AI协作系统,没有具体的实体外形,形式上类似现在的各大平台上的聊天机器人。
人机对话中的语言生成和机器人写稿的语言生成有什么不一样?
首先是长短不一样,人机对话中生成的回复文本一般比较短,多数情况下只生成一个句子,而机器人写稿则要生成包含多句话的完整文章,写稿过程中需要重点考虑篇章结构组织以及语句之间的连贯性;
其次,对话的生成要重点考虑跟多轮上下文的衔接,也就是「语境」,而写稿的时候没有这种考虑,能够把一件事情说清楚就行了;
最后,人机对话的语言表达可以比较口语化,但机器写稿倾向于使用比较规范和正式的语言表达。
相对而言,现在没手没脚的机器人记者不必考虑运动系统和各种实际环境场景化需求,最主要的是建立/训练更完善的算法模型,因而在一定程度上得以逆袭,并在短期内实现顺利商用。早在2014年,机器人写稿技术研发公司Automated Insight全年生产了10亿条新闻。
随着大数据时代的到来,信息量急剧增涨,如何在大数据时代准确筛选数据、筛选信息更为困难,采用机器人代替人工进行数据筛选和信息筛选已经成为必然趋势。
或许,是时候考虑如何与机器人协作、相处了,但人类记者不用害怕。
◆ ◆ ◆
推荐阅读
「2018AI自适应教育行业研究报告」于2019年1月14日新鲜出炉,目前早鸟优惠价¥599,截止到1月20日恢复原价¥699,教育科技研究者、创业者、教育从业者、投资人必看,扫码了解详情。