图文并茂、生动有趣,“数据故事”自动生成系统实现可视化创新

2020 年 7 月 1 日 AI科技评论

日前,一款能够自动创建 “数据故事” 的智能在线系统 CalliopeTM,引起了广泛关注。不同于自然语言生成技术,该系统提供了更加有趣强大的功能:能够根据用户上传的结构化数据,自动分析数据内涵,一键生成与之相对应且图文并茂的 “数据故事”,这是可视化领域中的又一创新。
到底什么是 “数据故事” 呢?“故事” 我们知道是通过叙述的方式讲一个带有寓意的事件,或是陈述一件往事。而 “数据故事” 则是通过叙述的方式按照一定的逻辑关系讲述数据中所蕴含的内在信息。怎样将数据生动的描述出来,成为讲好一个数据故事的关键。
2006年,瑞典卡罗林斯卡学院 国际卫生学教授 Hans Rosling 博士通过 BBC,TED talk 等媒体向世人展现了数据故事的魅力:
从上述案例不难看出,一个好的数据故事不仅能让原本复杂的数据变得通俗易懂,并通过数据支撑让叙事本身变得更加真实可信,也能够更加深入的揭示数据内涵,让人过目难忘,印象深刻。
因此,数据故事在新闻传媒、教育科研、商务智能等诸多领域具有广泛应用。然而创建一个数据故事并不容易,要求用户具备数据分析、可视化、及故事叙述等多方面能力。Calliope系统利用人工智能技术大大降低了创建数据故事的技术门槛,让创作一个高质量的数据故事变得不再困难。
据笔者了解,CalliopeTM 系统采用了先进的人工智能生成模型,通过自动探索数据空间,洞察、挖掘、并关联具有前后逻辑关系的信息片段,从而自动生成围绕数据主题的故事线。除此之外,该系统还打造了一系列可视化图表及自然语言自动生成技术,能够根据数据内涵自动创建图文并茂的可视化图表,从而实现了对故事线的直观展示。
为了让所生成的数据故事更易于分享, CalliopeTM系统还提供了多种数据故事的展现形式,以方便用户在各种类型的终端设备上加以显示分享。
目前,CalliopeTM 公众平台免费向全网有用户公开,用户可以登陆 “https://datacalliope.com” 注册使用(如上面的视频所示)。
经笔者亲试,Calliope 公众平台的功能虽然有所限制,例如,只允许用户上传大小不超过 1MB 的 CSV 文件,故事生成算法也做了一定程度的简化,对数据格式有较为严格的要求等,但该系统仍然能够生成较为有趣的静态数据故事,同时也支持数据故事的在线分享与发布,为用户提供了一个便捷高效的可视化内容生成工具,是可视化领域又一值得关注的创新。


招 聘


AI 科技评论希望能够招聘 科技编辑/记者 一名

办公地点:北京

职务:以跟踪学术热点、人物专访为主

工作内容:

1、关注学术领域热点事件,并及时跟踪报道;

2、采访人工智能领域学者或研发人员;

3、参加各种人工智能学术会议,并做会议内容报道。

要求:

1、热爱人工智能学术研究内容,擅长与学者或企业工程人员打交道;

2、有一定的理工科背景,对人工智能技术有所了解者更佳;

3、英语能力强(工作内容涉及大量英文资料);

4、学习能力强,对人工智能前沿技术有一定的了解,并能够逐渐形成自己的观点。


感兴趣者,可将简历发送到邮箱:jiangbaoshang@yanxishe.com
点击"阅读原文",直达“ICML  交流小组”了解更多会议信息。
登录查看更多
1

相关内容

自然语言生成(NLG)是自然语言处理的一部分,从知识库或逻辑形式等等机器表述系统去生成自然语言。这种形式表述当作心理表述的模型时,心理语言学家会选用语言产出这个术语。自然语言生成系统可以说是一种将资料转换成自然语言表述的翻译器。NLG出现已久,但是商业NLG技术直到最近才变得普及。自然语言生成可以视为自然语言理解的反向: 自然语言理解系统须要厘清输入句的意涵,从而产生机器表述语言;自然语言生成系统须要决定如何把概念转化成语言。
大规模时间序列分析框架的研究与实现,计算机学报
专知会员服务
58+阅读 · 2020年7月13日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
科研人员提出海量虚拟数据生成新方法
中科院之声
6+阅读 · 2019年9月25日
GAN零基础入门:从伪造视频到生成假脸
新智元
13+阅读 · 2019年6月18日
微软全新视频索引器:机器帮你轻松看懂视频
微软研究院AI头条
5+阅读 · 2019年2月1日
最有趣的机器学习可视化图集
AI前线
5+阅读 · 2018年10月8日
你真的会用 t-SNE 么?有关 t-SNE 的小技巧
专知
58+阅读 · 2018年5月28日
“诗画合一”的跨媒体理解与检索
深度学习大讲堂
3+阅读 · 2018年3月6日
可视化多维数据的艺术
论智
10+阅读 · 2018年1月23日
手把手 | 生成式对抗网络(GAN)之MNIST数据生成
数说工作室
10+阅读 · 2017年7月31日
如何用Python做舆情时间序列可视化?
CocoaChina
11+阅读 · 2017年7月21日
高效使用 Python 可视化工具 Matplotlib
Python开发者
8+阅读 · 2017年7月3日
Image Segmentation Using Deep Learning: A Survey
Arxiv
44+阅读 · 2020年1月15日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
6+阅读 · 2018年4月21日
Arxiv
151+阅读 · 2017年8月1日
VIP会员
相关资讯
科研人员提出海量虚拟数据生成新方法
中科院之声
6+阅读 · 2019年9月25日
GAN零基础入门:从伪造视频到生成假脸
新智元
13+阅读 · 2019年6月18日
微软全新视频索引器:机器帮你轻松看懂视频
微软研究院AI头条
5+阅读 · 2019年2月1日
最有趣的机器学习可视化图集
AI前线
5+阅读 · 2018年10月8日
你真的会用 t-SNE 么?有关 t-SNE 的小技巧
专知
58+阅读 · 2018年5月28日
“诗画合一”的跨媒体理解与检索
深度学习大讲堂
3+阅读 · 2018年3月6日
可视化多维数据的艺术
论智
10+阅读 · 2018年1月23日
手把手 | 生成式对抗网络(GAN)之MNIST数据生成
数说工作室
10+阅读 · 2017年7月31日
如何用Python做舆情时间序列可视化?
CocoaChina
11+阅读 · 2017年7月21日
高效使用 Python 可视化工具 Matplotlib
Python开发者
8+阅读 · 2017年7月3日
Top
微信扫码咨询专知VIP会员