题目: Knowledge-Enriched Visual Storytelling
摘要: 故事具有多样性和高度个性化,为故事生成提供了很大的可能输出空间。现有的端到端方法产生单调的故事,因为它们仅限于单个训练数据集中的词汇和知识。本文介绍了KG-Story,一个三阶段的框架,它允许故事生成模型利用外部知识图生成有趣的故事。KG-Story从输入提示中提取一组有代表性的单词,利用外部知识图丰富单词集,最后根据丰富的单词集生成故事。这种蒸馏-浓缩-生成框架不仅允许在浓缩阶段使用外部资源,还允许在蒸馏和生成阶段使用外部资源。在本文中,我们展示了KG故事在视觉讲故事方面的优越性,输入提示是五张照片的序列,输出是一个短篇故事。根据人类排名评估,KG Story生成的故事平均排名高于最先进的系统。
作者简介: Chao Chun Hsu,美国科罗拉多大学博德分校计算机科学系研究助理。
Lun-Wei Ku,中国科学院信息科学研究所博士。