Recall the classical text generation works, the generation framework can be briefly divided into two phases: \textbf{idea reasoning} and \textbf{surface realization}. The target of idea reasoning is to figure out the main idea which will be presented in the following talking/writing periods. Surface realization aims to arrange the most appropriate sentence to depict and convey the information distilled from the main idea. However, the current popular token-by-token text generation methods ignore this crucial process and suffer from many serious issues, such as idea/topic drift. To tackle the problems and realize this two-phase paradigm, we propose a new framework named Sentence Semantic Regression (\textbf{SSR}) based on sentence-level language modeling. For idea reasoning, two architectures \textbf{SSR-AR} and \textbf{SSR-NonAR} are designed to conduct sentence semantic regression autoregressively (like GPT2/3) and bidirectionally (like BERT). In the phase of surface realization, a mixed-granularity sentence decoder is designed to generate text with better consistency by jointly incorporating the predicted sentence-level main idea as well as the preceding contextual token-level information. We conduct experiments on four tasks of story ending prediction, story ending generation, dialogue generation, and sentence infilling. The results show that SSR can obtain better performance in terms of automatic metrics and human evaluation.
翻译:回顾古典文本生成工作, 生成框架可以简略地分为两个阶段: \ textbf{idea 推理} 和\ textbf{表面实现} 。 设想推理的目标是根据句子递反(\ textbf{SSR-AR}) 的语法, 找出将在以下演讲/ 写字期间提出的主要想法。 地面实现的目的是安排最合适的句子, 以描述和传递从主思想中提取的信息。 然而, 目前流行的逐条制文本生成方法忽视了这一关键过程, 并受到许多严重问题的影响, 如想法/ 主题流流等。 为了解决问题并实现这一两阶段的模式, 我们提议一个新的框架, 名为“ 句子回归( textbf{SSR{SSR} ) ), 以句子递增 。 在地面实现阶段, 以句子混杂的语调( ) 以句子递减( ) 以句子递减为基准, 最终 将 预言, 将 人类 的 的 演算 演算 的 的 演进 的 的 演进 更 的 更 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的, 通过, 通过 的 的 以 以 以 以 更 更 的 更 的 的 的 的 的 的 的 的 的, 通过 的 的 的 的 的 的 的 的 的, 通过 的 的 的 更 的 的 更 的 的 的 以 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的, 通过 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的, 通过