任务型对话(TOD)主要对以下三个主任务进行评估:对话状态(信念状态)跟踪,对话管理(行动/决策预测)和影响生成。这种分解方案,是对每个子任务创建一个专用的模型。本文的研究者提出了一个单模型,端到端的模型方案。任务型对话中包含多轮对话。在 t 轮对话中,针对用户的输入(用符号Ut表示第 t 轮的用户输入),对话系统将会生成一个响应(用符号St表示响应输出)。研究者为了在推理期间生成响应,提出的SimpleTOD模型将前t-1轮对话的输入和响应,以上文的形式作为输入,其输入如Ct=[U0,S0,U1,S1,...,Ut]。最后将Ct作为输入,生成信念状态Bt。从公式1中获得到的信念状态,是一个特定领域的三元组:(domian,slot_name,value)。其中,domain是对话领域(如图1是餐厅的对话领域),slot_name是词槽,value是值(如图1,Price range:cheap,Area:center)。将信念三元组转换为SQL查询语句(select * from restaurant where pricerange=cheap and area=center),通过查询语句到数据库中检索,得到满足条件的结果(value count=6)。SimpleTOD将结果聚合,得到Dt。其中聚合后的结果Dt包含返回结果数量,以及是否预订状态信息(取决于实验设置)。最后,SimpleTOD将Ct,Bt,Dt整合单一序列输出,即At(即图1中粉红色文本框,文本框名标注着Action)。从公式2中获得的序列,是一个特定领域的三元组序列:(domian,action_type,slot_name)。Simple将所有的先验信息拼接成一个序列,生成一个非正则化的想要St。将信念状态和数据库搜索结果的信息相拼接,同时进行字典化,输出人类可阅读的文本。