书籍简介
2022年末,随着先进语言模型如ChatGPT的出现,自然语言生成(NLG)技术的突出地位得到了极大的提升。尽管这些发展在学术界和商业领域引起了广泛关注,但焦点主要集中在最新的创新上,常常忽视了NLG领域丰富的历史和基础性工作。本书旨在提供NLG的全面概述,不仅涵盖语言模型,还包括替代方法、用户需求、评估方法、安全性和测试协议,以及实际应用。本书基于数十年的NLG研究,旨在为研究人员和开发者提供宝贵的资源,提供的见解将超越当前技术格局,具有持久的相关性。 自然语言生成聚焦于数据到文本的转化,但也探讨了其他类型的NLG,如文本摘要。书中采取了整体化的NLG视角,关注用户需求(用户所寻求的)、设计、数据问题、测试、评估、安全性和伦理问题以及技术等多个方面。这一整体性方法是本书的独特之处,对于构建实际应用NLG系统的开发者,以及对应用型NLG感兴趣的学术界和研究人员具有重要价值。 作者曾于2000年共同编著了一本开创性的NLG书籍,他强调了高层次的概念和方法论,确保了本书内容的长久生命力和实用性。全书结构力求平衡技术深度与实践相关性,涵盖了基于规则和神经网络的NLG方法、用户需求、严谨的评估技术和安全考虑等章节。书中还通过探讨新闻学、商业智能、摘要生成和医学等领域的实际应用,展示了NLG的潜力和可扩展性。通过作者个人的轶事和经验实例,本书为NLG这一发展中的领域提供了独特且引人入胜的视角,是那些希望利用语言生成技术力量的读者不可或缺的指南。
封底内容
2022年末,随着先进语言模型如ChatGPT的出现,自然语言生成(NLG)技术的突出地位得到了极大的提升。尽管这些发展在学术界和商业领域引起了广泛关注,但焦点主要集中在最新的创新上,常常忽视了NLG领域丰富的历史和基础性工作。本书旨在提供NLG的全面概述,不仅涵盖语言模型,还包括替代方法、用户需求、评估方法、安全性和测试协议,以及实际应用。本书基于数十年的NLG研究,旨在为研究人员和开发者提供宝贵的资源,提供的见解将超越当前技术格局,具有持久的相关性。 自然语言生成聚焦于数据到文本的转化,但也探讨了其他类型的NLG,如文本摘要。书中采取了整体化的NLG视角,关注用户需求(用户所寻求的)、设计、数据问题、测试、评估、安全性和伦理问题以及技术等多个方面。这一整体性方法是本书的独特之处,对于构建实际应用NLG系统的开发者,以及对应用型NLG感兴趣的学术界和研究人员具有重要价值。 作者曾于2000年共同编著了一本开创性的NLG书籍,他强调了高层次的概念和方法论,确保了本书内容的长久生命力和实用性。全书结构力求平衡技术深度与实践相关性,涵盖了基于规则和神经网络的NLG方法、用户需求、严谨的评估技术和安全考虑等章节。书中还通过探讨新闻学、商业智能、摘要生成和医学等领域的实际应用,展示了NLG的潜力和可扩展性。通过作者个人的轶事和经验实例,本书为NLG这一发展中的领域提供了独特且引人入胜的视角,是那些希望利用语言生成技术力量的读者不可或缺的指南。
关于作者
Ehud Reiter是阿伯丁大学计算机科学教授,并曾担任Arria NLG(他共同创办的公司)的首席科学家。在这两个角色中,他一直致力于自然语言生成的研究工作。自1990年获得哈佛大学NLG博士学位以来,他一直从事NLG领域的研究,是该领域发表和被引用最多的作者之一。他已经发表了超过200篇学术论文和8项专利。他曾于2019至2022年担任计算语言学协会生成专项兴趣小组(SIGGEN)主席,并于2022年因其NLG工作的贡献获得了“时代测试奖”。