如今,语言的人工神经网络模型主要以提供强大的AI技术支撑而被人们所熟知和赞赏。这篇论文采取了不同的视角。通过一系列关于语言理解和产出的研究,它探讨了人工神经网络——除了在无数AI应用中发挥作用外——是否能作为准确的计算模拟人类语言使用的工具,从而成为语言科学的新核心方法论。 人类使用诸如言语、手势和身体动作等行为来在彼此之间传递信息。他们使用语言行为来传达知识、计划、情感、价值观等,更广泛地说,是为了在世界中实现目标,即改变他们所处环境的状态。例如,人类使用语言来更新其他人的信念、协调他们的活动,并共同完成任务。对我来说,能够描述人类如何学习和运用这种能力是科学探究最令人兴奋的目标。
指导我的研究的终极动机——其中很大一部分,截至今天,已在这篇论文中描述——是逆向工程人类通过语言行为交换信息的能力。我相信,实现这一目标将与创建一个能像人类一样使用语言并作为语言使用的计算理论模型的创造相一致。这一研究领域的见解和朝这一理想模型的进步——一个可控但完全自主的、在情境中基础的语言代理——将为更忠实地再现人类语言行为的语言技术的发展提供信息和刺激。 走向这个目标的道路漫长,而博士生的生活太短暂,无法走完。但我可以满怀喜悦地说,现在我有了一张地图和大致的路线。回顾过去和展望未来,这对我来说是我博士学习最令人兴奋和宝贵的成果。不管怎样,成为并作为一名科学家是一种服务形式,而我所服务的社群,无论是广泛定义的还是更狭隘的界定,完全对我的内在斗争、紧张和学习成果漠不关心——这也是合理的。地图可能不完美,路线当然是暂时的,我所迈出的步伐有时摇摇晃晃,但它们是我对“社群”的贡献,我将在这篇论文中自豪地概述它们。我希望能回顾这些页面时,看到一个更精细的路线,更多的步数,以及相同的成就感。