技术领域正在被大型语言模型(LLM)迅速改变,允许用户解决各种领域的实际应用。然而,由于语言、收入、数字意识和信息获取等因素,存在着数字鸿沟,可能使大量人口无法受益和促进这场技术革命。在微软,我们致力于使大型语言模型包括地球上的每个人。
本教程将通过介绍大规模多语言模型(MMLM)的最新研究,描述将语言技术扩展到世界上许多语言的各个方面。我们将涵盖数据收集、模型训练和微调等主题,负责任的人工智能问题,如公平、偏见和毒性,MMLMs背景下的语言多样性和评估,特别是关注非英语和低资源语言的问题。此外,我们还将讨论在该领域的语言社区中部署这些模型时的一些现实世界挑战。