Large language models (LLMs) have emerged as a powerful technology, and thus, we have seen widespread adoption and use on software engineering teams. Most often, LLMs are designed as "general purpose" technologies meant to represent the general population. Unfortunately, this often means alignment with predominantly Western Caucasian narratives and misalignment with other cultures and populations that engage in collaborative innovation. In response to this misalignment, there have been recent efforts centered on the development of "culturally-informed" LLMs, such as ChatBlackGPT, that are capable of better aligning with historically marginalized experiences and perspectives. Despite this progress, there has been little effort aimed at supporting our ability to develop and evaluate culturally-informed LLMs. A recent effort proposed an approach for developing a national alignment benchmark that emphasizes alignment with national social values and common knowledge. However, given the range of cultural identities present in the United States (U.S.), a national alignment benchmark is an ineffective goal for broader representation. To help fill this gap in this US context, we propose a replication study that translates the process used to develop KorNAT, a Korean National LLM alignment benchmark, to develop CIVIQ, a Cultural Intelligence and Values Inference Quality benchmark centered on alignment with community social values and common knowledge. Our work provides a critical foundation for research and development aimed at cultural alignment of AI technologies in practice.


翻译:大语言模型(LLMs)已成为一项强大的技术,因此在软件工程团队中得到了广泛采用和应用。大多数情况下,LLMs被设计为“通用目的”技术,旨在代表普通人群。然而,这通常意味着其与以西方白人为主流的叙事保持一致,而与参与协作创新的其他文化和群体存在错位。针对这种错位,近期出现了围绕开发“文化感知型”LLMs的努力,例如ChatBlackGPT,这类模型能够更好地与历史上被边缘化的经验和观点对齐。尽管取得了这些进展,但在支持我们开发和评估文化感知型LLMs的能力方面,相关努力仍然不足。最近的一项研究提出了一种开发国家对齐基准的方法,强调与国家社会价值观和常识的对齐。然而,考虑到美国(U.S.)存在的多种文化身份,国家对齐基准对于实现更广泛代表性而言是一个无效的目标。为填补美国背景下的这一空白,我们提出一项复制研究,将用于开发KorNAT(韩国国家LLM对齐基准)的过程进行转化,以开发CIVIQ——一个以社区社会价值观和常识对齐为核心的文化智能与价值观推断质量基准。我们的工作为实践中AI技术的文化对齐研究与开发提供了关键基础。

0
下载
关闭预览

相关内容

【AAAI2024】公平感知的Transformer模型结构剪枝
专知会员服务
43+阅读 · 2023年12月27日
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员