In the landscape of Fact-based Judgment Prediction and Explanation (FJPE), reliance on factual data is essential for developing robust and realistic AI-driven decision-making tools. This paper introduces TathyaNyaya, the largest annotated dataset for FJPE tailored to the Indian legal context, encompassing judgments from the Supreme Court of India and various High Courts. Derived from the Hindi terms "Tathya" (fact) and "Nyaya" (justice), the TathyaNyaya dataset is uniquely designed to focus on factual statements rather than complete legal texts, reflecting real-world judicial processes where factual data drives outcomes. Complementing this dataset, we present FactLegalLlama, an instruction-tuned variant of the LLaMa-3-8B Large Language Model (LLM), optimized for generating high-quality explanations in FJPE tasks. Finetuned on the factual data in TathyaNyaya, FactLegalLlama integrates predictive accuracy with coherent, contextually relevant explanations, addressing the critical need for transparency and interpretability in AI-assisted legal systems. Our methodology combines transformers for binary judgment prediction with FactLegalLlama for explanation generation, creating a robust framework for advancing FJPE in the Indian legal domain. TathyaNyaya not only surpasses existing datasets in scale and diversity but also establishes a benchmark for building explainable AI systems in legal analysis. The findings underscore the importance of factual precision and domain-specific tuning in enhancing predictive performance and interpretability, positioning TathyaNyaya and FactLegalLlama as foundational resources for AI-assisted legal decision-making.


翻译:在基于事实的判决预测与解释(FJPE)领域中,依赖事实数据对于开发稳健且现实的AI驱动决策工具至关重要。本文介绍了TathyaNyaya,这是为印度法律背景量身定制的最大规模FJPE标注数据集,涵盖印度最高法院及各高等法院的判决。该数据集名称源自印地语词汇“Tathya”(事实)和“Nyaya”(正义),其独特设计聚焦于事实陈述而非完整法律文本,反映了现实司法过程中事实数据驱动结果的特点。作为该数据集的补充,我们提出了FactLegalLlama,这是基于LLaMa-3-8B大语言模型(LLM)进行指令调优的变体,专门针对FJPE任务中生成高质量解释进行了优化。通过在TathyaNyaya的事实数据上进行微调,FactLegalLlama将预测准确性与连贯且上下文相关的解释相结合,满足了AI辅助法律系统对透明度和可解释性的关键需求。我们的方法结合了用于二元判决预测的Transformer模型与用于解释生成的FactLegalLlama,构建了一个推进印度法律领域FJPE的稳健框架。TathyaNyaya不仅在规模和多样性上超越了现有数据集,还为构建法律分析中可解释的AI系统设立了基准。研究结果强调了事实精确性和领域特定调优在提升预测性能与可解释性方面的重要性,确立了TathyaNyaya和FactLegalLlama作为AI辅助法律决策的基础性资源地位。

0
下载
关闭预览

相关内容

法律是国家制定或认可的,由国家强制力保证实施的,以规定权利和义务为内容的具有普遍约束力的社会规范。
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
读论文Discriminative Deep Metric Learning for Face and KV
统计学习与视觉计算组
12+阅读 · 2018年4月6日
NLP自然语言处理(二)——基础文本分析
乐享数据DataScientists
12+阅读 · 2017年2月7日
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
VIP会员
相关资讯
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
读论文Discriminative Deep Metric Learning for Face and KV
统计学习与视觉计算组
12+阅读 · 2018年4月6日
NLP自然语言处理(二)——基础文本分析
乐享数据DataScientists
12+阅读 · 2017年2月7日
相关基金
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员