Mental health disorders affect hundreds of millions globally, and the Web now serves as a primary medium for accessing support, information, and assessment. Large language models (LLMs) offer scalable and accessible assistance, yet their deployment in mental-health settings remains risky when their reasoning is incomplete, inconsistent, or ungrounded. Existing psychological LLMs emphasize emotional understanding or knowledge recall but overlook the step-wise, clinically aligned reasoning required for appraisal, diagnosis, intervention planning, abstraction, and verification. To address these issues, we introduce MentraSuite, a unified framework for advancing reliable mental-health reasoning. We propose MentraBench, a comprehensive benchmark spanning five core reasoning aspects, six tasks, and 13 datasets, evaluating both task performance and reasoning quality across five dimensions: conciseness, coherence, hallucination avoidance, task understanding, and internal consistency. We further present Mindora, a post-trained model optimized through a hybrid SFT-RL framework with an inconsistency-detection reward to enforce faithful and coherent reasoning. To support training, we construct high-quality trajectories using a novel reasoning trajectory generation strategy, that strategically filters difficult samples and applies a structured, consistency-oriented rewriting process to produce concise, readable, and well-balanced trajectories. Across 20 evaluated LLMs, Mindora achieves the highest average performance on MentraBench and shows remarkable performances in reasoning reliability, demonstrating its effectiveness for complex mental-health scenarios.


翻译:心理健康障碍影响着全球数亿人口,而网络已成为获取支持、信息和评估的主要媒介。大语言模型(LLMs)提供了可扩展且易于获取的辅助手段,然而当它们的推理不完整、不一致或缺乏依据时,在心理健康场景中的部署仍存在风险。现有的心理学大语言模型侧重于情感理解或知识回忆,却忽视了评估、诊断、干预规划、抽象归纳及验证所需的、与临床实践对齐的逐步推理过程。为解决这些问题,我们提出了MentraSuite,一个用于提升可靠心理健康推理的统一框架。我们构建了MentraBench,一个涵盖五个核心推理维度、六项任务及13个数据集的综合性基准,从简洁性、连贯性、幻觉规避、任务理解和内部一致性五个维度评估任务性能与推理质量。我们进一步推出了Mindora,这是一个通过混合SFT-RL框架进行优化的后训练模型,采用不一致性检测奖励机制以确保忠实且连贯的推理。为支持训练,我们通过一种新颖的推理轨迹生成策略构建了高质量轨迹,该策略策略性地筛选困难样本,并应用结构化、以一致性为导向的改写过程,以生成简洁、可读且平衡性良好的轨迹。在评估的20个大语言模型中,Mindora在MentraBench上取得了最高的平均性能,并在推理可靠性方面表现出色,证明了其在复杂心理健康场景中的有效性。

0
下载
关闭预览

相关内容

健康是指一个人在身体、精神和社会等方面都处于良好的状态。 健康包括两个方面的内容:

一是主要脏器无疾病,身体形态发育良好,体形均匀,人体各系统具有良好的生理功能,有较强的身体活动能力和劳动能力,这是对健康最基本的要求;

二是对疾病的抵抗能力较强,能够适应环境变化,各种生理刺激以及致病因素对身体的作用。传统的健康观是“无病即健康”,现代人的健康观是整体健康,世界卫生组织提出“健康不仅是躯体没有疾病,还要具备心理健康、社会适应良好和有道德”。因此,现代人的健康内容包括:躯体健康、心理健康、心灵健康、社会健康、智力健康、道德健康、环境健康等。健康是人的基本权利。健康是人生的第一财富。
【NeurIPS2022】通过模型转换的可解释强化学习
专知会员服务
38+阅读 · 2022年10月4日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员