Social and behavioral determinants of health (SBDoH) have important roles in shaping people's health. In clinical research studies, especially comparative effectiveness studies, failure to adjust for SBDoH factors will potentially cause confounding issues and misclassification errors in either statistical analyses and machine learning-based models. However, there are limited studies to examine SBDoH factors in clinical outcomes due to the lack of structured SBDoH information in current electronic health record (EHR) systems, while much of the SBDoH information is documented in clinical narratives. Natural language processing (NLP) is thus the key technology to extract such information from unstructured clinical text. However, there is not a mature clinical NLP system focusing on SBDoH. In this study, we examined two state-of-the-art transformer-based NLP models, including BERT and RoBERTa, to extract SBDoH concepts from clinical narratives, applied the best performing model to extract SBDoH concepts on a lung cancer screening patient cohort, and examined the difference of SBDoH information between NLP extracted results and structured EHRs (SBDoH information captured in standard vocabularies such as the International Classification of Diseases codes). The experimental results show that the BERT-based NLP model achieved the best strict/lenient F1-score of 0.8791 and 0.8999, respectively. The comparison between NLP extracted SBDoH information and structured EHRs in the lung cancer patient cohort of 864 patients with 161,933 various types of clinical notes showed that much more detailed information about smoking, education, and employment were only captured in clinical narratives and that it is necessary to use both clinical narratives and structured EHRs to construct a more complete picture of patients' SBDoH factors.


翻译:健康的社会和行为决定因素(SBDoH)在影响人们的健康方面起着重要作用。在临床研究研究中,特别是比较有效性研究中,未能调整SBDoH因素可能会在统计分析和机器学习模型中引起混乱问题和分类错误。然而,由于当前电子健康记录系统缺乏结构化的SBDoH信息,因此在临床健康记录(EHR)系统中,SBDoH因素在临床结果中研究SBDoH因素有限,而许多SBDoH信息记录在临床描述中都有记录。因此,自然语言处理(NLP)是从非结构化临床文本中提取此类信息的关键技术。然而,在SBH因素中,没有针对SBDoP因素的成熟的临床NLP系统,侧重于SBDo。 在这项研究中,我们检查了两种以最先进的变压器为基础的NLPH因素,从临床记录中提取SBDH概念,在肺癌诊断组中采用最完善的SBDOH概念,SLH数据在NLPSVP的临床分析结果和EHR的分类中也分别显示,在SBH标准的EL的ERC的S-ROCA中,在S-CS-RB结果中,在BCSBCSBSBSBS-CS-CS-CS-CSBSBSBSB结果中显示,在B结果中显示,在BBBBB结果中,在BS-CS-CS-CS-CS-CSDRBB结果中显示,在BRBBBBBBBBBBB中, 和B的多数中显示,在B中,在BRB中显示,在BBBBBBBSDA中显示,在BBBBBBBBBRB中,在BBRA中,在B中,在B中,在BRBSDRBSDA中,在BBB中,在B中,在BRBA中,在BRA中也显示,在BA中也显示,在BA中也显示,在BSDRA中,在BSDRA中,在BS-RA中,在BSBSD

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
专知会员服务
60+阅读 · 2020年3月19日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
已删除
将门创投
6+阅读 · 2019年11月21日
计算机 | IUI 2020等国际会议信息4条
Call4Papers
6+阅读 · 2019年6月17日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Nature 一周论文导读 | 2019 年 2 月 21 日
科研圈
14+阅读 · 2019年3月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Arxiv
0+阅读 · 2021年10月11日
Sparse Sequence-to-Sequence Models
Arxiv
5+阅读 · 2019年5月14日
VIP会员
相关VIP内容
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
专知会员服务
60+阅读 · 2020年3月19日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
相关资讯
已删除
将门创投
6+阅读 · 2019年11月21日
计算机 | IUI 2020等国际会议信息4条
Call4Papers
6+阅读 · 2019年6月17日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Nature 一周论文导读 | 2019 年 2 月 21 日
科研圈
14+阅读 · 2019年3月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Top
微信扫码咨询专知VIP会员