报告主题: NLP for healthcare: Feature engineering and model diagnostics
摘要: NLP在临床文本的应用是一个极具挑战性的问题。它语言不整合,缺乏适当语法,对同一实体的提及范围广泛,歧义有限以及对高度特定的领域规则的要求之苦。 当在Episource上构建具有高精度和可召回性的NLP解决方案时,该公司得出的结论是:医疗NLP需要进行大量的功能工程设计,并特别注重合并特定于域的功能。处理否定和提到的疾病也要与人类的解读相符。例如,对于“患者患有糖尿病”与“患者必须遵循健康饮食避免糖尿病”的先进系统,能够理解“糖尿病”的区别非常重要。提到一种疾病,“真正的”提及只是其中之一。 Manas Ranjan Kar引导您解决典型临床文本领域中NLP所面临的挑战,并探索对于此类问题陈述的特征工程似乎非常有效的广泛技术。您将深入研究为NLP模型执行自动模型诊断,以确保特定领域的功能工程能够提高模型技能。
邀请嘉宾: Manas Ranjan Kar是美国医疗保健公司Episource的高级经理,他领导NLP和数据科学实践,从事语义技术和计算语言学(NLP)的工作,构建算法和机器学习模型,研究数据科学期刊,并设计安全产品后端在云中。他在医疗保健,食品和饮料,金融和零售领域设计了多种商业NLP解决方案。 Manas致力于功能性架构大型业务流程自动化,并使用NLP和ML从结构化和非结构化数据中获得深刻见解。他为gensim和Conceptnet 5等NLP库以及在Data Science Central,LinkedIn和他的博客Unlock Text等论坛上定期发布有关NLP的博客做出了贡献。玛纳斯定期在会议和聚会上谈论NLP和文本分析,例如PyCon印度和PyData,并在IIM Lucknow和MDI Gurgaon教授实践课程,并指导了ISB海得拉巴,BITS Pilani和Madras学校等学校的学生经济学。