【ChatGPT系列报告】ChatGPT类聊天AI在医疗端的使用报告

ChatGPT医学领域表现杰出，专业性凸显　　ChatGPT是一个交互式人工智能模型，在医学领域，ChatGPT可以用于辅助医生进行疾病诊断、医疗保健管理等方面。从文献上可以看出，ChatGPT专业性是有保障的。1.具备合格的医学水平，GPT-4针对USMLE的测试准确率高达78.63%，能够对患者的医疗咨询问题提供准确的回复。2.ChatGPT能够处理多科室的复杂病例，克服了不同科室之间的专业壁垒。3.ChatGPT在使用上没有时间和空间的限制，回复速度快，内容丰富，患者满意度较高。诚然，我们也应该注意到相关的劣势，仍存在可提升的空间。目前ChatGPT在针对中国地区的医疗问题时，回复准确性还未达到最佳性能，存在继续开发空间。此外，ChatGPT存在提供误导性错误答案的可能性。最后，由于ChatGPT无法获取医学影像信息，其提出的建议可能存在局限性。　　实用性测试：各类聊天AI达到实用级别，回复相对准确，还兼具患者安抚性　　目前已进入市场的三种不同的主流AI交互软件是ChatGPT（OpenAI），NewBing（Microsoft），文心一言（百度）。其中ChatGPT包含GPT-3.5和GPT-4两种模式，NewBing（精准，平衡和创造三种模式）。因此我们用病例作为测试，以此来真实还原患者咨询场景。我们选取的常见的高血压，选取一个网上的病例作为样本，分别将病例输入到各模型，并结合指南和医生意见做对比分析。综合测试结果，各模型都有优劣，其中ChatGPT4.0表现亮眼。　　ChatGPT4.0：GPT-4建议跟随原医生诊断用药，同时向患者建议　　要长期监测血压和尿酸，并通过改变生活模式的方式来降低血压。此外GPT-4提供的建议更具可读性，建议内容与医生基本一致，且建议内容更多，对患者的安抚性会更强，基本达到医生水平。　　GPT-3.5和文心一言均建议患者通过药物控制高血压，在此之外GPT-3.5也在生活习惯方面给到来患者建议。　　相较于其它的AI交互软件，NewBing并没有直接给出诊断建议，而是通过搜索根据互联网已有信息对患者的情况进行分析，并且提供了相关信息来源。　　应用场景：AI使C端医疗可及性大大提升，有望带来互联网医疗、基层医疗服务质量升级　　从以上两章可以得出结论，ChatGPT类聊天AI在医疗端是兼具专业性与实用性的。　　专业性上，ChatGPT4.0的论文测试显示其在各地区考试中都能获得良好的成绩，并且综合性和专科性医学问题都有良好表现。可以说是初步具备合格的医疗水平，并且随着影像/检验数据分析的迭代升级，提升空间巨大。　　实用性上，从我们测试的高血压患者病例中可以看到，主流的几款聊天AI，无论是ChatGPT、Newbing还是文心一言，都能够对患者做出相应的指导，并提示最终需要临床医生指导。但对于一般患者而言，医疗的可及性大大增加，因为其操作的方便性，使用体验也大幅升级。