数联医信杨紫陌:医疗数据现状混乱,实现数据应用之前先要做好数据治理|论坛演讲

2017 年 9 月 20 日 动脉网 杨娟

医疗对于人工智能具有强烈的潜在需求。目前,全球人工智能+医疗“基础+技术+应用”较为完整的产业结构已初步形成。新技术要想真正引起行业变革,不仅需要政策、技术、人才等多方面的协同配合,还需要企业的探索和时间的积累。为了探求健康医疗大数据和人工智能的未来发展和落地方案,2017年9月16日-17日,2017长江产业论坛(秋季)暨医疗健康大数据与人工智能大会在武汉会议中心盛大开启。


在本次大会上,成都数联医信科技有限公司的首席数据官杨紫陌,以《数据治理从医疗设备说起》为题,阐述了目前医疗数据的现状,数据治理的原因和方法,以及数联医信在医疗设备领域所做的数据管理实践。以下为动脉网整理的精彩演讲内容:


嘉宾介绍


成都数联医信科技有限公司首席数据官 杨紫陌女士


2013年毕业于电子科技大学。从本科阶段开始,一直从事网络科学与数据挖掘方面的研究,在国际SCI期刊发表论文十余篇,其中一篇入选ESI全球高引用论文,一篇被全球最顶尖的技术媒体MIT Technology Review(麻省理工技术评论)长篇专题报导(论文列表见后)。2012年,获第8届全国复杂网络学术会议最佳学生论文奖,系唯一获奖本科生。2013年,获得阿里巴巴校招“阿里星”。当年全国共7人获此殊荣,系其中唯一本科毕业生。在阿里集团先后负责电子邮件精准营销(淘宝)、商品实时推荐(淘宝)、线下淘宝搜索推荐(口碑网)、支付宝个性化首页(支付宝)等项目。系2014年-2015年支付宝全年个人绩效第一名(含并列),支付宝无线事业部全年个人绩效第一名。


首先,我想说明的是,数据治理是贯穿数据各个行业的,不仅仅局限于医疗设备里面,它可能贯穿的是医疗行业的各个数据,还包括很多其他的行业。

 

什么是大家心中好的数据?什么是一个你们觉得很想要的数据?我认为所有人都会这么想:我不管你以什么样的形式提供给我,我都希望数据库的数据是准确并且干净的。我需要的不仅仅是一个数据的结果,可能还需要一个配套管理这套数据的东西。而这个东西就是数据的操作规范,即所有针对这个数据的操作记录以及数据所有的权限管理。


医疗数据的现状


对于怎样应用数据,我们希望数据简单、容易查找,方便我们去做分析,去模拟和仿真。这是我们对一个好数据的期望。然而现在的医疗数据现状是什么样呢?


现在中国大大小小的医院里面,有成千上万种系统,每一个系统都有成百上千张表,它的结构非常的乱。比如患者的病历信息非常零乱,难以搜索筛查。以及在影像系统里面,影像本身就没有做任何的参数调整,所以我们说影像本身的数据是有偏差的。另外,药品的使用边界也不清晰,医生的操作也没有规范。

 

其实医疗行业很多的数据都是这样的,由于本身的不规范、没有标准,导致了数据虽然大但是很难应用。医疗数据本身是一个价值巨大的东西,但是由于内容混乱,根本无法发挥它的价值。我们有各种各样的信息系统,希望把所有的信息化整合在一起,但是这么多信息平台没有一个能够给出完整正确的数据。


为何要做数据治理?


怎么样解决数据治理的问题呢?很多人觉得数据治理是一个脏活累活,可能是需要一个个预处理,甚至花费很多人工成本。

 

我们先来看一下整个数据的发展史。最早是数据的生产,就拿医疗行业来说,随着这几十年信息化的发展,我们传统的数据也有了更好的方式,我们有了各种各样的信息,医疗数据有了一次完整的蜕变之旅


行业里很多专家对于医疗数据的设想都在应用,但这都是建立在本身拥有很好的数据的前提下,如果说不做前期数据治理和数据共享,是很难实现数据应用的。

 

为什么要做数据治理?原因在于目前医疗数据的现状非常混乱。我们希望通过整合医疗数据,规范医疗数据,形成医疗数据的通用语言,让它更方便的检索和分析。为什么在治理和应用中间还有一层共享?数据是一个很典型的1+1>2的东西。同时,它又是一个规模越大,发挥价值越巨大的东西。你告诉机器的数据量越大,机器给你的判断就会越精准,更方面我们做很多预测。


如何做数据治理?


如何做数据治理,把数据清洗补全,是不是有一个统一的标准就OK了呢?我认为这只是第一步。数据资产盘点和数据血缘治理,不仅仅是说把现在的污水清理掉,更重要的是把源头清理好。这套机制需要很多的专家经验,这样才能真正形成一套合理有效的数据机制。


整个数据治理,我认为有五个层面。最核心的层面一是业务数据,即对业务的理解。二是元数据清洗,三是数据标准化,四是数据集成共享,五是大数据融合管理平台。


数联医信用大数据管理医疗设备


数联医信主要是做医疗设备管理的公司。而医疗设备这个行业,我们可以看到,现在台账是比较混乱的,导致管理过程低效,售后服务受限,无法规范化巡检,存在质量隐患。如果利用数据来做分析,就相当于给每台设备一个身份证一样的东西。


我们需要统一它的品类,至少我们要知道这个医院有多少监护仪器是同一种东西。我们现在做设备的标准化主要就是做这样的一个东西,对整个医院台账元数据治理的步骤。

 

对于新进的设备,我们更多的是用它的品牌图像去识别这个数据的品类。我们识别了包括B超在内的多种设备,平均耗时和准确率还是不错的。因为我们可以做到品类的规范化,所以可以把很多的巡检和维修信息放在AR(增强现实)中,通过AR可以看到巡检项目有哪些,故障有哪些。

 

然后,通过了解设备之前的故障历史,包括这台设备的品类和型号对它未来的故障做预测,目前基于现在的数据,故障预测的准确率基可以做到94%点多。这些都是基于整个数据整理以后,得到的可视化的东西。如果说不去做数据处理,这些东西很难得到大规模的统计和分析。 


文|杨娟

微信|sukcrieel

添加时请注明:姓名-公司-职位

后台发送关键词即可获得相关好文

网站、公众号等转载请联系授权




¥19.9


¥14.9


¥19.9




点击文末左下方“阅读原文”,充值后进入小程序购买


近期推荐

 梳理30家Medical Mall 在50多年来的发展脉络,这会是国内地产商转型医疗最简单的方式吗?

 论坛干货分享|医疗AI如何实现产品落地、商业模式落地以及盈利能力落地?

 凛冬过后,曾经火极一时的数字医疗企业2017年怎么发展?投资人给出了这10条建议

医疗大数据和人工智能产业报告”专题

 2017医疗大数据与人工智能报告发布,首次绘制产业技术成熟度曲线

 人工智能底层技术已然成熟,中国人工智能的发展急需解绑数据和政策支持

 在人工智能参与最多的医学影像诊断领域,这是一次完整的调研

苹果”系列专题

 这是谷歌、IBM、苹果都没解决的医疗人工智能难点!

 硬件前三,软件争前十,通用医疗认为医疗健康将是“苹果式”的生态圈

 聚焦IBM、谷歌、苹果、Facebook,这些科技巨头如何逐鹿基因市场

 苹果的数字医疗平台ResearchKit步入十字路口,专业性存疑

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。文中出现的采访数据均由受访者提供并确认。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

登录查看更多
1

相关内容

数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的综合数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程。数据治理是一种数据管理概念,涉及使组织能够确保在数据的整个生命周期中存在高数据质量的能力。一个数据管家是确保数据治理流程遵循,指导执行,并建议改进数据治理流程的作用。
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
电力人工智能发展报告,33页ppt
专知会员服务
126+阅读 · 2019年12月25日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
如何做数据治理?
智能交通技术
18+阅读 · 2019年4月20日
企业数据AI化战略:从数据中台到AI中台
36大数据
11+阅读 · 2019年2月18日
CIIS2018演讲实录丨王昊奋:智能问答在企业计算中的机遇与挑战
过了尬吹的年代,人工智能都落地了些什么?
互联网er的早读课
8+阅读 · 2018年11月5日
一个人的企业安全建设之路
FreeBuf
5+阅读 · 2017年7月7日
Image Segmentation Using Deep Learning: A Survey
Arxiv
44+阅读 · 2020年1月15日
Deep Co-Training for Semi-Supervised Image Segmentation
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
Arxiv
4+阅读 · 2018年4月29日
VIP会员
Top
微信扫码咨询专知VIP会员