论坛 产品库 视频 专题 CIO俱乐部 Windows8 实验室 CMO俱乐部 案例

杭兴宜:研究型医院科学数据资源建设

发布时间:2013-12-20 15:03:00 来源:比特网 作者:比特网
关键字:cio 杭兴宜

  2013年12月19日,由中国互联网协会、中国计算机用户协会指导、比特CIO俱乐部主办的第六届中国CIO年会,在新世纪日航酒店隆重开幕。本次年会主题定位于“破局 融合 创新”,聚焦热点新技术,关注企业应用,引领IT变革。IT业内知名的技术主管们齐聚现场,共同总结2013年IT新技术应用趋势,并为未来几年内的技术与企业融合发展趋势给出答案。

  在下午进行的大会上,我们邀请到了解放军总医院远程医学中心杭兴宜,为我们从一个医疗行业工作者的角度,带来了《关于研究型医院科学数据资源建设》的主题演讲。

  解放军总医院远程医学中心杭兴宜

  以下是演讲实录:

  我一直工作在医学数据共享一线,从这个角度跟大家交流一下大数据时代下我们医学的新的模式,希望起到抛砖引玉的作用。

  演讲题目是研究型医院科学数据资源建设,首先什么是研究型医院,这个在我国2003年一个兴起的概念,目前百度知道里面还没有严格的词义。我们的理解就是以海量信息,医学信息为支撑,及临床,教育,为一体的科研体系,研究型医院有使命,C2C,我们定义为 CODE TO CURE。

  研究型是国际上引领医院发展的潮流,这几个是国际上研究型医院代表,比较有名麻省总医院排名第一,1811年麻省总医院创立之初,一切以病人家庭为中心,致力于舒适的治疗过程,时刻以研究型研究和教育来不断加强和推动医疗手段。

  研究型医院CIO有什么要求,这是我个人的理解高帅富人才,首先要有决策权,体制所限目前大部分CIO不是医院领导班子。第二要热爱大数据,有IT精英技术敏锐性,最好要有医学背景。本身一线临床医生是最好选择,中国目前医院现状有点众里寻他千百度的感觉,目前这种人才比较稀少,大部分认为医院计算机室主任就会定位为CIO,我们进行简单调研,发现计算机室主任大部分是IT部分,少数是医生转型,我们到美国和日本调研发现大部分信息科主任CIO,他们首先都是临床医生,其次有很强IT背景,我们知道有的是计算机PID。在医院这块目前信息化建设偏重软硬件平台建设,普遍缺乏竞争的数据和技术积累,下面从这些工作感悟给大家做介绍。

  第一部分医学科学数据共享。这是国家人口与健康科学数据平台,目前依靠他的框架简单做一下医学数据,大数据积累方面的一些国家已有的部署。目前这个平台下面下属7个中心,涵盖基础医学,临床医学,公共卫生,中医药等等,每个中心都有我们国家最顶尖职能部门承担,经过10年的建设形成7大类,29个亚类,400多个数据库,数据量在8000万条左右,数据来源主要来源我们国家一线三甲医院,所依托的大学和研究所。

  看看我们做了那些工作国家在这方面,第一这个是花了大概10年时间,在全国20多个省份做了中国人生理常数数据库,除了体制状况,循环系统,骨髓系统等常用指标,涉及人群在几十万左右,这个可以把自己的身体参数上去进行比较,看自己身体正常的一个状况,可以进行简单统计分析,对于老百姓来说也非常容易使用。

  这个是集合全国也是十几家医院,来自不同的省份做的疑难病历,辅助检查的病历学数据库,现在大概有100万条数据集,这是一个肝实结合的数据,这个是国家肝肿瘤数据库,可以时时在线申请肝肿瘤样本,开展各种各样的医学研究。

  社会上药物不良反应也非常多,我们建立了全国药品不良反应检测数据库,有检测网络和上报表单指导药物安全研究。

  这是全国死婴的数据库,大概10年,全国大部分省份,为我们国家政治,军事,公共卫生的决策,可以提供很大的信息支持。

  在400多个数据库基础上我们针对国家重大需求,以及名称做十几个医学专题服务。其中有一个脑中风,脑中风筛查与防止,12年我们开展6个省市大概86万人群数据收集,今年覆盖到除了港澳台西藏的,215家医院每天通过网络进行上报数据,包括身份信息,人口数据,问卷调查,结果评估数据等等,这个我们发现86万当中14.5%高危人群,我们会进行健康信息推送,定期到医院检查。

  另外一个很热主题就是肿瘤,我们建立了一个专题服务,这个把国际上已发布肿瘤相关的数据库进行系统编译,一共80多个,提供查询,下载,展示,分析服务,这是一个数据,在线分析界面。这个项目也是一个国际合作,跟美国NCI合作,引进他的大量的数据集,中间有定量病历,临床信息等等。现在目前一共涉及25种肿瘤,数据量达到20多T。

  第二部分内容介绍一下医院主要在研究型结构化,医学系统部署的工作。目前已经完成的有临床实验系统,肿瘤影像系统,妇科系统等等。挑一个典型血液病,白血病治疗专科系统,我们持续了8年的时间,大概到了第四版,首先就是说患者过来就诊,我们有一个基本医疗信息,诊断信息,在这个基础上到检验科检查,完全是信息对接的。跟影像科,通过接口完全对接,这个是治疗的信息。在白血病一般做骨髓移植,有一些很重要的信息,移植总体,供者信息,供者跟患者配型信息,免疫治疗,后期病发症的信息等等。都要跟医院的HLIS系统联接的。在后台的试验室检测这块也有相应信息管理系统。另外整个一个全科做成一个医学体系,除了刚才的业务跟血液科科室管理,校验活动变成综合的教学管理模块

  临床实验大家比较陌生,只要是大家生活当中服用药品,新的检测技术到医院实用之前必须要进行临床实验,临床实验管理是非常重要的环节,他有一个很大特色多中心,不同医院参与,不同科室,每个医生,患者,药监局的管理部门都有不同的角色,最好有一个云计算的实现。这是我们医院本地实现临床实验管理系统的界面。

  下面聊一下大数据时代下医疗模式。在大数据时代数据相当于一个战略的核心资源,对数据解读能力,上升到国家核心竞争力,美国像奥巴马第一任期提出大数据技术,我们国家02年开始做科学数据共享工程。在生物医学大家以前有了解2001年的时候,大概20多个国家花了10年时间测一个人的基因组花了大概10亿美元,现在我告诉大家测一个人的基因组可能1000块钱左右,一周左右。生物易学作为新兴产业,他的数据增长速度是惊人的,只要基因组测试仪不停开着,他的数据量甚至跟电商行业相当的,一个人的基因20亿个剪辑,一个小时产生上百T的数据,怎么样应对生物医学带来大数据的冲击是一个非常具有挑战性的课题,在这个基础上需要新的医疗的模式和理解,我们总结出一个转化医学,就是两个B2B,第一个指试验室的研究成果,要转化到临床,第二反过来临床检验的数据要为科研提供思路和指导。在这个模式下提出一个转化医学4T医学新模式,第一个预防性,这个老祖宗就考虑这个问题,预防为主。第二个叫预测性,在疾病发生早期进行预测,特别是像肿瘤的疾病,我们国家发现肿瘤都是中晚期,第三个个性化医疗,对于复杂疾病每个人用的药,药的剂量,使用方法,因人而异,第四个是参与性。所以转化医学模式是以海量 生物信息为基础的过程。

  大家可以看到这个里面在中间有很多数据集,我们用云的形式组织起来,里面有生物检测数据,基因,蛋白,代谢的,结构,遗产等等这些数据面临一个最挑战性的问题就是数据整合,怎么样在有机数据整合基础上促进良性的研究过程,临床研究到临床实验,到临床诊疗。

  这个是事情实际上有他的哲学基础,大家知道攻克癌症这个什么时候提出来,美国最早是跟阿波罗登月一起提出来的,肿瘤治疗这块非常不乐观的。特别是我们国家肿瘤发病率基本上逐年增长,这说明一个什么问题,疾病是一个复杂系统,就跟计算机里面是一个复杂体系一样,你在某个时刻在医院做的检查,只代表某个时刻采集的数据集,就能代表疾病本身吗?实际上差的很远。跟西方是一致的,我们观测到不是自然本身,而是方法的展现。

  所以在大数据时代下在医学怎么样做数据整合,方法论跟电子学是相同的,积累知识,更加接近疾病本质。这是我们基于这个思想研发肿瘤临床与基础数据集成和发现平台,也是基于B2B的理念,左上角有患者的采集信息,我们医院有样本库,有先进措施,做各种病历检测,形成结构化数据集,左下角有大量文献信息,临床病历信息等等,这些都是非结构化的数据,这些都是海量数据,他们之间要进行数据整合,有那些新的转化医学应用呢,在右边模型,医学在大数据时代下,必须走到个体化时代,每个人要有自己优选治疗方案。第二个药物研发,一个药厂研发10年维修期,必须以大数据支撑,简短和降低风险性,第三新的标致物发现,最后才能达到疾病治疗目的。

  这是我们选的一种肿瘤做的数据检测,建的这么一个肿瘤状态下基因和蛋白质状态下做的基因网络,实际上跟我们互联网里面,社会网络非常相似的,在这个大网络基础上你要把疾病相关的模块提取出来,具有临床和医学意义的,对他进行针对医疗方案选择。

  举个案例,前段时间大家可能比较关注,美国有一个著名影星,做了基因检测,实行乳房切除术,她为什么有这么大决心做这个事,医学上是这么回事,她的母亲和外祖母都是乳腺癌患者都去世了,她做了乳腺癌预警检测患病率在70%到80%左右,西方人观念比较客观化的,实际上大数据时代下,这种医疗模式要走进我们中国人的平常生活,这就是一个产品化的。任何代谢通路发生问题,可能大家这一天不会舒服,很多疾病就是因为通路发生改变,我们对代谢物进行检测,一旦发生改变就进行疾病相关的干预。

  刚才讲的都是内因,或者是遗传因素,体内的一些因素和疾病的关系。另外因为所有的个体都是生活在自然环境下的,都有外界相互作用对大家健康也是息息相关的。重点介绍一个就是气象,我们还做了一些工作地理和健康的关系。我们做的研究选取北京4家三甲医院急诊科的3年的时间,160万案例样本,气象按照湿度,风度等,PM2.5,10等等,首先进行数据清洗,在这个过程中这是一个部分结果,呼吸系统和气候的关系,这个是温度和呼吸病发病率的关系,在第一点这个地方给大家什么提示,温度在24度左右呼吸系统发病率是最低的,大家选取居住环境城市这是非常好的参照标准。这跟是跟气压关系,湿度关系。

  大家特别关注的是北京的雾霾,雾霾检测采集时间点比较小,呼吸系统疾病跟他确实相关的,但是数据采集只有近一两年的,还没有统计上的显示性。

  时间关系我就介绍到这,有沟通的可以跟我联系。


比特微信账号
比特微信账号

微信扫一扫
关注Chinabyte

返回首页 长微博 返回顶部