何谓大数据?顾名思义,就是体量特别大且数据类型复杂多样的数据集,其特征是数量大、类别多、真实性高、速度快,因而难以用传统数据库工具对其内容进行抓取、管理和处理。如今,随着现代科技的发展,人们对数据处理的能力也在明显提高,以往一团迷雾一样的大数据成为新的科研富矿,从中人们可以科学地存储、研发、利用、分析数据,并得到精确的结果。
大数据让科研更具针对性
北京市神经外科研究所张亚卓
我们正处在一个医学信息爆炸的时代。据统计,医学信息资源占据约30%以上互联网信息资源,医学文献的数量正以惊人的速度增长。全球医药类期刊近3万种,每年发表论文200多万篇并且以每年7%速度递增。临床医生平均每天必须阅读大量的专业文献,才可能跟上现代医学发展的速度。2012年,美国政府发布了《大数据研究和发展倡议》,旨在利用大量复杂数据集合获取知识和提升洞见能力,投入金额高达2亿美元。与此同时,医学科技的发展也离不开大数据。在科研的过程中,大数据的利用、开发和整理,可以颠覆我们以往很多研究结果,为我们带来意想不到的效益。
大数据时代下的医学科研,应该具有三个主要特点。第一,临床医学资源发掘、收集、整理和利用(标准化、科学化)。第二,大样本、多中心的临床研究(病因、诊断、治疗及药物开发)。第三,依托临床信息的生物医学资源的整理、利用及研究(基因、蛋白及代谢)。那么,大数据时代下的肿瘤研究的特征就更具针对性了。主要有临床信息、肿瘤生物学特性、基因蛋白等数据库,个体基因测序和数据快速处理,分子标记、药物靶标的鉴定和特征描述,新型药物的设计。
大数据时代下的传染病控制
中国疾病预防控制中心传染病预防控制所生物信息室负责人陈晨
公共卫生安全是全民讨论的热点和关心的话题,例如2011年的德国大肠杆菌O104事件,引起全世界人的关注。在细菌性传染病领域,新发、突发细菌性传染病尤为引人注目,不断引起严重的公共卫生威胁;同时,既往曾经被控制的传染病因为社会经济因素的变化,又造成新的暴发流行。这些暴发流行不仅造成了大量的经济资源的浪费,更是造成了人们心里的恐慌。
传统的细菌性传染病的防控在微生物学、分子生物学的检测与分析上,已形成了一系列的检测技术手段。近些年,生物基因组学和网络大数据分析技术的获得突破性发展。基因组学在传染病的筛查确认、疫情传染来源的追踪、以及病原变异等方面,提供了新的强有力的技术手段,而大数据分析对于传染病的预测、疫情传染来源的追踪提供了新的手段。这两项新的技术的共同点都是:大数据。
有关大数据分析中的核心数据库的建立、标准大数据分析流程和网络数据挖掘三个方面,陈晨主任会在生物医疗大数据会议中和大家共同探讨。
我理想中的医疗大数据
北京大学肿瘤医院肝胆外科钱红纲
我国的医疗信息化建设用了十年,经历了数字化、35212及36312工程等不同阶段。大数据从提出到现在也有4年多了。很多人更是看了麦肯锡2011年报告中一年3000亿美元的附加值而跃跃欲试。然而,医疗大数据在医生眼中是怎样的呢?
目前,只有大医生或大医院才关注大数据,而临床工作的繁重让绝大多数一线医生无暇顾及身边默默发生的变化,他们更需要的是提高效率、简单易行的临床辅助工具,而不是在原有基础上再增加额外的负担。因此,如何让作为医疗服务主体的医生接受大数据理念,心甘情愿地运用大数据是让其从浮云上落地的前提。大数据的收集者需要解决数据录入和访问的快捷问题,才能得到作为使用者之一的医生的拥护。另外,多年来各个医院开发了各自的病历系统,如何兼容各个数据接口也是一大难题。当很多统计数据来源于患者时,他们能否提供准确的医疗信息?大数据开发过程中,医学工作者如何与网络专家通力合作?这些都需要慢慢解决。
尽管医疗大数据仍面临不少困难,但广阔的市场前景是毋庸置疑的。作为一个医者,我很关注大数据在以下几个方面的应用:
临床决策支持让误诊误治大幅减少
临床中遇到的疑难杂症,有时即便专家也缺乏经验,做出正确的诊断和治疗更加困难。临床决策支持系统可以通过海量文献的学习和不断的错误修正,给出最适宜诊断和最佳治疗。以IBM Watson为代表的临床决策系统在开发之初只是用来进行分诊的工作。而如今,通过建立医疗文献及专家数据库,Watson已经可以依据与疗效相关的临床、病理及基因等特征,为医生提出规范化临床路径及个体化治疗建议,不仅可以提高工作效率和诊疗质量,也可以减少不良反应和治疗差错。在美国Metropolitan儿科重症病房的研究中,临床决策支持系统就避免了40%的药品不良反应事件。世界各地的很多医疗机构(如英国的NICE,德国IQWIG等)已经开始了比较效果研究(CER)项目并取得了初步成功。
试想有一天,大数据系统成为诊断和治疗建议的提供者,内科医生是否还能坐的安稳?因为它掌握的信息量要比人多的多,判断的准确性要比非经验得出结论更可靠。不过,外科大夫也不要笑得太早。对手术路径和流程的大数据采集配合机器人等的程序化操作,也许有一天也会取代已经成为图腾的柳叶刀。
远程监控诊疗提高家庭护理质量
从远程监控系统收集数据,并将分析结果反馈给监控设备及人员,从而实时诊断并确定治疗方案。目前已有医院通过结合手机App软件等方式,进行心率、体温及血糖等的检测,但检测的内容仍很单一。临床上希望针对不同病种开发一些诊治后辅助系统,可以减少病人住院时间或门诊复诊次数,提高家庭护理的比例及质量,也帮助医院和医生锁定患者群。北京大学肿瘤医院目前正在开发此类软件,并有望和IBM、希捷等公司进一步合作。
公共卫生监管快速检测传染病等
卫生主管部门可通过监控数据库,实时统计分析,快速检测传染病、院内感染等情况,并进行快速响应。同时也利于网络覆盖地区发病及诊治情况的数据汇总。如果将整个数据系统整合,不仅有利于整个体系内的医疗资源分布和供给,也便于实时监管和调控。
大数据,尤其是公共卫生的大数据从本质上说应该是国家资源,它的安全也应该纳入国家安全。开发者应该认识到这一点,国家也应该认识到这一点,尽快出台相应的制度和规范来规避风险,让大数据更符合国家的利益、人民的利益。