
一直以来,大数据与商业就密不可分。以前,觉得所有数据零散在每个角落,无法统计,让多少市场因此无法描述用户画像,导致市场分析出现偏差、错误,影响整个决策力的制定和执行。现在,那些无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据,都被抓取和利用,具有5V特点【由IBM提出:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)】的大数据,正在明目张胆改变着各行各业。
医学,当然也不例外。
医学大数据的应用
医学大数据的应用目前主要有两方面,第一个是发现新知识、认识新规律,第二个是促进精准适度医疗,提升医疗价值。
以往受数据采集与分析能力的限制,医学主要依靠抽样研究来发现新知识、认识新规律,但不同样本间的差距经常导致结论不一致甚至截然相反。随着大数据技术的发展,医学研究由抽样的小样本研究进入到超大样本、甚至全样本研究时代,从严格筛选患者入组进行研究到全面观察各种影响因素的真实世界研究时代。美国 2015 年启动了“观察阿司匹林效果与剂量”的大规模观察性医学研究,多达 30 万人参加基于大数据的观察性研究得出的结论更具现实指导意义,甚至推翻了之前一些建立在小样本数据基础上的“科学”结论。
斯坦伯格 (Steinberg) 等人在 3 万余人两年的保险记录、化验记录、用药记录、就医记录中挖掘出新的代谢综合征预测模型,用 80% 的人作为训练集,20% 的人作为测试集,在贝叶斯框架下依据最大熵原理,对数据中未知的参数进行分布边缘化来计算模型的结构概率,综合考虑模型的复杂性和与数据的匹配性建立起新的预测模型,从 4000 余个参数中筛选出腰围、用药依从性等与代谢综合征密切相关的因素。
随着医学的进步,源于个体的数据越来越丰富,包括组学数据、健康监护数据、影像数据等。计算机科学与医学结合能够挖掘出新的知识,开创新的诊疗模式。例如心理问题一般是通过临床观察或自我就医的方式被发现并诊断的,现实中缺乏客观有效的诊断方法,而基于说话模式的数据挖掘,能够发现患者条理表达能力的下降,进而成功预警心理问题,在小样本人群实验中达到了 100% 的准确度。通过机器学习对一些复杂信息进行处理,也能对心脏病、哮喘、癌症等疾病作诊断和预测,能够达到或超越专家的诊断水平。
适度医疗、精准医疗与大数据
精准医疗、适度医疗和过度医疗,三者既有联系,又有区别。做到精准医疗,不一定就做到了适度医疗,适度医疗更多的是对医疗价值层面的考量,关注获益是否大于风险,以及获益和成本的关系。由于多种原因引起的超过疾病实际需要的诊断和治疗的行为或过程就是过度医疗。正如德国医生尤格·布来克在《无效的医疗》一书中所说“很多不该吃的药,吃了 ;很多不需要的治疗,做了 ;很多手术会使病人更加痛苦,却也在做。”在美国,40% 的医疗被认为是无效的。在我国,过度诊疗的现象也不同程度地存在。
当过度医疗如此猖獗,就需要大数据的参与和帮助,来实现适度医疗或精准医疗。为什么过度诊疗会成为世界性的问题,其中一个重要的原因是个体的差异性,同一种药物对不同人有不同的效果。而每个个体都是特殊的,每个人的健康却是同等重要的,医学大数据对数据的精准性有更高的要求和标准。
如吉非罗齐 (emfibrozil),它的上市应用主要基于赫尔辛基心脏研究,经过 5 年的双盲实验(一批人服用吉非罗齐,一批人服用安慰剂),实验结果显示用药组比安慰剂组患心肌梗死的相对危险度下降了 34%,但实际上分析表明,用药组的心梗绝对危险度仅下降了 1.4%,即 71 个患者治疗 5 年时间,该药只对 1 个人起到了预防心肌梗死的作用。如何能从这 71 个人中找到有效的那 1个人,即实现精准医疗,还需要通过大数据研究。
一方面要收集个人基因组、蛋白质组的数据,另一方面要收集个人行为、用药、心理以及环境的数据,通过分析药物组和服用安慰剂人群中出现心梗和未出现心梗的人的特征,从而区分出哪些人属于不吃药也不会心梗的(低风险),哪些人属于吃了药有效果的(预防了心梗),哪些人吃了药也没能预防心梗的,对于后者还要继续分析原因,是药物的剂量不足,还是有其他因素导致的心梗,这样我们的治疗和预防手段就会越来越有针对性,达到个体化的精准医疗。
趋利避害,医疗大数据还要走的更远
当然,大数据如很多新潮工具一样,也是一把双刃剑,如果说做到量体裁衣、辨证施治是医学大数据应用的重大课题,那么它的前提基础是拥有长期、全面、准确的人群健康数据。对于不精准的那些“垃圾”数据,数据量越大,谬误与危害越大。当前,大部分行业在数据基础系统架构和数据分析方面都面临着诸多挑战,医学领域也是如此。根据产业信息网调查,目前国内大部分企业的系统架构在应对大量数据时均有扩展性差、资源利用率低、应用部署复杂、运营成本高和高能耗等缺陷。
同时大数据的管理一直是一个难以控制的问题,由于大数据已经成为了一种商业资本,各地数据的流失、泄露和私下买卖越来越多,这也让医疗届的信息如同没有关门的家园一般,毫无隐私,任人索取。医疗机密和个人患病信息的流失,令数据安全形势变得复杂。
如此情况下,趋利避害,做好长期、全面、准确的人群健康数据研究与管理,才是医疗大数据的长远之计。
小迈的技术和研发团队,一直没日没夜的奋战在一线,搜集海量数据进行筛选和录入,力保展现给会员们的是最精准有效的高质量资料,未来,我们会更多的进行数据的深入统计、分析、研究,真正做到,跨国界医疗研发服务,让天下没有难做的医疗研发。
-END-
本文转自 知乎,原文链接:https://zhuanlan.zhihu.com/p/60666804,如需转载请自行联系原作者