大数据应用尚需打通采集与规范间的藩篱
数字技术是行业、机构发展的战略制高点。达沃斯发布报告显示,全球企业在数字化转型中投入超万亿美元,仅1%达到或超过预期。医疗行业的数字化程度更是远远落后于其他行业,埃森哲(Accenture)认为其尚不足交通等行业的20%。
“这并不是说医疗行业没有数据沉淀,恰恰相反,医疗大数据量增长已达到了PB级,但可用性不够。”宣武医院信息中心主任梁志刚表示,缺乏大数据质量校验和建设规范,使临床面临“无数据”可用的尴尬。
大数据的三大特质与应用挑战
每个人一生会产生无限量的医疗健康数据,全球医疗数据量预计到2020年将达到2.314PB,但数据的可用性不高,现阶段数据合格率能达到50%-60%的医疗机构在极少数。
“各行各业都在大谈大数据,‘繁荣’的背后容易轻视追溯大数据的本源,尤其是忽略大数据为谁服务。”梁志刚指出,我们需要的不是“死的”数据,而是要挖掘它的利用价值。单纯的数据汇集或是盲目的数据收集,不足以支撑大数据在决策支持、科研管理等方面的应用。
他认为,真正的大数据应具备三个特质:足够大的量级、多样性、有意义。但现阶段收集的医疗大数据,多为过程数据,属于离散的、不连贯的文本描述性数据,存在非结构化程度高,无法直接用于计算机分析和应用;数据录入也不规范、不完整,有的数据甚至是没有实际意义的,数据质量有缺陷。
“缺乏统一的标准规范、严格的校验机制与平台,没有好的数据治理观念,再多的数据也难以起到反哺临床的作用。”他认为,只有做到数据的标准化、统一化和智能化,才能推动数据的临床价值“变现”。
建立标准规范是大数据服务落地的重要前提
资本行业一直在描绘医疗大数据应用的蓝图;86%二级及以上医疗机构建立了规范化的电子病历系统;作为政策引导方,国家业已出台了数十条 “纲要”或“意见”,建立了医疗大数据初步利好的环境。
但具体如何落实到服务医生、服务患者层面?梁志刚认为,目前尚没有真正成功的大数据应用落地,其最大的壁垒在于缺乏标准和规范。
他介绍,政府层面虽搭建了大数据框架体系,如,居民健康档案、数据中心建设等,也发布了电子病历书写规范,对医疗文书、出院小结等作出了明确定义。这些工作为数据采集和规范奠定了基础,借助人工智能、深度学习技术的运算能力,大数据存取、处理和分析看似已水到渠成了。
“但政策引导是战略性的,缺乏对具体内容的内涵性定义,如果没有执行也是‘纸面’上的。即便AI在某些领域能够超越人类专家,技术始终绕不开路径规范。”梁志刚说,建立大数据的行业规范和标准细则,需要首先建立数据采集的规范。
“通过对数据元素的值域进行定义,利用信息化手段表达出来,建立以病种为单位的专科数据集,梳理出真正有用的数据信息,这是我们目前最需要做的事。”在他看来,标准规范建设可以自下往上,由企业或者行业来梳理,政府层面可以牵头组织,让行业规范上升为国家标准,从而推广至大范围应用。
此外,大数据分析不能盯着“历史数据”,不能停留在数据收集上,更重要的是规范“明天的数据”,做好诊疗过程的标准化,从源头上对诊疗内涵质量和病历内容进行规范,减少垃圾数据的产生。
更多信息来自:东方联盟网 vm888.com
- 11-06Hadoop是目前大数据领域最主流的一套技术体系
- 11-06大数据和人工智能:三个真实世界的用例
- 11-06为什么说,大数据与行业专家是“共生”关系?
- 11-06Python数据可视化:箱线图多种库画法
- 11-06这种思路讲解HDFS你肯定没见过?快速入门Hadoop必备
- 11-06媲美Pandas的数据分析工具包Datatable
- 01-11全球最受赞誉公司揭晓:苹果连续九年第一
- 12-09罗伯特·莫里斯:让黑客真正变黑
- 12-09谁闯入了中国网络?揭秘美国绝密黑客小组TA
- 12-09警示:iOS6 惊现“闪退”BUG
- 12-05亚马逊推出新一代基础模型 任意模态生成大模
- 12-05OpenAI拓展欧洲业务 将在苏黎世设立办公室
- 12-05微软质疑美国联邦贸易委员会泄露信息 督促其
- 12-05联交所取消宝宝树上市地位 宝宝树:不会对公
- 12-04企业微信致歉:文档打开异常已完成修复