国家病原微生物资源库公布首株新型冠状病毒毒种信息
当前,从武汉爆发并蔓延全国的新型肺炎疫情牵动着国人的心,本月 23 日 10 时起,武汉市公共交通停运,全城出汉通道封闭,新型冠状病毒肺炎疫情来势汹汹,这次疫情不像 2003 年的 SARS,由于正值春节人群大迁徙,年前已经结束和年后再次面临的大规模跨区域人口流动,将使疫情防控面临严重挑战,疫情后续传播范围存在不确定性,发展态势不容低估。虽然国家疾控中心和各级地方政府的疫情联防联控能力面临考验,但从历史进程来看,不管是 98 年大洪水、03 年 SARS 还是 08 年大地震,有国家的强力动员和广大民众的互助支持,坚信我们一定能战胜“武汉肺炎”!
由于传统的疫情监控预警受制于僵化的体制流程和实时计算技术等的局限,爆发的疫情往往因严重的时间滞后性和缺乏实时动态数据的支持而难以有效管控,加上现代交通的高速发展使得地球村成为现实,传统的疫情监测方式(主要来自临床医生手动收集和编写的报告,响应速度缓慢),使得公共卫生部门更加难以及时准确的掌控疫情爆发的时间和动态。对于各地虽有明确的信息收集上报要求,理论上能够有效获取相关信息,但也容易受管理渎职等因素的影响。
以美国的疫情监测网络为例,全美各地的医疗单位根据患者症状每周例行提交病例风险报告,并将患者样本数据提交检测中心,检测结果由美国疾病控制与预防中心(CDC)的专家集中进行评估。即使对于经过充分确认的疾病(例如流感),从疫情识别到做好爆发应对预案也至少需要一到两周的时间,加上拖延渎职等因素影响,对于难以进行常规监测的新型病毒爆发疫情,这样的延误可能是灾难性的。这次武汉肺炎的大规模爆发就把相关部门打了个措手不及,从早期感染到引起重视经历了较长时间,我们经过 2003 年 SARS 构建的疾控防御体系,其能力和效率到底如何不得而知。
总之,疫情防控就是一场生命与病毒蔓延时间赛跑的竞赛,制度和人力是一方面,另一方面,还迫切需要更强大的防控技术来监控、预警和预测疫情的爆发及扩散。下面以个人的一点浅见列出了二十一条建议,来探讨如何借助大数据技术辅助疫情的联防联控:
1 顶层平台设计
(1)比尔•盖茨曾在《新英格兰医学杂志》上发表文章呼吁建立疫情全球监控预警系统,依托完善的制度设计加上强大的实时大数据技术支持,是监测和应对疫情大规模扩散的关键。建议根据小汤山医院建设模式,从国家层面组织国内几大巨头公司的强力技术团队,快速建设国家疫情防控大数据作战指挥平台,整合打通涉及疫情爆发及防控整个大数据链条相关的数据接口,从实时医疗数据收集(医疗机构)、自动监测预警(疫控部门)、大规模时空轨迹分析(移动运营商和交通部门)、感染精准追溯跟踪(公安部门)到生成内容丰富的可视化报告等。做到各类疫情相关大数据实时采集和融合分析,以支撑各类疫情防控工作的跨域跨部门协同。
(2)如何基于全域大数据来提升疫情防控水平和决策能力,疫情大数据如何从点到面,落地实现面临挑战,涉及到一系列相互关联的数据接口、技术和技能支持。需要整个社会的大型企业、医疗机构和政府管控部门协同合作,但要打通分割的数据链条是不容易的,所以才需要国家强力部门的顶层设计与推动,建设国家疫情防控大数据作战指挥平台。建议拟定如应对生化危机(战争)的紧急状态法,让大型企业(特别是类似微信、支付宝、滴滴等超级 APP)、医疗机构及公民个人,在国家紧急状态时都有为国家顶层疾控平台开放所需数据接口和提交疫情信息的义务。
(3)基于疫情防控大数据作战指挥平台,需融合各类疫情相关大数据(如公安人口背景大数据、疾控病毒大数据库、移动时空轨迹大数据、超级 APP 消费社交传播链数据等)构建疫情超级档案,设定一级感染(确诊、康复、死亡)病例数据库,二级暴露追踪数据库(疑似、接触、排除),还包括病毒基因组测序以及爆发感染源追溯等多个数据库。基于全域数据协同融合,以支撑科学实时计算病死率、感染率、增长(降低)速度、潜伏期、变异期等关键性疫控指标。
(4)疫情防控大数据平台必须保证全天候正常运行,细到社区网格员收集的个体数据、大到移动部门和交通部门的时空大数据库,需结合制度保障数据获取的实时性和准确性。基于融合大数据平台组织防控专家、数据科学家、政府管理决策团队进行多个维度、多个专题、不同阶段周期下的疫情大数据分析,数据分析目标是要让疫情实时监测预警、爆发扩散规律等信号得以清晰可见,分析结果要经过防控专家和管理团队的验证推演,为国家高层提供数据层面的决策支持。
(5)在传统的国家疾控体系基础之上,结合上述全国范围的跨区域、自动化、实时大数据采集分析系统和国家疫情防控大数据顶层平台的支持,形成一套自动化、智能化的疫情大数据协同监测、预警和应急响应机制。围绕爆发疫情的态势分析,设定防控预案,以支撑防疫区划分、防疫等级设定、交通封锁管制、重点人群监控等疫情防控作业,同时支持对防疫人员、资源和物资等的科学调配。
2 疫情监测预警
(6)对早期异常病例的实时监控与上报,武汉的医疗机构有没有做到位,或者是当地疾控体系的漏洞,笔者不是疾控专业人士无法评价。但转了几个科室都不能确诊说明这本身就是十分异常的病例,面临这种新型病毒感染情况(不同于传统的疑难杂症)就应该对各级疾控部门进行预警,包括感染事件的日期,发病报告,初步诊断,疾病机理,时空轨迹和暴露接触等详细记录。这些数据是实时监测预警的基础,例如基于实时电子病历(异常病毒)和病毒库自动比对,对新型病毒疫情进行爆发预警。这需要国家疾控与公共卫生管理部门联合全国各大医院,基于大数据实时异常监测情况来指导疾控预警重大决策,异常数据应该直通国家疾控部门的相关系统,从制度上排除地方机构可能存在的漏报瞒报因素。精准的病毒监测预警对于评估疫情的爆发和防控至关重要。
(7)疫情防控不同于一般管理工作,对于数据的实时性与精准性要求高,对每一个感染的个体都应该做到精确跟踪与观察,比如在预警阶段需找出早期可能的超级传播者,另外,没有大数据的支持只靠人力是难以实时管控的。换句话说,这种精准的防控需求,不能只靠传统意义的大数据挖掘技术,而是需要实时大数据流的分析支持。特别是在疫情爆发的早期,基于大数据分析的超级传播者跟踪能够为发现疫情、跟踪疫情扩散提供重要支撑,比如在做好个人隐私保护的条件下,根据对早期感染个体的手机定位时空轨迹及消费记录跟踪,融合整个早期感染群体的轨迹路线图和消费点进行重叠透视,通过交叉点的查找确认就有可能追溯到病毒感染源头。当然大数据应用只是辅助措施,核心工作要结合大数据应用的制度设计和人员协同。
3 疫情态势研判
(9)疫情态势研判是早期响应的基础,一般来讲,新型疫情的爆发态势是难有历史经验数据可以借鉴参考的。幸运的是相比 2003 年的 SARS,经过这 17 年的大数据技术发展,使得基于大数据技术进行疫情态势分析成为可能,无处不在的大数据流可以帮助我们更快更精准地获得各种详细信息,包括人员的时空轨迹、通关的实时监控、爆发态势的热点分布、电子病历档案和实时的社交、消费大数据等等。关键是如何打通并利用这些从点到面(多源异构、条块分割)的各类数据来支持疫情态势研判和防控决策?这需要第(1)条国家疫情防控大数据平台的支持。
(10)如果没有顶层平台的支持,就只有通过融合已有的离散的各种大数据源,做有限的态势分析。比如当今移动互联网和物联网技术的兴起为疫情扩散分析提供了丰富的大数据资源。移动运营商可以根据手机定位来提供人群流动信息,包括跨域流动和特定人群的时空分布。智能手机产生的公共出行大数据可以为精准监控出行轨迹,预警感染风险等成为可能。网上根据部分地区运营商公开数据发布的人流迁徙图,对于疫情态势研判能起到一定作用,但单个移动运营商和单个地区的运营商数据,并不完整而且不全面。通过整合全国的移动轨迹大数据流与常规的疫情监测方式结合起来,国家疾病防控部门可以感知疫情扩散的态势和流动路径,通过几大运营商的全数据覆盖支持,可以知道疫区流出流入人口数量及流动路径,疫情感染密集地区必须做封闭式管理,类似的疫情大数据态势研判,为防止疫情的进一步扩散蔓延提供了科学决策支持。
4 爆发扩散防控
(11)爆发扩散分析是打赢疫控战的关键,疫情大规模爆发之后,要确定将来可能爆发的地方,流行病学家需要时空数据来推演,移动大数据结合各大交通枢纽的实时监控系统对来往人口进行追踪,并通过热传感器实时监控生命体征等提供了数据条件。大数据的实时性、全周期、全覆盖等特点,决定了基于大数据协同的疫情爆发扩散管控可行并有一定的必要性。也为疫情的正式干预防控提供科学支持,比如需要进行更复杂的防扩散分析以制定人员隔离措施、疫苗接种策略,感染风险追踪,联防联控的实施评估与经济社会影响评估等。
(12)移动轨迹大数据主要是从宏观层面把握人流人群的行为特征,包括疫区接触范围及时间,人群流动方向,从而预测疫情的扩散规模及时间长短等。要进一步跟踪定位有感染风险的个体就需要公安身份及社交消费等大数据的支持,首先,社保卡实名普及、铁路实名制、高速 ETC、机场刷脸等都普遍实现了大规模的身份核验;其次借助微信、支付宝之类的超级 APP,可以追踪疫情爆发初期在华南海鲜市场有过消费支付记录的高风险感染群体,包括在华南市场周围有过活动轨迹或火车站停留的人群,通过这些人群的社交接触再深入排查二级三级感染扩散路径。通过上述移动轨迹大数据、公安身份大数据与超级 APP 的社交消费大数据融合分析,疫情后续跟踪与防控措施的开展就更具有针对性,这要比传统的疾病传播模型仿真模拟更精准。
(13)通过将医疗机构大数据,公安人口档案大数据和移动运营商(加交通管理)时空轨迹大数据融合分析,预测疫情传播的规模与强度,并提供全国交通运输网络实时性动态,进一步识别高风险人群,并进行区域位置及轨迹标注;基于个体的行动轨迹、消费记录和就医情况,通过警方与交通部门联控合作,锁定乘坐武汉公共交通系统外出人员的流动路径,通过 GPS 定位武汉自驾外出人员的分布位置,定位筛选出与病毒感染者有接触过的风险个体,并找到他们的具体位置信息。通过不同级别的扩展计算得出个体或人群的感染风险概率,精准定位主动防控,降低医疗资源浪费。
(14)结合实时疫情地图,发热门诊指引和感染风险热力图等大数据可视化分析,基于移动大数据、公安部门的身份大数据,定位每个人的移动轨迹和身份,对经过疫区的人员实时发布信息提醒做好防护。对确诊患者的行为轨迹进行分析,追踪密切接触、近距离接触、间接接触人员并进行分级隔离,防患于未然。基于高风险感染群体分布形成时空热点分布,重点部署防控医疗资源。
(15)社区网格采集员和医疗单位信息管理员,每天实时将详细的(疑似、接触)病例数据通过智能移动设备或手机,结合微信等超级 APP 将采集到的信息上传汇总,将其传输到疾控大数据平台,数据存储在云数据中心,以供各级人员授权访问和大数据分析。特别是疾控专家和数据分析团队需要第一手资料,所以每天来自疾控前线的实时数据十分重要,这些数据是掌握疫情动态变化的基础。
(16)组织流行病学家、疾控专家和数据科学家,进行实时条件下的疫情动态预测建模,在很多情况下,预测模型的准备输出需要一定的数据和时间进行验证,但在这之前,可以加强专家们对疫情大数据的理解。同时疫情大数据还可以在精准治疗方面发挥作用,比如基于病毒数据分析,辅助科研人员快速研发特效药、疫苗等。
5 医护人员保护
(17)医护人员是疫情防控的最后一道防线,必须尽最大力量保护医护人员的自身安全。通过移动互联网和自动诊疗流程等,让一线医务工作者尽量减少与感染人员的直接接触。比如四川的华西医院、省人民医院已经实现从预约挂号、分诊、检查到取报告诊疗的自动化和无人值守,通过进一步优化微信上的诊疗流程,可以做到与医生只接触一到两次(检查医生和确诊医生)就实现确诊,最大化降低医护人员的感染几率。
(18)基于超级 APP 和 5G 技术实现快速远程诊疗,通过在线预约,自动分诊,或者根据医院情况(医疗饱和)在线给出就医或居家治疗建议。如 1 月 26 日,四川省卫生健康委组织四川大学华西医院与成都市公共卫生临床医疗中心,基于 5G 技术成功完成了两例新型冠状病毒感染肺炎急重症患者的远程会诊。同时还可以通过社区网格员实时推送及上报个体信息(主要是老年人群体),提醒在家疑似人员做好自我观察和自我隔离,青少年人员可以通过超级 APP 上线隔离助手做好实时状态登记、检测和数据上报,通过远程诊疗技术,疑似患者或病情较轻的患者完全可以在家线上就诊,降低外出活动的感染风险并降低医疗资源的压力。
(19)未来需加速研发疫情环境下的医疗机器人,或采用人工智能技术测温仪进行智慧体温疫情监控,降低监测人员的感染风险,还有无人值守的自动化医疗检查设备。马云所提出的互联网医院理念,还有未来的无人医院建设等等,上述措施对于更安全有效的疫情防控都是十分必要的。
6 经验教训总结
(20)最后是防控收关阶段,随着感染病例逐步恢复,死亡率逐步降低,需要后续应对计划,什么时点解除封锁措施并恢复生产,如何对疫情防控能力进行升级建设。这都需要通过沉淀的疫情大数据进行总结分析,包括疫情的生命周期、各阶段变化、指标趋势等。2003 年 SARS 的爆发没有国家级的疫情防控大数据平台是因为当时的信息化技术条件所致,但当时也积累了丰富的防控经验和病毒大数据库等资源基础。后续应该吸取疫情监测预警和应急响应方面的不足和教训,利用好大数据智能技术,为未来可能的疫情爆发提供更加安全的防控保障,把疫情扑灭在爆发之前。
(21)大数据是把双刃剑,而且疫情防治措施因其敏感性,比一般的法律法规要求更严格。只有国家权威部门才有权发布疫情,个人乱发信息要受到法律制裁。另外,不同的疫情级别对应不同级别的政府管理范围职责,实时精准的监测数据+严密无漏的防控制度,从上到下的整个疾控体系容不得一点马虎和侥幸,疫情发布的时间要恰当,早不得晚不得,各级病毒监测数据更是要精准直达顶层,疫情防控就是一场生化战争,如何做到尽量降低对社会公众情绪及生产生活的冲击,我们还有很长的路要走。还有就是最近个别地方,社区网格员收集到的武汉疑似病例人员信息,泄露发布到网上之类的行为需要严格规范管理,应注意避免以“疫情防治”的名义,而忽视民众的隐私权,不管是政府还是企业,大数据意味着大责任。
受限于个人经验,上述建议还不够成熟,有些不一定合理,只是想抛砖引玉供大家交流探讨。我们很欣喜地看到,华为、京东、BAT、移动电信运营商等大型企业的技术团队已经在着手相关工作。 总之,大数据技术只是辅助措施,可以帮助我们进步,助力生命与时间赛跑,但疫情防控的关键还是人。17 年前的 SARS 还历历在目,为什么仍然还有野生动物的交易和买卖?为什么面对致命病毒还有早期较长时间的漏报瞒报?什么时候国家层面才能建立起一套反应及时、固若金汤的能抵御生化危机(战争)级的疾控防御体系?上述种种问题,我们每个国人都需要反思。
作者介绍
杜圣东,大数据智能方向在职博士,西南交通大学人工智能研究院技术负责人。兼任多家单位技术顾问,曾为中国铁路集团、中国中车集团、成都国安局、广州地铁等 20 余家企事业单位做大数据和人工智能培训讲座。首次提出了敏捷大数据方法论,在数据挖掘、商业智能、深度学习和交通、医疗大数据等领域有 10 余年的系统研发、管理与咨询经验。迄今为止,主持企业项目和产品研发 20 余项,主持国家重点研发计划子课题 1 项,主研国家自然科学基金和重点研发计划项目 5 项,申请获得专利和软件著作权 8 项,发表论文 20 余篇,著有《大数据智能核心技术入门:从大数据到人工智能》一书。