疫情溯源,感觉好似侦探破案那般,然而实际去做的时候,常常会卡在“从哪里找寻线索”以及“究竟谁愿意予以配合”这两个极为棘手的难题之上。在过去的几年当中,全球投入了高达数十亿美元,可是溯源所取得的成果仍旧呈现出碎片化的状态,这不仅仅属于科学范畴的问题,更是一场关于资源分配以及国际协作的艰难战斗。
溯源不是翻旧账而是拼拼图
不少人误以为疫情溯源仅仅是找出一个“零号病人”便大功告成,可这却是极大的曲解,2021年世卫组织发布的这份中国-世卫组织关于全球新冠疫情与相关动植物、食物链关系首次全方位联合研究报已能证实及确究事实并非如此确曾表明其过程具长期性、系统性特质,有一连串由多项分类组成以了解病毒传播的初始,诸如早期病例向后追溯过往情况的探索、搜索中间宿主追查动物以确定感染源头的考察以及冷链环节扩散疫症几率的剖析探究情况等,武汉作为当时疫情暴发首发前沿的过往病例系列收集样本范畴区域、被视作病毒传播源头的华南海鲜市场的有关动物样本提取,皆仅为其中拼图的一块组成部分罢了,将全部精力单单聚焦于某一时间节点或某一地区位置上,既不会契合流行病学的自然进展潜在规律,又极易把纯粹科学范畴专门性问题演变成政治化议题,这是完全极为不可取的做法。真正的溯源是在海量数据里找关联,不是贴标签。
流行病学调查的硬核工具
问卷设计的学问
在二零二零年初版本之上,国内疾控系统所运用的流调问卷,历经了至少四代的迭代。早期版本仅仅聚焦于十四天旅行史,后续版本增添了冷链接触史、海外代购包裹收取状况,甚至于排水系统暴露史。在二一一年“5·21”疫情期间,深圳市疾控中心借助细化生鲜市场摊位排水管道走向的问卷,成功锁定了并非直接接触的传播链。一份优质问卷并非越长便越好,而是在每个问题背后,都存在着有待验证的明确假设。
基因测序不再高高在上
完成一个新冠病毒全基因组测序,在2020年初时需要几天时间,成本在万元以上,到了2023年,国内多家第三方医学检验所已将成本压到500元以内,24小时就能出结果。广州市在2021年Delta毒株疫情期间,曾创造下单日完成200份样本测序的记录。这些序列上传到全球共享流感数据倡议组织数据库后,为全球科学家判断病毒输入方向提供了关键证据。测序并非为了炫技,而是为了看清病毒入境后拐了几个弯。
数据收集的灰色地带
病例报告的时间差
医生填报基层医院上报疫情数据后,到国家疾控中心审核,理论上仅需2小时而已。然而在2022年,某西部省份于实际操作期间,出现过因值班人员身兼核酸检测统计及疫苗接种统计两个工作引发的,延迟竟达48小时的状况,此并非个例。这其中,由数据收集系统仅将基层人员视为无处不适用万事全能的螺丝钉缘由所导致,第一手资料的时效性必定会大打折扣。提升数据效率不可仅凭借喊口号就行事,而是要借助开发更具智能、能够辅助基层大夫少敲键盘的录入工具方可达成。
接触者追踪的漏网之鱼
接触者追踪的主要手段依旧是电话问询,然而人们没办法记住三天前在电梯里站于自己身旁之人的模样。杭州于2022年曾尝试借助手机基站信令数据来辅助回忆,将接触者排查的漏报率由17%降低至6%。这样做引发了隐私方面的争议,不过也提出了一个现实问题:当公共卫生危机与个人隐私正面产生冲突时,是否存在中间道路可供行走?从目前的情况来看,脱敏处理之后的位置轨迹数据授权使用,或许是双方都能够接受的平衡点。
溯源流程中不起眼的卡点
初始发现环节的瓶颈
2023年,国家卫健委提出要求,所有二级以上医院需配备发热门诊专用CT,医院发热门诊作为疫情监测的第一道关口,然而设备虽已到位,放射科医生数量却未增加。在夜间急诊时,值班医生既要查看普通外伤片子,又要看发热患者片子,平均到每张片子的阅片时间被压缩至3分钟。如此一来,就意味着一些少量且影像特征不典型的早期病例,极其有可能被疏漏过去。硬件升级之后出现的人力缺口,正逐渐演变成疫情早期发现方面新的短板。
数据分析师的困境
疾控中心编制之中,数据分析岗位平常往往仅有两三个人,然而疫情爆发之际,每日都得处理数量上万条之久的流调记录。在2022年上海疫情那段时期当中,江苏省的支援队伍携带了自身所开发的自动去重脚本,将合并重复人员信息的时间从4小时缩减至20分钟。这样一个细节表明,溯源分析所欠缺的并非是数据,而是能够把数据“洗干净”的人员。会编写Python代码的流行病学家,当下各地疾控系统都在竞相争抢。
看得见和看不见的挑战
数据孤岛正在被打破但还很慢
卫健系统、海关系统、移民管理系统、市场监管系统这四个系统的数据,直至如今都尚未完全实现打通。在2023年的时候,某口岸城市出现了输入性疫情,为了能够查清楚感染者是不是接触过进口货物,工作人员要向海关去调取报关单,要向市场监管去调取消杀记录,要向商务局去调取销售流向,整个过程走了6道纸质盖章程序。区块链技术早就已经被提出来用于解决这类问题了,然而跨部门的数据确权以及责任划分争议,相较于技术本身而言更为复杂。
隐私保护的硬边界
欧洲某些国家溯源之际执意不收集确诊者职业信息,原因是防止就业歧视,这般做法于国内无法施行,却也给我们敲响了警钟:个人隐私保护并非是把数据锁入保险柜便大功告成,而是要规定谁在何种状况下能够运用哪些字段。2024年施行的《公共卫生数据安全管理细则》首度明确,流调报告里不得呈现无关的婚姻状况、家庭成员职业等信息。法律红线既定,执行尺度仍需更多判例予以校准。
未来不能只靠科学家单打独斗
人工智能帮倒忙还是帮大忙
一家科技公司,曾向中部省份的疾控中心,捐赠过一套AI溯源模型,输入病例数据后,会自动生成传播链拓扑图。然而,这个模型,将同一个家庭的三代续发传播,判定为独立输入事件,原因是它无法理解“奶奶 - 妈妈 - 孙子”这种三代同住关系。目前,AI只能起到辅助作用,把流调员从画图制表的工作中解放出来,千万不要指望它能替代人,去理解人情世故。在未来三年,人机协作的模式,大概率是机器筛选可疑接触者,由人类去核实关系亲疏。
全球实验室的接力棒
当年11月,巴西的科学家于研究废水样本之际发现新冠病毒抗体,同年9月,南非的团队从住院患者档案当中筛出契合不明原因肺炎特征的病例这些成果并非只依赖单个国家的努力,而是国际医学期刊开放预印本平台之后,来自不相同时区的研究者彼此启发、接力深挖所产生的结果真正的全球溯源,需要更多国家如同分享流感毒株那般,常态化地分享本国的呼吸道疾病监测数据这并非道德绑架,而是下次大流行降临之际、每个人自救的理智选择。
追溯源头这个事情,去争论到底是谁还欠着谁一个解释这样的行为意义并不是很大。我想要问一下读到现今这里的你:要是在十年之后再次直面新出现的传染病,你期望当下的数据收集体系,优先妥善地保护好每一个人的隐私情况,还是优先能够让科学家获取到最为全面的信息呢?欢迎在评论区域说出你的选择结果。


