科学突破和技术进步,特别是人类基因组计划完成所引发的系列组学的思想与方法论的变革,提高了人们对疾病的认识,改变了疾病诊断和治疗方法,从而为每个患者提供更精确、更有预测性、更预防性和更个性化的医疗服务。大数据革命为应用人工智能和机器学习算法,挖掘如此庞大的与人类健康、疾病相关的数据集提供了机会。由此推动的个性化医疗有望彻底改变医疗保健体系与人们的生活方式,能在正确的时间、用合适的手段为明确的患者提供对症的治疗,从而提高生活质量、降低社会医疗负担。COVID-19疫情爆发,更助推了生物技术、大数据等新兴技术的整合,进展令人鼓舞!未来十年,以精准医疗(PM)为核心的各项新技术、新思想的高度集成,将使人类医疗保健领域的生态产生根本性的变革!科学、技术、产业与医疗都面临巨大的机遇与挑战。
生物技术与大数据助力疫情防控
COVID-19疫情爆发后,基因组学和分子技术成为确定病原体、开发诊断和治疗方法以及创建候选疫苗的关键。快速分析得到的病例报告,迅速暴露出COVID-19可引起患者的巨大健康差异,突显获得对影响健康的社会决定因素(SDOH)有更详细了解的重要性。大型机构基于医疗保健数据迅速构建了庞大的数据库,用于快速调查风险因素和结果,证明了整合医疗保健数据的强大功能。在这场波及全球的疫情中,从现有研究队列中收集数据可以进行快速基因组分析,确定与疾病易感性和患者预后相关的基因位点。应对COVID-19疫情的许多工作都是基于PM的基本要素。COVID-19疫情,已经突显了PM需要走得更远、更快。
精准医疗“用数据说话”
精准医疗,即根据每个病人的个体特征对医疗方法进行调整,以将个体划分为不同的亚群,这些亚群因其对特定疾病的易感性或对特定治疗的反应而不同。特定的预防或治疗干预可以集中在那些有效人群,避免无效病人承受经济负担和不必要的治疗损伤。
2003年人类基因组测序完成以来,临床医生一直期望以数据驱动医疗保健领域的变革。分子和表型研究的新发现将带来更精确的诊断,更合理的治疗和更有效的疾病预防,或将催生基于基因序列或分子的、更精准的“人类疾病新分类法”。在医疗保健体系中,用于患者分类的个体特征信息数据有以下几种类型:
1)传统的临床表型与家族病史。这类信息是在临床环境中为每个病人例行记录的。
2)患者特异的固有特征(遗传组成)。此类数据可以通过下一代测序(NGS)技术等获得。NGS方法经历了快速的技术发展,已使基因组测序低于1000美元,可以常规地纳入医疗保健,成为健康数据的重要来源。
3)可变的组学特征(动态变化)。此类数据可以通过高通量方法收集,如多组学技术。由于成本高、组织特异性和随时间变化的变异性,获得此类大量组学数据有待技术进一步提高。
4)环境和生活方式影响因素。环境和生活方式数据通常通过问卷收集,但难以客观准确。例如饮食作为环境暴露,在许多临床实践和许多研究中经常被忽略。未来,通过的新技术和区块链设计,采集与饮食相关的数据,把精准营养作为一种“药物”,将为治疗和预防疾病提供强大的新手段。越来越多、更详细、更高质量的数据将由可穿戴设备来获得。由于患者绝大部分时间是在医疗保健系统之外度过的,可穿戴设备和患者提供的信息可完善电子健康档案(EHRs),提升远程医疗能力,这在COVID-19疫情期间首次得到了大规模验证。
大数据与人工智能是提升精准医疗的必要手段
大数据和人工智能(AI)可以解决此前难以解决的问题,例如搜索优化、语言翻译、图像解释和自动执行。许多积累的生物医学数据集都可以满足大数据的“5V”标准:数据量大(Voluminous)、高速(Velocity)、多样(Varieties)、显著可变性(Variability)和内涵价值(Value)。
从全人类的角度看,人群数据应来源于各种不同地域、种族,方可服务于人类生物医学事业。然而,在已发表的全基因组关联研究(GWAS)中,只有不到3%的参与者为非洲裔、西班牙裔或拉丁美洲裔,而86%的临床试验参与者是白人。缺乏多样性的研究使可能适用于所有人的生物学研究成果不具有普适性。
目前,临床基因组分析通常用于评估某些癌症或疑似罕见遗传病,许多常用的检测只评估少数基因位点。而许多常见疾病,如糖尿病或高血压,可能与数千个位点的遗传风险有关,这些研究通常是通过庞大的基因研究收集数十万参与者的数据发现的;许多遗传疾病的严重程度、外显率和表现度都受到不同遗传变异、生活习惯(如吸烟)和环境(如肝炎病毒的合并感染)互作的影响,在不同的年龄具有不同的表现。
随着数据深度的提升,未来十年,通过“种族”将大量的社会、文化、政治、地理和生物因素融合在一起,并可以保证系统性的种族特征。在研究和临床护理中,常规收集SDOH数据,再结合对环境影响、习惯和遗传的更精确检测,可以提供更合理的、基于病因的调整,并产生更好的风险分层和治疗方法。
AI在医学上的应用受到了大型通用结构化数据集的限制。未来,生物医学数据集将越来越适合分析。临床数据(包括图像、记录和实时监测数据),分子技术(其中以基因组学为主)以及可提供高分辨率数据流的设备和可穿戴设备的可用性的增长,将大大扩展先前同等规模下无法获得的表型数据和环境数据的可用性。
靶向治疗是精准医学的核心内涵
PM通过多种诊断测试,对患者进行分层,以获得更有效或更安全的治疗。如吉非替尼针对携带激活表皮生长因子受体突变的非小细胞肺癌患者,而非那些可能出现严重药物不良反应的人。成本效益研究显示,精准诊断的医学价值源于其实现更精确诊断的能力,以及基于精确诊断的差异化靶向治疗的选择。
在药物治疗的方面,PM通常与预测工具的使用有关,如通过生物标记物来选择治疗方案、调整剂量或监测反应。在过去十年里,将PM原则应用于临床的努力面临过挑战,但最终为临床转化确立了规范。检测药物基因变异,比如在乳腺癌治疗激素受体测试的基础上,曲妥珠单抗用于HER2阳性乳腺癌的治疗,自1998年获批以来,一直是当代靶向药物开发的范例。
在随后的几年里,药物-诊断联合开发的途径得到了很好的应用,靶向药物与配套的诊断试剂一同获得批准,这为临床药物开发的持续创新铺平了道路。在2010年代早期,对于某些肺癌(ALK阳性和EGFR突变阳性肿瘤)、乳腺癌和卵巢癌(BRCA突变阳性肿瘤)患者的治疗,在临床试验中显示出显著的肿瘤反应或延缓疾病进展。随着生物标志物检测的发展,临床试验和复杂而创新的试验设计也将随着诊治效率的需求而涌现。PM的原则已经对药物开发过程、监管框架和临床患者的诊断工作产生了切实的影响,因此PM的前景已经在许多方面得到了展现。
精准医学的挑战与机遇
未来十年,在PM领域很可能会诞生许多新的治疗方法和工具。PM在充分发挥其潜力方面还面临着许多挑战,也为疾病诊治水平的提升创造了新机遇。
在药物方面,新型治疗方法的种类已经扩大。微生物组、基因编辑和细胞疗法正吸引众多的研究,数据正在继续积累。从近期来看,用合成的寡核苷酸靶向RNA可能产生许多针对疾病潜在分子病理的新药。治疗脊髓性肌肉萎缩的Nusinersen和治疗遗传性转甲状腺变性淀粉样变的Patisiran等产品已证明,寡核苷酸药物可以通过改变核苷酸的组成,使产品能够为单个病人设计——真正的个性化药物。
对于典型的小分子和生物制剂来说,差距仍然存在。基因组研究已经能够发现各种癌症的分子驱动因素,并为评估药物在由分子特征确定的患者亚群中的作用创造了机会。在肿瘤之外,通过使用新的生物标记物来预测临床试验的丰富度仍然不常见。大规模基因组研究将有可能发现疾病易感的新标志物,发现具有新作用机制的药物开发的靶点。
关于生物标记物,药物开发项目已经超越了单一分析物来预测治疗结果。一个特定基因内的许多突变可能成为研发的目标。美国食品及药物管理局已经批准了对各种生殖系DNA特征的直接面向消费者的测试,包括药物遗传相互作用。目前正在以提高PM实践的一致性(在治疗建议、测试验证和实施以及解释方面)进行努力。
关于证据生成和分析,如暴露-反应分析、群体药代动力学和基于生理的药代动力学建模,以补充传统的临床试验范式,已经成为为特殊人群优化剂量的常规方法。与健康数据相关的基因组序列数据资源已呈指数级增长,这为表征治疗效益和安全性的可变性提供了新的机会。增强的数据分析(如机器学习和人工智能)可以告知如何管理单个患者,并成为临床决策支持工具的基础,帮助处方人员就地进行治疗和剂量选择。
伦理、法律和政策问题。PM中实施基因组检测会带来法律和伦理后果。引入共同的道德和法律上有效的政策框架、管理日益个性化的医疗保健和从疾病治疗到预防的转变的未来,从而实现真正的多学科融合的方法,实现PM的潜力。
结语
支撑PM的技术正在变革医疗保健生态,为罕见疾病开发了革命性的分子治疗方法。随着COVID-19的流行,科学结论已成为应对现有医学威胁的最佳答案;精准选择较小规模的临床试验可产生更大的效果,缩短上市前的时间,提升上市的可能性。监管当局应继续专注于确保医疗产品的质量、安全性和有效性,同时平衡创新的效益和风险。
在接下来的十年中,生物医学方法、计算算法和高分辨率数据的可用性将大大增加。实施需要国际合作的大胆计划,以吸引不同群体的参与者和科学家,深入分析人群,获得丰富的临床和研究数据,并通过真正的学习型医疗保健系统将这种知识应用于临床实践中,将帮助我们实现使PM面向所有人的愿景。