一个年度的盘点,也是下一个年度的起点
酸甜交错的2020离我们远去
充满期盼的2021向我们走来
【医悦汇】保持传统
诚邀肿瘤领域大咖
推出新年特辑【年度盘点】
总结盘点2020年度肿瘤学科进展
以字为媒,以言为镜
汇集和解读属于肿瘤学者的2020
第13期
北京大学肿瘤医院 邓大君教授
深圳大学医学院 朱卫国教授
中国医学科学院肿瘤医院 刘芝华教授
国家癌症中心 谭文教授
广州医学院 晏光荣教授
中南大学肿瘤研究所 陶永光教授
北京大学肿瘤医院 何忠虎教授
2020年度中国肿瘤病因学学科发展报告
特邀专家
盘点2020年度中国肿瘤病因学学科发展报告
癌症一直是人类尚未攻克的科学问题之一。随着世界人口的增长和人口老龄化,癌症对人类健康的影响越来越严重。2018年全球有1810万肿瘤新发病例和960万肿瘤相关死亡病例,其中约24%的新增肿瘤患者和30%的因肿瘤致死发生在我国[1-3]。值得注意的是,虽然我国的肿瘤发病率居世界中等,但是肿瘤致死率却排名世界前列。例如,全球每年约70万人死于原发性肝癌,其中超过一半死亡病例来自我国。美国所有肿瘤患者的5年生存率为66%,而我国仅为31%。
1
概述
我国居民的肿瘤流行谱具有一定的独特性,与发达国家存在显著差异。1)高发肿瘤类型不同:我国发病率最高的肿瘤分别为肺癌、肝癌、胃癌和食管癌,约占总诊出率的57%,在美国这一比例仅为18% [3];鼻咽癌的主要发病区域在中国;2)发病因素和肿瘤组织学类型不同。例如,我国的肝癌多以乙肝病毒(HBV)慢性感染引发,而发达国家主要以丙肝病毒(HCV)和非酒精性脂肪肝等引发;我国人群的食管癌以食管鳞癌为主,而欧美人群以食管腺癌居多。这些差异导致我国人群高发恶性肿瘤及其相关病因在发达国家研究较少,研究基础薄弱。因此,我国人群高发恶性肿瘤诊断和治疗的新方法研究要依靠我们自己。恶性肿瘤是一类病程漫长、病因复杂、“人间-时间-瘤内”异质性都十分显著的重大慢性疾病。整合从宏观到微观的多维度预警因素构建风险预测工具和风险分级标准,基于个体化风险评估实现精准化的病因学和发病学预防以及早诊早治,是恶性肿瘤整体防治工作的重要策略。按照切入时点与应用场景的不同,肿瘤风险预测可分为“发病风险预测”、“癌前病变进展风险预测”、“临床患者预后预测”三大类。其中,发病与病变进展风险预测服务于病因学预防及早诊早治工作。无论是在国际范围内还是在我国肿瘤防治工作领域,肿瘤风险预测已逐渐成为业界共同关注的研究方向。随着研究的不断进展,这一研究方向在肿瘤“防诊治”工作中的重要性与发展前景已逐渐得到广泛而深刻的认知。2
国际现状与研究进展
组蛋白修饰与DNA损伤修复
发现组蛋白五羟色胺化修饰(serotonylation)。组蛋白通过不同的共价修饰,引起染色质松散或紧致以及相对应的基因表达或沉默,从而发挥调控基因表达的作用。常见的组蛋白共价修饰包括了甲基化、乙酰化、磷酸化、泛素化,还有SUMO化、ADP核糖基化等等。这些修饰共同影响基因的表达以及细胞的命运,与癌症发生密切相关。随着研究的深入,组蛋白修饰的类型也日益丰富。非组蛋白的五羟色胺化修饰此前已有报道。2019年3月,Maze等人首次报道了神经递质5-羟色胺在转胺酶TGM2的作用下转移到组蛋白H3,并对H3组蛋白进行五羟色胺化修饰(serotonylation),进而影响染色质结构和调控基因表达[4]。发现组蛋白去甲基化酶是直接的氧感应器。在各种已知的组蛋白共价修饰中,甲基化修饰研究最多,与肿瘤发生关系最为密切。长期以来,人们观察到肿瘤细胞在缺氧条件下侵袭性更高。缺氧会诱导组蛋白赖氨酸高甲基化,但具体是通过氧浓度直接作用还是通过HIF间接作用尚未明确。2019年3月,Science连续发表了多篇有关氧浓度与组蛋白去甲基化修饰关系的文章[5-7]。Chakraborty等人报道了缺氧促进组蛋白甲基化,并不依赖于HIF和2-HG等间接途径。他们发现组蛋白去甲基化酶KDM6A能够直接感应氧浓度,进而影响染色质结构和基因表达调控[5]。Batie等人则发现,JmjC-组蛋白去甲基化酶(比如KDM5A)的存在,导致了染色质对氧的感应[6]。Gallipoli等人更是提出了组蛋白修饰因子就是氧感应器的观点[7]。发现NSD1是一种新的跨染色质调节途径。2019年9月,Weinberg等人报道了在基因间区招募DNMT3A和维持DNA甲基化必须依赖于NSD1介导的H3K36me2,阐明控制基因间DNA甲基化的建立和维持的机制,揭示了一种新的跨染色质调节途径,有助于更好地了解异常基因间CpG位点甲基化与和恶性肿瘤的相关性[8]。发现组蛋白泛素化可与甲基化和去乙酰化同时发生,相互作用。组蛋白修饰有时会多种修饰同时交叉进行,共同调控基因表达。Worden等人发现,Dot1L甲基转移酶与H2B泛素化核小体结合,引起组蛋白H3的构象变化,从而使Dot1L能够访问和甲基化H3k79,揭示了组蛋白泛素化与甲基化的共同作用[9]。Żylicz等人发现,在X染色体灭活(XCI)过程中,组蛋白去乙酰化和H2AK119泛素化是最早同时发生的,而且只有在组蛋白去乙酰化和基因沉默的情况下,积聚在基因间的PRC1-H2AK119Ub和PRC2-H3K27me3才能扩散到基因中,揭示了X染色体灭活启动期间染色质事件的层次,再次证明了组蛋白多种修饰是同时进行的[10]。发现酒精代谢产物可直接乙酰化大脑组蛋白,乳酸可引起组蛋白乳酸化修饰(lactylation)。越来越多的证据表明,表观遗传调控取决于细胞的代谢状态。在神经元中,组蛋白的乙酰化依赖于代谢物乙酰辅酶A。后者是由染色质结合的乙酰辅酶A合成酶2(ACSS2)催化乙酸盐产生,而肝脏中酒精的分解是人体乙酸盐的主要来源。Mews等人发现,酒精的代谢有助于大脑中组蛋白的快速乙酰化,并且这部分是通过将酒精中衍生的乙酰基直接沉积到组蛋白中发生的。这些发现表明,酒精代谢可通过对大脑的组蛋白进行乙酰化,从而影响基因调控[11]。组蛋白修饰与代谢相关的另一个重要发现是乳酸的表观遗传调控作用。与正常细胞采用有氧条件下的葡萄糖氧化磷酸化代谢方式不同,肿瘤细胞即使在有氧条件下也倾向于采用糖酵解的能量代谢方式。由此产生的大量乳酸堆积,以前只被认为单纯的能量代谢产物。芝加哥大学的赵英明和Becker团队发现,肿瘤细胞糖酵解代谢过程产生的乳酸可以作为前体物质,引起组蛋白赖氨酸发生乳酸化修饰,并改变巨噬细胞的免疫功能[12]。该发现有利于我们进一步了解乳酸的功能及其在癌症等病理生理过程中的作用。发现在恶性肿瘤组织中oncohistone突变广泛存在。Nacev等人通过对数千例肿瘤标本数据分析发现,除了组蛋白H3.3的致癌突变以外,H3.1/3.2、H2A、H2B和H4中也发现了致癌突变,这些突变在组蛋白游离N端和组蛋白球状结构中均有存在,证明了在恶性肿瘤组织中突变oncohistone的广泛存在,提示组蛋白突变可能以某种方式促进恶性肿瘤的生长[13]。DNA修饰在真核生物中5-甲基胞嘧啶(5mC)是基因组DNA最主要的甲基化修饰,而在原核生物中6mA是基因组DNA最主要的甲基化修饰(DNA 6mA甲基化修饰用6mA来表示;RNA 6mA甲基化修饰用m6A表示)[14,15]。m6A甲基化修饰在真核生物RNA上频繁出现,其在RNA剪切、RNA稳定、RNA翻译和基因表达调控等方面扮演重要角色[16-19]。然而,基因组DNA 6mA甲基化修饰一度认为只在原核生物中存在,在真核生物中不存在[15]。随着深度测序技术的发展,当前在衣藻、线虫、果蝇、真菌、猪、斑马鱼、小鼠等真核生物基因组DNA中也发现了6mA修饰存在[20-24]。我国学者晏光荣发现人类基因组DNA中同样存在微量6mA[25]。随后美国加州大学Rich教授在人神经胶质瘤干细胞基因组DNA上也发现存在6mA,并发现ALKBH1是基因组6mA的去甲基化酶;他们还发现DNA 6mA修饰在神经胶质瘤干细胞中上调,具有促使神经胶质瘤的功能[26]。2019年4月Bredy团队报道,在小鼠大脑皮质神经元内存在基因组6mA修饰[27],并且证实晏光荣团队发现的人基因组6mA甲基化酶N6AMT1同样催化小鼠基因组6mA修饰。2020年3月德国Niehrs团队报道,采用同位素结合质谱策略也证实在包括人在内的哺乳动物基因组DNA上存在6mA修饰[28]。2020年3月芝加哥大学何川团队报道,哺乳动物中的DNA 6mA修饰主要富集在线粒体基因组DNA上[29],与晏光荣团队发现的人细胞6mA修饰主要富集在线粒体DNA上的发现一致。2020年2月外国学者发表的2篇背靠背研究论文[30,31],解析了晏光荣团队发现的人类基因组DNA 6mA去甲基化酶ALKBH1的结构,确定了其去6mA甲基化修饰的功能结构方式,确认ALKBH1通过与局部非配对DNA底物(如:DNA上bulge、R-loop、D-loop和Stem loop结构)结合,催化DNA的去6mA甲基化。
肿瘤基因组
美国国家癌症研究所和国家人类基因组研究所开启的TCGA和全球癌症基因组协会建立的国际癌症基因组联盟(ICGC),为达到泛癌分析以及实现标准化目标,成立了Pan-Cancer Analysis of Whole Genomes(PCAWG)联盟。该计划主要整合分析38种肿瘤类型,获得了2658个肿瘤的全基因组信息,2020年在Nature杂志上连发6篇文章[32-37],提出了目前为止最为全面的癌症基因组分析。这是癌症研究和云计算的一个里程碑,扩充了我们对于驱动基因、突变特性、结构改变等方面的理解,丰富了对癌症发生发展的认识。需要注意的是,由于暂时缺少临床信息的支撑,这些结果的临床指导意义(比如治疗方法、临床收益等)还有待充实。
肿瘤易感性
2017年TCGA协作组发表了对食管癌的分子特征多组学整合分析,认为食管鳞癌和食管腺癌是两种截然不同的癌症,食管腺癌与胃腺癌的染色体不稳定类型非常相似[38]。2019年发表的一项胃食管返流疾病(GERD)全基因组关联研究(GWAS)的荟萃分析,包括了来自英国、美国和澳大利亚的GERD、Barrett食管和食管腺癌合计80,265例,正常对照305,011例。该研究一共发现了25个GERD易感位点,其中有91%的GERD易感位点也是食管腺癌和/或Barrett食管的易感位点[39]。国内外开展的多项结直肠癌GWAS研究目前已经发现至少50多个易感位点,其中三分之一的易感位点是来自以东亚人种为研究对象的研究。2019年美国范德堡(Vanderbilt)大学医学院的Zheng Wei等报道了一项大规模的结直肠癌GWAS易感位点研究[40],包括了亚洲人种的22,775例结直肠癌和47,731例正常对照,欧洲人种的57,976病结直肠癌和67,242例正常对照。该研究发现,在以前报道的52个结直肠癌易感位点中,41个位点得到验证;在亚洲人种中新发现了13个结直肠癌易感位点,其中6个也与欧洲人种的结直肠癌易感性相关;前8个显著相关的位点分别位于L1TD1、EFCAB2、PPP1R21、SLCO2A1、HLA-G、NOTCH4、DENND5B和GNAS基因内或其附近。这些基因主要参与调节免疫反应、Wnt信号通路和细胞增殖等过程。2019年1月发表的罕见遗传变异对结直肠癌风险的贡献的全基因组测序研究(包括1,439例结直肠癌和720例正常对照)和125,478个体的荟萃分析,发现了40个新的结直肠癌易感位点,同时还确定了CHD1内含子区rs145364999罕见遗传变异对散发性结直肠癌发生有保护作用[41]。
肿瘤风险预测与精准防治
西方国家针对其高发恶性肿瘤开展风险预测研究,整体基础较为扎实,研究数量大,涵盖瘤种多,多采用大规模前瞻性人群队列研究等高等级设计,更广泛开展风险预测模型的验证性与实证性评价研究。通过这些系统性的基础开发与应用转化研究,已经促使一些恶性肿瘤风险预测工具和风险分级标准走上了临床实践应用阶段,并不断获得更新与校正。比如应用最为广泛的预测乳腺癌发病风险的Gail模型,从1989年发布第一个版本至今[42],依据不同人群、不同设计的研究进展,进行了多次修改和升级,已将应用对象从白种人扩展到非裔美国人、西班牙裔美国人、亚裔美国人、美国印第安人和阿拉斯加本地人等,其在不同场景下风险预测的应用绩效也得到反复证实[43-45]。传统的Gail模型仅包含年龄、初潮年龄、初产年龄、乳腺活检次数、患有乳腺癌的一级亲属数量等“不可变”宏观因素。之后又基于新的研究证据逐渐增补了一系列“可变因素”,如“接受筛查意愿”、“口服避孕药服用”、“饮酒”及“他莫昔芬服用”等变量。而近年来,随着高通量测序等生物检测技术的飞速发展,组学数据(如GWAS研究所发现的差异性遗传易感位点)也被尝试纳入模型进行绩效评估。系列大规模人群研究显示,在原有传统危险因素的基础上增加既往发现的易感基因数据,可在一定程度上增加模型预测效果。但是总体上增加幅度比较有限,遗传信息所能提供的预测能力较之传统宏观因素仍有较大差距。加之组学数据获取的便捷性与成本问题,因此尚未向临床应用推荐[46-48]。
3
我国研究现状与进展
组蛋白修饰和DNA损伤修复领域
发现组蛋白变体H2A.Z帮助真核生物选择基因组DNA复制起点。DNA复制是一个严格调控的过程,细胞本身有一套机制确保在细胞周期中基因组得到精确的复制。一旦DNA复制出错,将会导致复制错误甚至细胞癌变等严重后果。在真核生物中,染色质存在多个复制起点,复制起点的选择和激活受到DNA序列和染色质特征的共同调控。但是,表观遗传因素的调节机制目前仍未完全清楚。中科院生物物理所的李国红与朱明昭团队的研究发现,H2A.Z通过SUV420H1-H4K20me2-ORC1通路,指导细胞选择染色质复制起点,解决了真核生物在DNA复制过程如何选择复制起点的关键问题[49]。发现GLP促进53BP1招募,SIRT7调控ATM,参与DNA损伤修复应答。人体细胞在正常代谢过程中每天发生上千到百万次的DNA损伤,如若得不到及时修复或发生修复错误,将引起基因组不稳定,严重的将导致癌症等疾病发生。在DNA损伤修复过程中,53BP1的招募是一个关键事件,许多重要的影响因子参与该过程。此前已有报道H4K16ac可以抑制H4K20me2对53BP1的招募,且H4K16ac在DNA损伤修复中是动态变化的。深圳大学医学院朱卫国团队发现组蛋白甲基转移酶GLP催化的H4K16me1修饰可以和H4K20me2协同作用,共同促进53BP1的招募,发挥着与H4K16ac相反的功能,该过程独立于G9a的招募,而且ATM参与其过程[50]。DNA损伤修复过程中另一个关键事件是ATM的激活与解离。关于DNA损伤引起ATM激活此前已有许多报道,但是当损伤修复完成后,ATM是如何解离并且失活的,尚未有清晰的报道。朱卫国团队报道了组蛋白去乙酰化酶SIRT7在DNA损伤应答后期会被招募到染色质上,引起ATM的去乙酰化和失活解离,从而完成DNA损伤修复过程;一旦SIRT7缺失或ATM维持乙酰化,将引起ATM的持续磷酸化和激活,导致DNA损伤得不到修复[51]。该研究首次阐述了组蛋白去乙酰化酶SIRT7调控ATM,参与ATM失活及在DNA损伤应答中的重要作用,是ATM通路和DNA损伤修复的重要发现。发现m6A修饰在基因转录调控过程中的重要机制。2019年3月中山大学杨建华团队与美国的陈建军、何川、黄刚三个团队一起报道了RNA m6A修饰在基因转录调控过程中的作用机制。m6A修饰是在真核细胞mRNA中最高丰度的修饰类型,具有基因转录调控功能,在各种正常和病理过程中发挥关键作用,但如何沉积到转录组,分子机制并不明确。这几个团队发现,H3K36me3被METTL14直接识别并结合,METL14是m6A甲基转移酶复合物(MTC)的关键组成部分,进而促进m6A MTC与相邻的RNA聚合酶II结合,从而将m6A MTC传递到主动转录的新生RNA上[52]。该项发现揭示了表观基因组与表观转录组之间的关联性,为表观遗传研究领域开辟了新方向。发现MLL/COMPASS引起H3K4甲基化的分子机制。组蛋白H3K4甲基化主要由一类名为MLL(Mixed Lineage Leukemia)甲基转移酶蛋白家族完成,其在酵母中对应的是一类被称为COMPASS的复合物。MLL与COMPASS通过对转录起始位点(TSS)的H3K4甲基化,激活基因转录,进而调控基因表达。一旦MLL基因突变,将导致白血病及多种恶性肿瘤的发生。但MLL如何甲基化H3K4以及与核小体如何相互作用不清楚。2019年9月,上海交大的黄晶团队报道了H2BK120单泛素化对MLL甲基化调控的影响,揭示了WDR5蛋白在MLL发挥甲基化酶作用过程中的关键作用和分子机理,揭示了染色质的核小体结构对组蛋白修饰酶MLL复合物的酶活调控及其分子机制[53]。浙江大学陈军团队则报道了基因突变产生的无义mRNA的降解过程所需要的Upf3a蛋白,会与COMPASS复合物直接作用,激活同源基因表达,解释了遗传补偿效应的分子机制[54]。该两项发现均揭示了组蛋白H3K4甲基化的分子机制,对于组蛋白甲基化的表观遗传调控机制具有意义。
DNA甲基化研究领域
TET双加氧酶可以对胞嘧啶的5位甲基进行逐步氧化,依次生成5-羟甲基胞嘧啶(5hmC)、5-醛基胞嘧啶(5fC)以及5-羧基胞嘧啶(5caC)。后两者可以被TDG糖苷酶识别,通过碱基切除修复途径,完成DNA主动去甲基化过程。中科院上海细胞生化所徐国良团队新近发现,在真核单细胞模式生物—莱茵衣藻(Chlamydomonas reinhardtii)中,TET同源蛋白可以将维生素C的半个分子的碳基骨架转移到DNA上,从而产生一种全新的DNA表观修饰[55],拓展了DNA结构与功能的内涵,并加深了人们对生物适应环境机制的认识。北京大学肿瘤医院邓大君团队发现当启动子CpG岛携带高密度的5hmC位点时,基因更容易转录激活,揭示了保留在DNA分子中5hmC的生物学功能[56]。广州医科大学第三医院学者晏光荣团队第一个证实人类基因组DNA存在6mA甲基化修饰。他们发现6mA甲基化修饰频繁出现在在人基因组含有AGG motif的位点上,显著富集在基因组外显子区,特别富集在基因转录终止位点(TTS),并且与基因的转录水平呈正相关;他们进一步发现N6AMT1是人DNA 6mA修饰的甲基化酶,确定了N6AMT1上NPPY基序(122-125aa)是决定N6AMT1甲基化酶活性的关键结构域;他们还发现ALKBH1是人DNA 6mA修饰的去甲基化酶,确定ALKBH1上233位的天冬氨酸(D233)是决定ALKBH1去甲基化酶活性的关键位点[25]。他们还证实人肝癌、胃癌、结肠癌等肿瘤基因组DNA 6mA水平的下调与肿瘤恶性病理表型和肿瘤患者预后差密切相关;人肝癌、卵巢癌基因组DNA 6mA水平的下调促进了肿瘤的发生发展。
肿瘤基因组研究
恶性肿瘤的发生发展是一个复杂的过程,基因组变异、表观遗传修饰变化、基因表达水平和代谢物水平异常都可能是引起肿瘤发生的重要因素。通常,在肿瘤机制探究和致病靶点筛选上,优先考虑基因组变异的因素。如今,多组学联合的研究方法已成为主流,无论是在致病机理研究,还是筛选肿瘤标志物与致病靶点,以及早期诊断和治疗上都可能发挥重要作用,多组学全方位、多维度的研究已经成为趋势。2019年-2020年,中国科学家在肿瘤基因组的研究上也做出了巨大贡献,数篇肿瘤组学相关的研究应用见刊于Nature、Cell、Cancer Cell等顶级期刊,为生命科学与精准医学领域增添了浓墨重彩的一笔[57-62]。第三军医大学(陆军医科大学)卞修武、刘新东及清华大学董晨共同研究发现了耐受性T细胞的全基因组表观遗传和基因表达特征[59],并表明它们不同于效应和调节性T细胞。转录因子NR4A1的过表达抑制效应T细胞分化,而NR4A1的缺失克服了T细胞耐受性并夸大了效应功能,以及增强对肿瘤和慢性病毒的免疫力。复旦大学中山医院樊嘉、中科院上海药物研究所周虎、中科院细胞生化所高大明团队联合,研究了159例CHCC-HBV和配对癌旁肝组织基因组学、转录组学、蛋白质组学、磷酸化修饰组学等变化[60],揭示了肝癌细胞的分子特性,全面解析了肝癌的发生和发展机制,为肝癌的精准分型、个体化治疗和预后判断提供了新的思路。复旦大学肿瘤医院邵志敏和黄薇团队、复旦大学肿瘤医院石乐明和王鹏团队,与美国和英国研究人员一起,成功绘制了全球最大的三阴性乳腺癌队列多组学图谱[61],揭示三阴性乳腺癌不是单一类型癌症,拥有独特的不同亚型;不同亚型之间可能在生存率、治疗敏感性方面存在差异。中国医学科学院肿瘤医院刘芝华与北京大学肿瘤医院詹启敏和百度李彦宏团队联合,研究了508例食管鳞癌患者基因组,发现了多个与食管鳞癌临床相关的编码和非编码基因组改变,并揭示了三种可用于预测患者的预后的主要亚型;他们利用大量中国患者队列的深度全基因组测序,提供了迄今为止最全面的食管鳞癌基因组特征,为后续开发可用于诊断和治疗的特异性生物标志物进一步奠定了基础[62]。
肿瘤易感性研究领域
2019年南京医科大学沈洪兵团队开展了的肺癌前瞻性队列GWAS研究,通过对19,546份非小细胞肺癌病例及对照样本基因分型,确定了与非小细胞肺癌发病风险显著相关的19个遗传易感位点,其中6个为新发现的易感位点;结合所有已报道过的遗传变异和此次新发现的易感位点,构建了中国人群肺癌多基因遗传风险评分,并且在独立的“中国嘉道理生物银行”的中国慢病研究队列得到了验证[63]。基于超大规模人群样本而构建的这套多基因遗传风险评分方法,能够较好地预测中国人群的个人肺癌风险,初步建立了中国人肺癌易感性预测模型。中国医学科学院肿瘤医院林东昕和吴晨教授团队在全基因组范围内对环境和遗传因素在食管鳞癌发病中的交互作用研究方面取得了成绩。他们与华中科技大学缪小平团队合作,通过对10,716例食管鳞癌病例和12,637例正常对照的大规模GWAS研究,发现了包含视黄酸代谢酶CYP26B1在内的6个中国人群食管鳞癌易感基因[64]。胃癌的发生有一定的家族聚集倾向,超过15%的胃癌患者有胃癌家族史。重庆医科大学学者对2018年7月前发表的胃癌易感性相关研究数据的荟萃分析发现,在已经报道的61个胃癌易感位点中,29个与胃癌的相关性未达统计意义;与胃癌的易感性关联最强的9个基因的遗传变异分别是APE1 (rs1760944)、CASP8 (rs3834129)、DNMT1 (rs16999593)、ERCC5 (rs751402)、GSTT1 (null/presence)、IL-17F (rs763780)、MDM2 (rs2278744)、PPARG (rs1801282)和TLR4 (rs4986790) [65]。对来自亚洲人种的五个胃癌GWAS研究结果的荟萃分析揭示,有13个遗传变异位点与亚洲人的胃癌显著相关,其中8个变异位点增加胃癌风险,5个变异位点降低胃癌风险。2019年南京医科大学学者靳光付对来自中国人胃癌(2,631例)和正常对照(4,373例)的GWAS数据做多标志物分析,发现细胞周期检验点信号通路、钾离子输入通路和白细胞介素-7通路与胃癌风险显著相关,免疫和感染炎性过程和钾离子运输可能参与胃癌的发展,NM1和RAC1可能是新的胃癌相关的关键基因[66]。近十年来,国内外开展了多项不同人种的乳腺癌GWAS研究,发现了至少180多个易感SNP位点,增加了对乳腺癌的遗传易感因素的认识。2019年天津医科大学肿瘤医院陈可欣教授团队系统检索国内外发表的乳腺癌易感性相关的GWAS研究[67],确定适合用于中国女性乳腺癌筛查的候选SNP。最终结合模拟人群的危险因素的分布情况,评价基于目标SNP计算得到的综合遗传风险分值在风险预测、风险再分类以及乳腺癌高危筛查策略中乳腺癌覆盖率的影响来评价目标SNP的应用价值。结果共发现12个SNP可用于预测乳腺癌高危人群。GWAS筛选出的目标SNP可提高乳腺癌检出率、乳腺癌总体风险预测准确性,并有助于在乳腺癌筛查前发现潜在的乳腺癌高危人群。EBV感染在世界范围内普遍存在,并与包括鼻咽癌在内的多种癌症有关。EBV的病毒基因组变异在鼻咽癌发生发展中的重要性及其在华南地区的流行规律尚未得到充分的研究。通过与中山大学肿瘤防治中心曾益新团队的合作,新加坡人类遗传与基因组研究所刘建军教授研究了与鼻咽癌高风险相关的EBV高危亚型。他们通过比较鼻咽癌高发地区和散发地区的鼻咽癌和正常对照的样本中EBV序列,发现高发区鼻咽癌的发生与EBV高危亚型BALF2_CCT感染相关,BALF2的变异累积效应占华南地区鼻咽癌发病总体风险的83%,与感染低危亚型的BALF2_ATC相比,感染BALF2_CCT者鼻咽癌发病风险增加了11倍[68]。为进一步分析中国人和欧美人种NK/T细胞淋巴瘤的遗传易感基因差异,中山大学肿瘤防治中心贝锦新联合国内外多家团队,开展两阶段NK/T细胞淋巴瘤的全基因组水平的基因变异信息和关联分析,发现人6号染色体HLA区域编码人类白细胞抗原I类(HLA-A/B/C)和II类分子(DR、DQ、DP等)是识别抗原和调节免疫系统的重要分子,HLA-DPB1(rs9277378)、HLA-DRB1(rs9271588)和IL18RAP(rs13015714)是NK/T细胞淋巴瘤易感位点[69]。
肿瘤风险预测与精准防治
我国在肿瘤风险预测方面的工作虽起步较晚,基础较差,但近五年在研究数量、设计质量方面有明显提高。近五年肿瘤风险预测研究数量的年平均增速保持在30%以上。其中,多中心研究占比已接近40%,而样本量超过2000人的大样本研究占比接近50%,广泛涵盖我国高疾病负担的恶性肿瘤,如肺癌、肝癌、结直肠癌、食管癌、乳腺癌等。从风险预测工作覆盖度而言,进展较为突出的是食管癌的系统性风险预测与分级研究工作。有北京大学肿瘤医院研究所柯杨/何忠虎教授课题组基于在我国太行山高发区长期开展的大规模前瞻性人群队列[70]率先构建了首个具有应用价值的“食管癌发病风险预测模型”[71],实现了内镜筛查前的高危人群识别与富集,明确降低了无效筛查比例,节约了费用和内镜筛查附带损害,提高了筛查效果;同时,利用基线筛查、阶段内镜复查以及长期纵向随访数据,创新性地联合基线“内镜下碘染色异常特征”与“病理诊断”等暴露因素,前瞻性地建立了“食管病变进展风险预测模型”[72],实现了进展风险评估的精准化与个体化,使得筛查后有针对性地制定内镜复查策略成为可能。;在此基础上,该团队进一步前瞻性评价初始筛查中“内镜下碘染色异常特征”对早期食管癌前病变进展风险的预警作用,首次证明“染色不良区域大小”在食管病变进展风险预警中的关键作用,并以此提出了有效易行的“食管病变精准内镜监测新方案”,填补了我国相关指南中这一问题的证据空白[73]。在人群研究的基础上,该课题组继续关注食管癌的“临床机会性筛查”模式,开展多中心真实世界研究,在北方高发区及南方非高发区构建并验证了首个适用于我国“食管癌临床机会性筛查”的精准风险预测模型[74],为这种新的筛查模式在我国的建立与推广提供了重要的科学前提。上述系统性工作不仅初步建立了我国自主知识产权的“食管鳞癌精准筛查与防治策略”的理论架构和证据体系,更为我国其他恶性肿瘤防治工作的精准化与个体化进程提供了重要经验和思路。
4
存在问题、解决方案与建议
随着科学技术的发展,尤其是计算机与人工智能的快速发展,虽然近几年生命科学研究在很多领域取得了重大突破,癌症仍一直是一个尚未攻克的难题。究其原因,癌症的发生是一个多通路的复杂事件,涉及的通路和影响因素数不胜数。肿瘤细胞糖代谢模式转换的开关是什么。2019年的诺贝尔生理学或医学奖授予了三位在“细胞如何感知和适应氧气供应”方面取得突出贡献的三位科学家,氧气的感知与能量代谢广泛参与人体各种生理病理过程,2019年虽然在该领域取得不少突破,比如上述提到的组蛋白去甲基化蛋白酶是氧感应器等报道,但肿瘤细胞为何倾向于糖酵解而正常细胞为何采用有氧氧化能量代谢方式,仍是一个尚未回答的问题。非编码RNA的功能确定。此外,无义mRNA怎么介导对同源基因转录的表观调控,其分子机制也未完全清楚,基因组中的真正被转录翻译成为蛋白质的基因只占了整个基因组极少的部分,对于其余的“垃圾(Junk)”基因,其作用是什么,至今也是知之甚少。回答肿瘤细胞为何能够永生。正常细胞经过多次分裂之后由于端粒太短失去功能而最终死亡,但恶性肿瘤细胞由于端粒酶活性比较高,端粒酶能够使每次细胞分裂而逐渐缩短的端粒长度得以补偿,进而维持肿瘤细胞端粒的长度,使其无限扩增成为了可能。但为何肿瘤细胞的端粒酶活性比正常细胞高,至今仍是未知。如果能够解决端粒酶的问题,人类在抗衰老与抗肿瘤的问题也许会有较大的突破。确定分子相互作用的真实方式。表观遗传学自1942年Conrad H. Waddington首次提出来,至今已有接近80年的时间,在这几十年的时间里,人们对表观遗传在基因调控的影响有了很多深刻的理解和重大的发现。人们知道了越来越多类型的组蛋白修饰,发现了组蛋白修饰在基因调控过程中的重要作用,以及其分子作用机制,但仍有很多未知的难题未能解决。技术瓶颈。面对癌症这个困扰人类几个世纪的难题,想要完全攻克,需要借助更多高新的技术。微观上,需要更精确更快速的检测技术,比如更加精确的激光共聚焦显微镜和冷冻电镜,甚至是开发出新型的显微镜,宏观上,需要更高通量和更全面的筛查技术,比如更先进准确的质谱技术,能自动处理分析大量病理数据的人工智能技术等等,借助这些先进的工具,人类可以缩短攻克癌症的时间。同时我们需要寻找更多的肿瘤抑制靶点和激活人体免疫防线。像PD-1等靶点药物,在某些肿瘤已经取得良好的疗效,但像此类的靶点还是太少,远远不够。近年来,癌症免疫疗法成为继手术、化疗、放疗和靶向疗法之后又一抗癌手段,成为研究的热点。如果能够激活人体自身免疫系统,阻断肿瘤细胞逃逸免疫监视,加上配合靶向治疗等手段,将能明显改善肿瘤病人的生活质量与延长肿瘤病人的生存期。确定表观遗传变异是否为细胞癌变的驱动因素。虽然在肿瘤细胞中发现了包括DNA甲基化和组蛋白修饰在内的大量的表观遗传变异,对于这些变异是否能够象基因突变一样导致细胞癌变和肿瘤发生至今缺乏直接证据。人基因组DNA 6mA修饰的研究刚刚兴起,对于6mA修饰在肿瘤发生发展中的作用,目前只有极少的线索。确定SNP的应用价值。虽然携带高危SNP基因型的个体患癌风险高于携带低危基因型者,并不是说携带低危基因型的人对癌症存在抵抗力。因此SNP研究结果一直没有纳入指导肿瘤预防的指南中。随着各种肿瘤易感性相关SNP的不断发现,如何将这些SNP研究结果应用到肿瘤预防实践(例如人群肿瘤发生危险性分层以及人群筛查和干预)中显得尤为重要。在目前国内外开展的SNP应用尝试中,绝大多数停留在探讨这些SNP的风险预测补充价值上,很少探讨SNP在癌症筛查中的可能价值。是否可选取适量的SNP组合来进行癌症筛查,是后GWAS时代亟待解决的问题。我国恶性肿瘤风险预测研究存在缺陷。包括:(1)研究设计级别总体不高。对于肿瘤发病风险预测而言,为避免“时序不清”导致的“因果倒置”,最理想的研究设计为基于人群的前瞻性队列研究。然而目前我国所报道的肿瘤风险预测研究中80%以上是基于临床医院的肿瘤患者开展,这使得所构建模型在证据级别及结果可靠性方面的存在天然的局限,也是预测模型被肿瘤防治一线采纳和推广的主要障碍;(2)风险预测指标维度单一。肿瘤是多因单果的复杂疾病,受限于人们当前对肿瘤病因认识程度以及数据可获得性的不足,肿瘤发病、进展等事件的风险预测指标不应是单一维度,而应尽可能全面涵盖宏观预测因素(个人特征、环境暴露因素、感染因素、疾病史与家族史等)与微观预测因素(先天遗传易感、后天体细胞水平改变、表观遗传因素、血清学等实验室检测指标等)。然而,目前所开展研究在候选预测变量的丰富性与全面性方面仍明显不足,难以广泛评估、筛选宏观与微观潜在预测指标,导致模型的风险预测能力与绩效往往不甚理想;(3)模型的升级与人群适应性研究不足。不同于其他研究设计类型(如危险因素研究),风险预测研究所产生的科研结果、形成的工具和标准最终要走向临床和疾病防治一线,而其生命力就在于不断的获得更新与人群适应性的修正。因此,风险预测模型的提出只是起点,后续应不断开展新的人群和临床研究,基于新的数据对已有模型的指标结构与权重进行不断更新,对模型在不同人群中的适应性与绩效进行系统性评价,以促进风险预测工具的转化应用。在攻克癌症之前,人类需要重视早期筛查的重要性,必须扩大筛查范围和提高筛查的准确度。很多癌症在早期是可以被消灭和治愈的,一旦拖至中晚期,将错失最佳治疗时间,只能采取保守治疗方案,疗效和预后也不甚理想。针对这些缺陷,为本领域能够尽快获得突破性进展,实现整体研究水平的国际接轨,应首先在高规格组织架构与顶层设计前提下,建立公平、科学的权益分配与交流共享体系,全面整合全国已有良好基础的大型人群队列资源,集中优势的流调数据、生物样本、检测数据资源,形成跨地域、跨病种的综合研究平台,通过“专病队列建模、其他病种队列交叉验证”的整体设计,同一时间系统开发多个病种、多维度指标、多个切入点的风险预测工具及风险分级标准。同时建立风险预测研究成果孵育与转化平台,联合学术及产业机构,对风险预测研究所产生的成果进行更大范围的推广应用,最终助力科研成果向临床与公共卫生一线的转化,使其创造应有的价值。总之,随着科技的发展和人类对肿瘤的认识的越发深刻与全面,我们对抗肿瘤的手段也正在变得越来越多。相信在未来,癌症将不再是不治之症。参考文献
[1] Siegel RL, et al. Cancer statistics, 2020. CA Cancer J Clin. 2020, 70(1): 7-30.
[2] Bray F, et al. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin. 2018, 68(6): 394-424.
[3] Chen W, et al. Cancer statistics in China, 2015. CA Cancer J Clin. 2016, 66(2): 115-132.
[4] Lorna A Farrelly et al. Histone serotonylation is a permissive modification that enhances TFIID binding to H3K4me3. Nature. 2019, 567(7749): 535-539.
[5] Chakraborty AA, et al. Histone demethylase KDM6A directly senses oxygen to control chromatin and cell fate. Science. 2019, 363(6432): 1217-1222.
[6] Batie M, et al. Hypoxia induces rapid changes to histone methylation and reprograms chromatin. Science. 2019, 363(6432): 1222-1226.
[7] Gallipoli P & Huntly BJP. Histone modifiers are oxygen sensors. Science. 2019, 363(6432): 1148-1149.
[8] Weinberg DN, et al. The histone mark H3K36me2 recruits DNMT3A and shapes the intergenic DNA methylation landscape. Nature. 2019, 573(7773): 281-286.
[9] Worden EJ, et al. Mechanism of cross-talk between H2B ubiquitination and H3 methylation by Dot1L. Cell. 2019, 176(6): 1490-1501.e12.
[10] Żylicz JJ, et al. The Implication of Early Chromatin Changes in X Chromosome Inactivation. Cell. 2019, 176(1-2): 182-197.e23.
[11] Mews P, et al. Alcohol metabolism contributes to brain histone acetylation. Nature. 2019, 574(7780): 717-721.
[12] Zhang D, et al. Metabolic regulation of gene expression by histone lactylation. Nature. 2019, 574(7779): 575-580.
[13] Nacev BA, et al. The expanding landscape of 'oncohistone' mutations in human cancers. Nature. 2019, 567(7749): 473-478.
[14] Luo GZ, et al. DNA N(6)-methyladenine: a new epigenetic mark in eukaryotes? Nat Rev Mol Cell Biol. 2015, 16(12): 705-710.
[15] Ratel D, et al. N6-methyladenine: the other methylated base of DNA. Bioessays. 2006, 28(3): 309-315.
[16] Xiao W, et al. Nuclear m(6)A Reader YTHDC1 Regulates mRNA Splicing. Mol Cell. 2016, 61(4): 507-519.
[17] Huang H, et al. Recognition of RNA N(6)-methyladenosine by IGF2BP proteins enhances mRNA stability and translation. Nat Cell Biol. 2018, 20(3): 285-295.
[18] Alarcon CR, et al. HNRNPA2B1 Is a Mediator of m(6)A-Dependent Nuclear RNA Processing Events. Cell. 2015, 162(6): 1299-1308.
[19] Zhu S, et al. An oncopeptide regulates m(6)A recognition by the m(6)A reader IGF2BP1 and tumorigenesis. Nat Commun. 2020, 11(1): 1685.
[20] Fu Y, et al. N6-methyldeoxyadenosine marks active transcription start sites in Chlamydomonas. Cell. 2015, 161: 879-892.
[21] Greer EL, et al. DNA Methylation on N6-Adenine in C. elegans. Cell. 2015, 161: 868-878.
[22] Wu TP, et al. DNA methylation on N(6)-adenine in mammalian embryonic stem cells. Nature. 2016, 532: 329-333.
[23] Zhang P, et al. N6-methyladenine DNA modification in Drosophila. Cell. 2015,161: 893-906.
[24] Douvlataniotis K, et al. No evidence for DNA N6-methyladenine in mammals. Sci Adv. 2020, 6(12):eaay3335.
[25] Xiao CL, et al. N(6)-Methyladenine DNA Modification in the Human Genome. Mol Cell. 2018, 71(2): 306-318.
[26] Xie Q, et al. N6-methyladenine DNA Modification in Glioblastoma. Cell. 2018, 175(5): 1228-1243.e20.
[27] Li X, et al. The DNA modification N6-methyl-2'-deoxyadenosine (m6dA) drives activity-induced gene expression and is required for fear extinction. Nat Neurosci. 2019, 22(4): 534-544.
[28] Musheev MU, et al. The origin of genomic N6-methyl-deoxyadenosine in mammalian cells. Nat Chem Biol. 2020, 16(6): 630-634.
[29] Hao Z, et al. N6-Deoxyadenosine Methylation in Mammalian Mitochondrial DNA. Mol Cell. 2020, 78(3): 382-395.e8.
[30] Zhang M, et al. Mammalian ALKBH1 serves as an N6-mA demethylase of unpairing DNA. Cell Res. 2020, 30(3): 197-210.
[31] Tian LF, et al. Structural basis of nucleic acid recognition and 6mA demethylation by human ALKBH1. Cell Res. 2020, 30(3): 272-275.
[32] Alexandrov LB, et al. The repertoire of mutational signatures in human cancer. Nature. 2020, 578(7793): 94-101.
[33] Consortium ITP-CAoWG. Pan-cancer analysis of whole genomes. Nature. 2020, 578(7793): 82-93.
[34] Gerstung M, et al. The evolutionary history of 2,658 cancers. Nature. 2020, 578(7793): 122-128.
[35] Group PTC, et al. Genomic basis for RNA alterations in cancer. Nature. 2020, 578(7793): 129-136.
[36] Li Y, et al. Patterns of somatic structural variation in human cancer genomes. Nature. 2020, 578(7793): 112-121.
[37] Rheinbay ., et al. Analyses of non-coding somatic drivers in 2,658 cancer whole genomes. Nature.2020, 578(7793): 102-111.
[38] Cancer Genome Atlas Research Network, Analysis Working Group: Asan University, BC Cancer Agency, Brigham and Women’s Hospital, Broad Institute, Brown University, et al. Integrated genomic characterization of oesophageal carcinoma. Nature. 2017, 541(7636): 169-175.
[39] An JY, et al. Gastroesophageal reflux GWAS identifies risk loci that also associate with subsequent severe esophageal diseases. Nature Communications. 2019, 10(1):4219.
[40] Lu Y, et al. Large-scale genome-wide association study of east asians identifies loci associated with risk for colorectal cancer. Gastroenterology. 2019, 156(5): 1455-1466.
[41] Huyghe JR, et al. Discovery of common and rare genetic risk variants for colorectal cancer. Nature Genetics. 2019, 51(1): 76-87.
[42] Gail MH, et al. Projecting individualized probabilities of developing breast cancer for white females who are being examined annually. J Natl Cancer Inst. 1989, 81(24): 1879-1886.
[43] Banegas MP, et al. Projecting Individualized Absolute Invasive Breast Cancer Risk in US Hispanic Women. J Natl Cancer Inst. 2016, 109(2): djw215.
[44] Matsuno RK, et al. Projecting individualized absolute invasive breast cancer risk in Asian and Pacific Islander American women. J Natl Cancer Inst. 2011, 103(12): 951-961.
[45] Gail MH, et al. Projecting individualized absolute invasive breast cancer risk in African American women. J Natl Cancer Inst. 2007, 99(23): 1782-1792.
[46] Kapoor PM, et al. Combined associations of a polygenic risk score and classical risk factors with breast cancer risk. J Natl Cancer Inst. 2020, djaa056. doi: 10.1093/jnci/djaa056.
[47] Wacholder S, et al. Performance of common genetic variants in breast-cancer risk models. N Engl J Med, 2010, 362(11): 986-993.
[48] Mavaddat N, et al. Polygenic Risk Scores for Prediction of Breast Cancer and Breast Cancer Subtypes. Am J Hum Genet. 2019, 104(1): 21-34.
[49] Long HZ, et al. H2A.Z facilitates licensing and activation of early replication origins. Nature. 2020 Jan;577(7791):576-581.
[50] Lu XP, et al. GLP-catalyzed H4K16me1 promotes 53BP1 recruitment to permit DNA damage repair and cell survival. Nucleic Acids Res. 2019, 47(21): 10977-10993.
[51] Tang M, et al. SIRT7-mediated ATM deacetylation is essential for its deactivation and DNA damage repair. Sci Adv. 2019, 5(3): eaav1118.
[52] Huang HL, et al. Histone H3 trimethylation at lysine 36 guides m6A RNA modification co-transcriptionally. Nature. 2019, 567(7748): 414-419.
[53] Xue H, et al. Structural basis of nucleosome recognition and modification by MLL methyltransferases. Nature. 2019, 573(7774): 445-449.
[54] Ma ZP, et al. PTC-bearing mRNA elicits a genetic compensation response via Upf3a and COMPASS components. Nature. 2019 Apr;568(7751):259-263.
[55] Xue JH, et al. A vitamin-C-derived DNA modification catalysed by an algal TET homologue. Nature. 2019, 569: 581-585.
[56] Li PY, et al. DNA hydroxymethylation increases the susceptibility of reactivation of methylated P16 alleles in cancer cells. Epigenetics. 2020, 15(6-7): 618-631.
[57] Jiang Y, et al. Proteomics identifies new therapeutic targets of early-stage hepatocellular carcinoma. Nature. 2019, 567(7747): 257-261.
[58] Shi Y, et al. Targeting LIF-mediated paracrine interaction for pancreatic cancer therapy and monitoring. Nature. 2019, 569(7754): 131-135.
[59] Liu X, et al. Genome-wide analysis identifies NR4A1 as a key mediator of T cell dysfunction. Nature. 2019, 567(7749): 525-529.
[60] Gao Q, et al. Integrated Proteogenomic Characterization of HBV-Related Hepatocellular Carcinoma. Cell. 2019, 179(2): 561-577 e22.
[61] Jiang YZ, et al. Genomic and Transcriptomic Landscape of Triple-Negative Breast Cancers: Subtypes and Treatment Strategies. Cancer Cell. 2019, 35(3): 428-440 e5.
[62] Cui Y, et al. Whole-genome sequencing of 508 patients identifies key molecular features associated with poor prognosis in esophageal squamous cell carcinoma. Cell Res. 2020, doi: 10.1038/s41422-020-0333-6
[63] Dai JC, et al. Identification of risk loci and a polygenic risk score for lung cancer: a large-scale prospective cohort study in Chinese populations. Lancet Respiratory Medicine. 2019, 7(10): 881-891.
[64] Chang J, et al. Exome-wide analyses identify low-frequency variant in CYP26B1 and additional coding variants associated with esophageal squamous cell carcinoma. Nature Genetics. 2018, 50(3): 338-343.
[65] Tian J, et al. Genetic polymorphisms and gastric cancer risk: a comprehensive review synopsis from meta-analysis and genome-wide association studies. Cancer Biology and Medicine. 2019, 16(2): 361-389.
[66] Yu F, et al. Multi-marker analysis of genomic annotation on gastric cancer GWAS data from Chinese populations. Gastric Cancer. 2019, 22(1): 60-68.
[67] 黄育北, 等. 全基因组关联研究在乳腺癌筛查中的应用价值初探. 中华流行病学杂志, 2019, 40(6): 713-718.
[68] Xu M, et al. Genome sequencing analysis identifies Epstein-Barr virus subtypes associated with high risk of nasopharyngeal carcinoma. Nature Genetics. 2019, 51(7): 1131-1136.
[69] Lin GW, et al. International NKTCL Working Group. Genetic risk of extranodal natural killer T-cell lymphoma: a genome-wide association study in multiple populations. Lancet Oncology. 2020, 21(2): 306-316.
[70] He Z, et al. Efficacy of endoscopic screening for esophageal cancer in China (ESECC): design and preliminary results of a population-based randomised controlled trial. Gut. 2019, 68(2): 198-206.
[71] Liu M, et al. A Model To Identify Individuals at High Risk for Esophageal Squamous Cell Carcinoma and Precancerous Lesions in Regions of High Prevalence in China. Clin Gastroenterol Hepatol. 2017, 15(10): 1538-1546.
[72] Liu, M., et al., Absence of Iodine Staining Associates With Progression of Esophageal Lesions in a Prospective Endoscopic Surveillance Study in China. Clin Gastroenterol Hepatol. 2020, 18(7): 1626-1635.
[73] Liu M, et al. Size of Lugol-unstained lesions as a predictor for risk of progression in premalignant lesions of the esophagus. Gastrointest Endosc. 2020, doi: 10.1016/j.gie.2020.09.020
[74] Liu Z, et al. A clinical model predicting the risk of esophageal high-grade lesions in opportunistic screening: a multicenter real-world study in China. Gastrointest Endosc. 2020, 91(6): 1253-1260.