微信号:8149027
不接反杀,想去别人群里开挂,开不了不用加。
复制微信号
为了评估在蝙蝠和啮齿动物中以及属于不同BAT家族的物种中检测到的冠状病毒的频率,我们使用了Zover6的数据(最后一次进入,2023年1月25日),考虑到仅考虑元基因组学研究(补充表1)。我们策划了Zover中使用的BAT分类分类,以匹配https://batnames.org/中所述的分类分类。例如,现在被认为是河马家族的一部分的物种被分配给鼻酚科家族的前类别。同样,代表一个单独的蝙蝠家族的一家小翅目家族被归为Vespertilionidae。然后,我们构建了应急表,并应用了两尾Fisher的精确测试,以评估在蝙蝠与啮齿动物中检测到的冠状病毒的统计显着差异,属于rhinolophidae fros the其他任何蝙蝠的蝙蝠,以及属于Hipposideridae家族的蝙蝠与其他任何其他Bats的蝙蝠。摘要统计数据和Fisher的精确测试是在R统计数据中进行的(v.4.1.1)61。
对于十种序列的蝙蝠物种中的八个,我们使用了来自安大略省皇家博物馆哺乳动物收集的组织样品,这些组织自1992年至2007年之间被冻结了(补充表2),强调了冷冻收集对生物多样性基因组学的重要性62。The eight species are Aselliscus stoliczkanus (from Shuipu Village in China), Doryrhina cyclops (Parc National de TaÏ, Côte d’Ivoire), Hipposideros larvatus (Shuipu Village, China), Rhinolophus affinis (Shiwandashan National Reserve, China), Rhinolophus perniger lanosus (Shuipu Village, China), RhinolophusYonghoiseni(马来西亚Endau Rompin国家公园),Rhinolophus Trifoliatus(马来西亚Endau Rompin国家公园)和Megaderma Spasma(Cat Tien National Park,Viet Nam)(补充表2)。其余两个物种的样品是鼻虫(Rhinobophomapoma)(以色列北部)和MOPS Condyrurus(Bregbo,Côted'Ivoire),是从实地考察中获取的。收集并在-80°C下储存直至进一步加工后,将样品在液氮中闪烁。
每个物种收集和加工组织样本的伦理陈述遵循以下许可所需的程序:
从循环学(零件号NB-900-701-01,零件号NB-900-701-01,协议版本纳米生物界大型DNA试剂盒v.1.0 11/19)中,用纳米宾组织的大DNA试剂盒分离了来自各种组织的Ultralong和长基因组DNA(补充表2)。简而言之,将25-40毫克的肝脏,脾或心脏组织切成清洁和冷表面的小切片。使用其最大设置将组织与Tissueruptor II设备(Qiagen)匀浆。完整的组织裂解后,去除剩余的细胞碎屑,并在异丙醇存在的情况下,基因组DNA(GDNA)注入循环纳米蛋白盘。从洗脱缓冲液中,从纳米蛋白磁盘洗脱了高分子量(HMW)GDNA。使用Pippin脉冲装置(Sage Science)通过脉冲场凝胶电泳(Sage Science)确定HMW GDNA的完整性。大多数GDNA的长度在10至500千射线酶(Kb)之间。所有超龙和长GDNA的移液步骤均使用宽孔移液尖端完成。补充图22显示了鼻瘤的HMW GDNA提取的示例凝胶图像。
根据Pacific Biosciences的建议,根据有关使用Smrtbell Express Express模板准备KIT 2.0(PN 101-853-100,V.03,v.03)准备Hifi Smrtbell图书馆的指南,准备长时间的插入文库。Rhinolophus Perniger Lanosus,Rhinolophus Yonghoiseni,Rhinolophus trifoliatus和Rhinobopoma microphyllum。简而言之,使用Megaruptor设备(Diagonode)将HMW GDNA剪切到20-kb片段,并将10μg剪切的GDNA用于库制备。根据制造商的说明,使用Bluepippin设备的Smrtbell库对9-13 kb的片段进行了大小选择。大小选择的文库在续集II测序套件2.0上在续集II上使用续集II测序套件2.0在续集II上运行30小时。调用了循环共识序列,使用默认的SMRTLINK工具。对于每种物种,产生了总共65 GB至92 GB的HIFI读数,代表27倍至42倍的有效基因组覆盖率。
由于25岁的Megaderma Spasma进行的太平洋生物科学测序,尽管DNA质量良好,但产生了很少的产量,因此我们为该物种使用了牛津纳米孔技术。按照制造商的说明制备了两个牛津纳米技术连接测序库(文章编号SQK-LSK110,协议版本GDE_9108_V110_REVH_10NOV20202020)。输入GDNA是未切除的或剪切的GDNA(50 kb)的,使用Diaganode Megaruptor设备,如Pacific Biosciences HIFI测序所述。修复了剪切和未切除的GDNA后,将牛津纳米孔技术测序适配器与GDNA片段结扎在一起,并将所得的库富含大于3 kb的片段。两个文库使用R9.4.1流动单元将两个库加载在Promethion设备上,生成173 GB的读数,代表81倍有效的基因组覆盖范围(12,173,706总读数,173,867,637,637,954 bp总产率,总产率,14,282 BP平均读取长度为14,552 bp Med eard Gruend Gund Gument Guent Gument Read Gument和22,685 bp n55 bp n55 bp。
使用Arima-HIC(材料编号A510008)和HIC+试剂盒(材料编号A410110)和遵循动物组织用户指南(Arima-HIC Kit,文档A160132 V.01和Arima-HIC 2.0套件,文档编号A160162 V.00)。简而言之,将约50 mg的闪光粉状组织交联。分别由限制性酶鸡尾酒消化了交联的GDNA,分别由两个和四个限制酶组成。填充5'-Orthangs并用生物素标记。在空间近端消化的DNA末端被绑扎。富含结扎的生物素片段并用于Illumina库制备,该片段遵循了Arima用户指南,使用KAPA Hyper Prep Kit(Arima文档编号A160139 V.00)进行了图书馆准备。条形码的HIC库是在具有300个周期的NovaseQ6000的S4流动池上运行的。补充表2显示了物种的概述,以及应用于每个物种的HIC协议。
为了在Megaderma Spasma Contig组装中脚手架和校正基本误差,我们在基因组试剂盒协议v.2(文档CG00043,Rev。B,10×基因组学)之后,生成了与10×基因组铬基因组应用的链接的Illumina读取。简而言之,使用铬设备将1 ng的长或巨型大小的gDNA分隔在100万凝胶珠乳液中。使用包含特定16 bp 10×条形码和Illumina R1序列的引物,在等温孵化的这些单个凝胶珠乳液中放大了单个GDNA分子。破坏乳液后,纯化,放大的条形码片段纯化,富集并用于光明测序库制备,如协议中所述。在具有300个周期的NovaseQ6000的S4流动池上,将汇总的Illumina库被测序在40倍基因组覆盖范围内测序。
Pacific Biosciences CCS(HIFI)读取是从subread.bam文件中生成的,使用Pacific Biosciences Pipeline v.4.2.0(https://github.com/pacificbiosciences/ccs)的CCS命令。对于六种(Aselliscus stoliczkanus,Hipposideros larvatus,Rhinolophus affinis,R。PernigerLanosus,R。Yonghoiseni和R. trifoliatus),我们使用Hifiasm v.0.13(参考63)创建了重叠群,并使用参数-l0创建。主组件是通过使用p_ctg.fa输出文件上的purge_dups v.1.2.3(参考文献64)创建的。通过将来自P_CTG重叠群的单倍型式输出与HIFIASER创建的A_CTG.FASTA组合来创建替代组件。然后,我们在此组合的替代组装上运行purge_dups,为每个物种创建最终的替代组件。
对于鼻虫,我们使用HIFIASM V.0.15.5-R352与清除参数L2组装了重叠群。对于MOPS Condyrurus,我们使用了Hifiasm v.0.15.4-R432。对于两个组件,我们都使用Purge-Dups v.1.2.3创建了主要和Alt子重叠群,如上所述。
对于Doryrhina独眼巨人,Hifiasm创建了大量的错误组件,从不同的染色体加入区域,无法通过手动进行合理的校正。因此,我们运行Hicanu v.2.1(参考文献65)来创建初始重叠群。因为这导致了一个基因组的预期大小的两倍,所以我们使用基于13×:8、1、1、20、2、60的单倍体覆盖范围的定制截止范围在重叠群组件上运行了purge_dups。65。从吹扫_DUPS清除的输出作为主要重叠群组件,而单倍型 - 羽状输出作为替代组件。
对于Megaderma Spasma,我们在-Nanopore模式下运行CANU v.2.2,并使用上述净化-DUP创建了主要的重叠群集。我们在库中使用了库PAG52988和PAG53246的BaseCaller Guppy v.5.0.12,以及库PAH65658的Guppy v.5.0.13,均处于高准确模式。
我们首先使用牛津纳米孔技术创建的重叠群使用10×基因组学数据读取。为此,我们使用longranger v.2.2.2绘制了10×基因组学读取的读取,并使用accaff10×v.4.2和break10×v.3.1进行了脚手架。接下来,我们使用bionano光学图在10×脚手架后进一步脚手架。我们创建了一个从头组装的光学图,然后使用Bionano Hybrid脚手架使用Bionano Solve v.1.6.1中的工具创建了支架。如下所述,将所得组件进一步用HIC数据脚打。
为了将脚手架重叠群成为染色体水平的支架,我们首先使用BWA-MEM V.0.7.17.17-R1188(参考文献66)(参考文献66)将Arima V2 HIC数据映射到基因组组件上,并根据绘制质量和适当的对准的读取Arima映射的启动,并根据Arima映射的启动进行过滤。(https://github.com/vgp/vgp-assembly/blob/master/pipeline/salsa/arima_mapping_pipeline.sh)。然后,我们使用salsa2 v.2.2(参考文献67)进行参数:-m是-p yes。
为了加入Salsa2错过的重叠群,打破了伪造的连接,我们手动策划了脚手架。在少数情况下,HIFIASM在一个重叠群中的两个不同染色体之间创建了错误的连接。为了打破这些重叠群,我们将CCS数据映射到了重叠群,并在这些虚假连接中发现了基因组的区域。然后,我们确定了低覆盖范围(低于5,通常为1或2个读数)或高度重复的区域,在该区域中,来自不同染色体的重叠群的重复尖端错误地连接在一起。在这些情况下,这些模棱两可的区域被从基因组中去除,重叠群的单独区域被救出。
为了抛光最终基于HIFI的基因组并消除其余的基本错误,我们使用了CCS读取。To perform a polishing round, we mapped all CCS reads to the scaffolded, gap-closed assemblies using pbmm2 (https://github.com/PacificBiosciences/pbmm2) with arguments: --preset CCS -N 1 and called variants using DeepVariant (https://github.com/google/deepvariant/).然后,我们过滤了具有基因型1/1和通过滤波器值的站点,这意味着所有或几乎所有读取都支持该位置的替代序列,并通过了DeepVariant的内部过滤器。通过这种方法,我们没有抛光基因组的任何杂合或多态性区域,而只有那些不正确且不受任何CC读取的杂合区域。然后,我们使用BCFTools共识v.1.12(参考文献68)纠正基本误差。
对于Megaderma Spasma,我们首先使用Longranger v.2.2.2绘制了将10倍基因组链接到组装的读取。然后,我们使用DeepVariant v.1.2.0调用变体,使用Merfin V.1.1开发R197(参考文献69)过滤了VCF文件,并使用BCFTools共识v.1.12确定了共识。我们进行了两轮抛光。
我们使用Merqury v.1.3(参考文献70)来估计QV值。对于基于牛津纳米孔技术读取的Megaderma Spasma,我们使用了10倍基因组学Illumina链接读数。对于其他九个基于HIFI的组件,我们使用了HIFI读取。对于基于HIFI的组件,基本精度值比以前的Pacific Biosciences CLR或基于纳米孔的组件高两个数量级15,16,尽管我们注意到这些值是一个上限,因为用于组装的读数用于估算QV,而不是独立的Illumina读取数据集。因此,在HIFI读取中,组件中的剩余错误也可能存在,这些错误已知在均聚物和其他简单重复区域中存在问题63,65。
我们使用了两个指标。首先,我们使用BUSCO v.5.1.1(基准为通用的单拷贝直系同源物; ODB10数据集)与参数: - 模式“基因组”来比较不同组件跨不同组件的完全检测到的近宇宙保守的哺乳动物基因的百分比71。其次,为了进一步评估组装完整性和基础准确性,我们使用了TOGA 1.0提供的替代基准指标。因此,我们考虑了一组18,430个基因,这些基因可能存在于胎盘哺乳动物祖先中,该基因被定义为人类基因,这些基因在至少一个awrothotherian和至少一个Xenarthran Genome21中具有完整的阅读框架。对于每个组件,我们确定有多少祖先基因具有以下:完整的阅读框架(Toga分类完整,指出中间的80%的编码序列存在,并且缺乏基因灭活突变);灭活突变(Toga分类损失和不确定的损失);或由于组装间隙或碎片化而缺少序列(Toga分类部分完整且缺失)。
To annotate transposable elements (TEs) in the newly sequenced bats, we first generated a de novo repeat library for each genome assembly using a novel pipeline consisting of RepeatModeler, RepeatClassifier, custom scripts (https://github.com/davidaray/bioinfo_tools/blob/master/extract_align.py, RepeatAfterMe (RAM)(https://zenodo.org/record/7076442)和参考文献中包含的TE-AID软件包。
简而言之,每个组件都经过初始重复模块分析。由于重复模型通常会产生不完整的推定共识序列,因此每个推定的共识均使用RAM进行扩展。然后,使用自定义bash脚本(tecurate.sh)策划了这些扩展共识序列,该序列将每个序列分类为四个类别之一(线,LTR,DNA或未识别)之一,这是RepotClassifier,这是RepotModeler软件包的一部分。然后,tecurate.sh将使用TE-AID软件包生成基因组覆盖图,自我调整点,结构和ORF图以及副本编号估计。
对于明确归类为行,LTR或DNA的任何元素,重复classifier提供的身份都用于生成一个唯一的标识符,该标识符包括原始物种,重复模型ID和TE类/家庭信息。例如,在Doryrhina独眼巨人中发现了HCYC.1.18-#线/L1。它的retotModeler ID是RND-1_FAMILY-18(1.18),RepotClassifer将其识别为LINE1元素。如参考文献,手工进一步处理LTR元素,将其细分为LTR和内部细分。73。丢弃了少于十个全长副本的共识序列。
通过Eye检查了未识别组中元素的TE-AID图,以确定可能使用结构标志的群体成员资格,例如末端倒置重复序列(TIR),长时间重复序列(LTR)和序列特征(例如重复的尾巴,Helitron特异性的CTAG基序,Sine A-B Boxes)。使用这些特征,推定的共识序列被归类为线,LTR,DNA,SINE,RC(滚动圆),或者当没有明确的标志是可识别的,未知的时。
After all the putative TE consensus sequences were classified and named, all consensus sequences were collapsed with previously known mammalian TEs per a variation of the 80–80–80 rule using USEARCH74 with parameters -id 0.80 -minsl 0.95 -maxsl 1.05 -maxaccepts 32 -maxrejects 128 -userfields query+target+id+ql+tl and comparison to the参考文献的哺乳动物图书馆。75。所有新颖的TE共识序列已提交给DFAM TE数据库76。由此产生的哺乳动物TE库用于用ReponMasker掩盖所有组件。处理输出以使用RM2Bed.py消除重叠的命中,这是ReponMasker安装程序包的一部分,以生成床文件以进行下游分析。
新测序蝙蝠中microRNA(miRNA)基因的注释以与参考文献相似的方式进行。15。简而言之,在miRNA预测之前,将每个BAT基因组中的重复和低复合区域用DFAM数据库掩盖(v.3.5; https://wwwwwwwwwww..dfam.org/releases/dfam_3.5/),使用repotmasker(v.4.0.6; httpp:httpp:http:http:http:http:http:/对于每个掩盖的基因组,使用RFAM数据库(V.14)77和地狱(V.1.1.2)78预测保守的miRNA基因。地狱不仅使用序列相似性,而且使用miRNA二级结构进行同源性搜索。我们用多个副本手动检查了“虚假的miRNA”,并根据我们用rnafold预测的二级结构(v.2.4.18)79确定了这些副本的真实性。
为了使新测序的基因组对齐,我们使用RepotModeler(http://www.repeatmasker.org/,parameter -encine ncbi)为每个基因组组装生成了一个从头重复库。然后,将所得库使用RepotMasker v.4.0.9(参数: - engine crossMatch -S)软遮盖基因组。
为了推断系统基因组和选择筛选的直系同源基因,我们将人类HG38组件用作参考物种,并与蝙蝠和其他哺乳动物作为查询物种产生成对的基因组对齐。为此,我们使用了Lastz 1.04.15(参考文献80)来获得局部比对。我们使用了lastz参数(k = 2,400,l = 3,000,y = 9,400,h = 2,000和lastz默认评分矩阵),它们对胎盘哺乳动物之间的直系同源外显子具有足够高的敏感性。使用AXTCHAIN 1.0(参考文献82)链接局部比对,默认参数除lineargap =松散。我们使用repotfiller 1.0(参考文献83)(使用默认参数)将错过的重复重叠的本地比对添加到对齐链和链式链接1.0(参考文献84)(使用默认参数(使用MinBrokenchainsCore = 75,000和-popairs)以外的默认参数)来提高对准特定性。
为了推断系统基因组,选择和基因 - 损失分析的直系同源物,我们使用了toga 1.0(参考文献21)(https://github.com/hillerlab/toga,提交V.C4BCE48)。简而言之,Toga使用参考物种(人类HG38组装)和查询物种(其他哺乳动物)之间的成对基因组比对链来推断和注释直系同源基因,并将其分类为完整或丢失。Toga实现了一种新型的范式来推断很大程度上依赖内含子和基因间比对的直系同源基因基因座,并使用机器学习将直系同源与寄生虫或加工的假基因基因座分开。我们使用人类Gencode V38(Ensembl 104)注释作为TOGA的输入,提供了39,664个编码基因的转录本。
我们在toga注释上与BUSCO进行了参数: - 模式为“蛋白质”,以比较完全检测到的几乎普遍保守的哺乳动物基因的百分比。请注意,将BUSCO应用于TOGA产生的基因注释(注释蛋白)会导致检测许多重复的基因,因为全面的注释经常包括一个以上的转录本(剪接变体)每个基因。因为这不是一个问题,而是一个全面的成绩单注释,所以我们仅报告了补充表3和5中TOGA注释中完全检测到的BUSCO基因的数量。
对于系统基因组和全基因组选择筛选,我们使用了由TOGA分类为完整的直系同源物。Toga意识到外显子级别的矫正,允许实现逐个外观的对准,以生成一组全面的多个密码子对齐。对于每个人类基因,我们仅考虑最长的同工型。我们仅包括1:1的直系同源物和排除物种,这些物种没有推断出任何或多个共同媒介。带有框架插入或删除和过早停止密码子的密码子用“ nnn”掩盖,以维护阅读框架。对于每个基因,使用MACSE v.2(参考文献85)对齐每个直系外显子,并且所有外显子与由内含子分裂的密码子一起被串联为多型二氧化碳对齐。使用默认成本值使用HMMCleaner v.0.180750(参考文献86)清洁密码子对齐,以识别较差的序列段并有选择地将其删除。从19,288个基因的多个密码子比对中,我们使用了17,130(约88%),其中包括115个哺乳动物中至少60%的系统发育推断和选择筛选。
为了将新测序的基因组放入蝙蝠的系统发育中,我们使用全基因密码子比对重建系统发育关系,考虑到总计50个蝙蝠物种(补充表3)和16,860个基因。我们还使用17,130个基因推断了所有115个哺乳动物的系统发育树,并将其用作我们选择屏幕和回归分析的输入(下)。
为了估算物种树,我们遵循了Astral v.5.5.9(参考文献87,88)的基于合并的方法,也遵循了iqtree v.2.1.3(参考文献89)中实施的串联方法。对于星体分析,在RAXML v.8.1.16(参考文献90)中估算了输入树。使用三个独立的重复分析每个基因,即GTR+伽马模型和快速爬升算法。基因树被用作带有默认参数的星体中的输入,并使用100个bootstrap重复来计算节点支持。使用Booster v.1(参考文献91)中实现的转移引导预期估算分支支持值。对于IQTREE分析,将基因比对被串联为超元素,并使用使用Modelfinder(如Iqtree实现)确定每个基因的最佳序列演化模型分区。使用IQTREE推断出最大样本树,并使用1,000个bootstrap伪复制物计算出淋巴结支持。
为了估算时间校准的树木,我们使用了在Treepl93,94和17个化石校准点中实施的惩罚可能性方法95,96。首先,进行一项分析以确定Treepl的最佳优化参数,然后使用优化值进行第二个分析。化石校准95用于限制相关节点处的最大差异时间(补充表4)。可以在http://genome.senckenberg.de/download/bat1kimmune/上获得蝙蝠和哺乳动物的时间校准的系统发育。
为了获得我们选择筛选的哺乳动物的广泛基因组表示,我们包括了95个其他哺乳动物和十个BAT基因组,代表主要的哺乳动物组和BAT家族(补充表5)。我们仅选择了至少16,000个祖先胎盘哺乳动物基因具有完整阅读框的组件,如toga所确定(如下所述)(补充图7)。对于Chiroptera,我们包括了10个新的和10个先前出版的BAT组件;这20个蝙蝠中有18个是从长期读取15,16,97中组装的,其余两个基因组由Illumina短阅读数据98,99组装(补充表3)。对于五个哺乳动物的命令(灵长类动物,Rodentia,Artiodactyla,Carnivora和Chiroptera),我们选择了20种。其他哺乳动物的订单由较少的物种代表,因为符合我们的选择标准的测序基因组较少。补充表5中提供了所有115个组件的详细信息和来源。
为了识别阳性选择下的基因,我们使用了Absrel23,这是Hyphy v.2.5.8(参考文献100)中实施的一种自适应分支部位随机效应的可能性方法,它使用非同义词与同义替代速率的比率(DN/DS Metric)使用自然选择的强度。DN/DS的值解释为经验净化选择的站点(DN/DS< 1), evolve neutrally (dN/dS ≈ 1) or experience positive diversifying selection (dN/dS >1)。对于每个系统发育分支,ABSREL测试是否通过确定更复杂的模型是否允许允许密码子的更复杂模型以DN/DS> 1> 1最适合数据而发展。该方法使用Akaike信息标准来评估拟合的好处,同时惩罚增加模型复杂性(参数数)。我们在探索模式下进行了ABSREL,以测试系统发育树中的所有分支和节点,用于115个哺乳动物。对于每个基因,使用Benjamini – Hochberg程序对所有测试分支进行了多次测试校正。总共筛选了17,130个基因以使用我们的星体拓扑作为输入进行选择。眼睛检查了感兴趣基因的比对(补充图14),以排除因未对准而导致的虚假信号。
为了测试在选择下的基因的富集结果(请参见下文)代表哺乳动物秩序或由单个物种驱动,我们进行了亚采样分析。我们使用17,130个基因的相同数据集进行了四个选择筛选,但仅随机选择10种,用20种(Chiroptera,Carnivora,Artiodactyla,Rodentia和Primates)进行了5种哺乳动物订单。未对基因组少于20个基因组的订单进行次采样,因此每个次采样数据集都包括115-50 = 65种。子样本1-3个随机去除的物种,而子样本4包括五个20个物种订单中的10种物种,这些物种被排除在子样本1中。对于每个子采样集,为完整的数据集生成并清洁了密码子的比对,并筛选了相同的输入转录本以进行选择。
为了探索在不同哺乳动物订单中选择的基因是否在特定官能团中富含,我们使用Gprofiler101,102中实施的基因 - 富集分析,使用为背景,所有在Ensembl v.106中报道了人类报道的基因,该基因于1066年5月18日,DATABASE,DATABASE,于1853年5月18日_ 2022,e106_eg53,E106_eg533。As databases, we used Gene Ontology (http://geneontology.org/) and pathways from KEGG (https://www.genome.jp/kegg/), Reactome (https://reactome.org/) and WikiPathways (https://www.wikipathways.org/index.php/WikiPathways);miRNA靶标(http://mirtarbase.mbc.nctu.edu.tw/)和来自TransFac(http://genexplain.com/transfac/)的监管基序匹配。人类蛋白质图集的组织特异性(https://www.proteinatlas.org/);来自Corum的蛋白质复合物(http://mips.helmholtz-muenchen.de/corum/);和人类表型本体论(https://hpo.jax.org/app/)的人类疾病表型。
预计将更多的物种包含在哺乳动物的秩序中,至少其中一个分支中的基因越多地被选择。因此,我们将比较重点放在完全由20个物种代表的5个顺序上。由于p值在其他因素中取决于样本量和差异的幅度,因此p值的差异可能是由于一组的样本量较大(此处,在这里,每个顺序的选定基因数),尽管差异的幅度相同或较低。Gprofiler计算精度值,定义为带有特定项注释的选定基因的比例,该术语在补充表7中列出了所有富集项。对于主要文本中讨论的所有GO术语,它具有最强的蝙蝠富集,我们证实,在五个20种哺乳动物命令中,P值是最低的,并且所选基因的GO术语比例是Chiroptera的最高值。例如,免疫系统过程(GO:0002376)具有最低的校正后P值(蝙蝠为2.02×10-16,其次是6.75×10-11),也是该术语注释的选定基因的最高比例(蝙蝠为0.184,对于啮齿动物的0.17)。
我们测试了分支长度与选择下的基因数之间是否存在显着相关性(请注意,在树上每个分支上,Absrel分支位点模型测试呈阳性选择)。对于分支长度,我们使用了三个独立的估计:首先是使用Treepl94和化石校准推断出的时间校准的系统发育,数百万年(补充表4);其次,使用ThyloFit103从4D位点估计的每个中性位点的取代数量;第三,使用IQTREE89根据编码区域估算的每个站点的替换数量。正常概率图表示重型尾巴(非正常),这可能归因于分支长度分布的不等误差差异。然后,我们探讨了是否可以应用诸如Box -cox近似等补救测量值以找到适当的功率转换。在所有情况下,当λ≈0.05(λ是转换参数,范围从-5到5)时,似然函数均达到其最大值;因此,我们应用了平方根变换。我们拟合了带有和没有转换的线性模型,并使用Akaike的信息标准(AIC)选择了最适合拟合的模型(s)给定模型复杂性104的数据。AIC可以解释为缺乏模型拟合的量度,为了更好地解释这些相对值,Akaike权重(WAIC)用于比较模型。这些权重类似于模型概率,因为给定的一组模型中所有WAIC值的总和等于1。具有根据编码区域估算的每个站点的平方根的模型最适合数据,WIIC = 0.7025(补充表9)(补充表9),并支持与选定基因的数量显着相关(R2 = 0.4917,F-Statististical = 220。< 2.2 × 10−16). A significant correlation between branch length and the number of selected genes was also found for time and number of substitutions per neutral site (Extended Data Fig. 3). Using the best-fit model, we then considered specific immune gene sets and coloured the branches in the phylogenetic reconstruction by the observed number of selected genes minus the expected number based on the model.
To further test whether the number of immune genes under selection is higher in bats than in other mammals, we introduced a categorical taxonomy variable (bats and non-bats). First, we analysed the relationship between the number of immune genes under selection and branch lengths without accounting for different taxonomic groups, corresponding to one intercept and one slope. Second, we included the taxonomic group (bats or non-bats) as an independent correlate corresponding to different intercepts. Third, taxonomic group was included as a correlate, but interacting with the continuous branch-length variable, resulting in two models with two slopes for bats and non-bats, one with one intercept and another with two intercepts. This series was repeated with different branch-length estimates as a covariate. Based on previous analyses, branch-length variables were square-root transformed, with an untransformed analysis included for comparison. Finally, we compared the fit of a simpler frequency distribution than the negative binomial. A Bayesian approach was adopted to run these models, as a flexible way to both fit the model series and generate fit comparison statistics. A negative binomial frequency distribution was used to model the number of immune genes under selection, such that:
where yi is the count of positively selected genes for branch i, λ is the rate or mean of the Poisson distribution, exp is the inverse logarithmic link function, and (1-pr)/pr defines a rate or shape parameter for the gamma distribution of a mixture of Poisson distributions, which relaxes the expectation of equality of mean and variance of the Poisson distribution. As a result, the negative binomial distribution is usually a better fit to biological data105. With a linear model applied to l:
where β0 represents the intercept, which is global for analyses with a single intercept or group-specific for testing bats versus non bats, β1 is the coefficient on branch length, and X represents branch length. Both coefficients are normally distributed. To implement Bayesian sampling for these analyses, we used brms106, a package that enables coding models in R for implementation in the stan statistical language107. For each model, we ran four separate Markov chain Monte Carlo chains using a Hamiltonian Monte Carlo approach. Compared with other Bayesian implementations, the Hamiltonian Monte Carlo approach saves time in sampling parameter spaces by generating efficient transitions spanning the posterior based on derivatives of the density function of the model. We estimated the R2 of all models using the procedure outlined in ref. 108. To compare model fits, we used WAIC (the widely applicable information criterion), which weighs log pointwise predictive density against the expected effective number of parameters as defined in ref. 109 and provides estimates of the standard error of the difference between the best fit and other models.
To test whether the Cys78 deletion in ISG15 of some bats affects the formation of stable ISG15 homodimers, we first used AlphaFold2 (ref. 110) through ColabFold v.1.3.0 (ref. 111) to infer the structure of the putative ISG15 homodimer of human, Rhinolophus sinicus, Rhinolophus affinis, Rhinolophus yonghoiseni and Doryrhina cyclops. Starting from each ISG15 sequence, ColabFold identified homologous sequences by running MMseqs2 (ref. 112) against the UniRef100 database113 and against a set of environmental sequences114. Structural template information was obtained from the PDB70 database115. Next, the AlphaFold-multimer-v2 model116 was used to infer five structural models of the dimer, with 12 rounds of recycling for model improvement. The resulting models were relaxed using the Amber force field117 and were ranked according to their predicted template modelling score, which we used to identify the best model.
To further investigate the stability of the dimers inferred with AlphaFold2 (Supplementary Fig. 16), we conducted three replicate molecular dynamics simulations for ISG15 of human, R. sinicus and D. cyclops using GROMACS v.2022.1 (refs. 118,119) and the CHARMM36-Jul2021 force field120. More precisely, we prepared each dimer by treating termini as ionized (NH3+ and COO−), assigning appropriate protonation states to amino acids (assuming pH = 7) as determined using PROPKA3 (refs. 121,122) and adding hydrogen atoms. Each dimer was subsequently placed in a periodic dodecahedral box, at a minimum distance of 2.5 nm from each box edge (Supplementary Fig. 17). The box was filled with TIP3P water molecules and with Na+ and Cl− ions as required to neutralize the system (referred to as low salt concentrations below). Following this, we performed energy minimization of the system, and examined the values of the potential energy and the maximum force to ensure that the system was sufficiently relaxed. Next, we applied position restraints on non-hydrogen protein atoms and equilibrated the system in two steps: first, under an NVT ensemble to stabilize the temperature (at 300 K); and second, under an NPT ensemble to stabilize the pressure (at 1 bar) and density of the system. For these, we used the velocity rescaling thermostat123 and the Parrinello–Rahman barostat124,125, set the integration time step to 2 fs and the duration of each equilibration step to 100 ps. As before, we manually examined the temperature, pressure and density to ensure that the system was successfully equilibrated (Supplementary Fig. 18). Finally, we removed the position restraints and conducted production simulations for 1 μs each, recording snapshots of the system every 100 ps. For each species, the three simulations ran for around 6 months on a compute node with 128 cores, summing to a total of about 550,000 CPU hours per species. To explore the effect of higher (physiological) salt concentrations, we conducted three more replicate molecular-dynamics simulations of the ISG15 dimer of Rhinolophus sinicus for 0.5 μs each using a physiological salt concentration (150 mM) (Extended Data Fig. 6).
To analyse the resulting molecular-dynamics trajectories, we combined the snapshots from the three replicate simulations per ISG15 dimer, removed water molecules and ions, and constructed a matrix of pairwise root mean square deviations using Carma v.2.01 (ref. 126). We then clustered the three (human and bats) root mean square deviation matrices according to the Partitioning Around Medoids algorithm127 implemented in the cluster R package v.2.1.3 (https://CRAN.R-project.org/package=cluster). This allowed us to identify representative conformations, separately for each dimer. In particular, we set the number of clusters to all possible values between 2 and 10, and selected the clustering with the highest mean silhouette score128. Finally, we extracted the protein snapshots corresponding to the medoid of each cluster and compared them with the initial protein model obtained from AlphaFold (Extended Data Fig. 6). We also produced videos of the simulations using PyMOL v.2.5.0 for all nine molecular-dynamics simulations (Supplementary Videos 1–9).
For the two bat ISG15s, we also used the gmx hbond program with the -contact parameter to examine the contacts among ISG15 monomers (within 5 Å) that were present at each simulation snapshot. This allowed us to investigate how the fraction of native contacts (contacts in the original AlphaFold models that are hence present at the beginning of the simulations) changed across simulation time (Supplementary Fig. 19). As well as native contacts, we also constructed a presence/absence matrix of all contacts between ISG15 monomers during the course of the simulations, which we analysed through PCA (Supplementary Fig. 19).
We used Alphafold2-Multimer in ColabFold111 and the recently identified crystal structure of SARS-CoV-2 PLpro in complex with human ISG15 (ref. 54) to model the complex of human, R. affinis, R. sinicus, R. yonghoiseni and R. trifoliatus ISG15 and PLpro (displayed as a monomer of each). The ISG15 chain of human from the crystal structure was replaced with full-length human ISG15 (including the remaining C-terminal residues after the cleavage site) then routinely swapped for each species of ISG15. The top model was chosen as previously and predicted template modelling displayed with scaling as per the predicted local distant difference test AlphaFold2 scale in ChimeraX. We used only the catalytic unit of the PLpro monomer (residues 819–2,763) that was previously shown to support independent modelling that reflected well the crystal structure. Supplementary Videos 10, 12, 14, 16 and 18 show the complete view of one molecule of PLpro (catalytic domain) with one molecule of ISG15. Supplementary Videos 11, 13, 15, 17 and 19 (human, R. affinis, R. yonghoiseni, R. sinicus and R. trifoliatus, respectively) represent zoomed views with a 360° rotational spin, highlighting the contact residues (green) calculated in ChimeraX (structure >PLPRO和ISG15之间的触点,VDW重叠,> -0.4,模型间触点)以及键(同源)氨基酸残基(黄色),被鉴定为人类ISG15和PLPRO之间晶体结构中的接触点。在扩展数据中显示了带有ISG15的C末端尾部催化位点的整个复合物和变焦区域的快照图11。
HUH7,HEK293,A549,VERO-76(CRL-1587,ATCC)和VERO-E6细胞在典型的DMEM(GIBCO)中生长,这些DMEM(GIBCO)补充了10%FBS(Excelbio)和1%PEN/Strep(Sigma)。重要的是,本研究中使用的HEK293细胞是用于高生产假病毒的HEK293亚克隆。与大多数HEK293细胞相比,这些亚克隆细胞表达了IFN/ISGS的基础机械,而Isgylation机械(E1/E2/E3连接酶)被上调,我们通过ISGYLATION及其机械的Western blots验证了这一点(扩展数据图10和补充图21)。RSKT.01细胞(Sinicus Rhinolophus)是来自Z. Shi的礼物,并在补充了10%FBS(生物工业)和1%Pen/Strep(Sigma)的DMEM(Gibco)中生长。对于HCOV实验,将ANPEP/CD13-FLAG构建体(SINO生物学)转染到HEK293细胞(PEI,polysciences)中,然后用湿霉素选择(混合池)2周,以产生稳定的细胞系,通过表面CD13置于表面CD13验证(Sino Biological,1:2,000允许延伸,未置换hrc)。对于SARS-COV2实验,A549-ACE2细胞(人肺腺癌衍生的细胞过表达人类血管紧张素转化酶2(ACE2))由COLPITTS Laboratory129提供,我们使用了克隆人群A549-ACE2 B9。将A549-ACE2细胞保存在HAM的F-12K(Kaighn)培养基中,该培养基补充了10%FBS,10μgml-1 blasticidin和1%PEN/链球菌。
用LIP2000(BioshARP),带有聚乙基亚胺(Polysciences)的HEK293细胞转染HuH7细胞,含LIPO6000的A549细胞和带有lipo8000(Beyotime)的VERO-E6细胞,每个细胞,每个细胞,每个细胞(Beyotime)(Beyotime),根据制造商的指示。所有细胞系均经过支原体测试,并且没有支原体污染。
使用第三代HIV-VSV.G慢病毒与PSPAX2(Addgene Plasmid 12260; http://n2t.net/addgene:12260; rrid:addgene_12260)在HEK293 Cell中的矢量系统。根据ISG15的TOGA注释(转录本ENST00000649529,与人类对齐的人类验证),合成了基因嵌段(北京TSingke Biotech或Genscript),并将其克隆到PLVX-IRES-MCHERRY载体中,以直接转换或Lentefterfirus或Lentivirus代码。在补充了1%NEAA(Phygene),丙酮酸钠(Thermo Scientific,Gibco)的低FBS DMEM中制备慢病毒上清液,并通过0.45 µm低结合PES PES PES PVDF滤镜(JET BioFil)过滤。用100 µL上清液(六孔板)在1%FBS中用4 µg ml-1聚甲烯(Biosharp)的1%细胞(六孔)的细胞(六孔板)进行慢病毒转导4-6小时;将培养基替换为10%血清,48-72小时后,将细胞分选用于麦克利荧光,并以稳定(混合)细胞系生长,以最大程度地减少克隆变异。A549和RSKT细胞包括一个“自旋感感应”步骤,用于在带有慢病毒的六孔板下在37°C下在100g处离心1小时。
将MYC标记的ISG15构建体合成如上所述,以确保抗体相容性(Sangon Biotech)(补充表27)。HEK293-ΔISG15 cells were co-transfected with 200 ng pCDNA3.1-NSP3C (PLpro), 200 ng pCDNA3.1-NSP3L and 300 ng ISG15 Myc-tagged constructs, then cells were induced with 1 µg ml−1 of poly-I:C 24 h after transfection, cell lysates were treated with DSP or BMH (see below) and collected 48 h转染后。与未标记的ISG15构建体相比,MYC构建体经过验证,其影响最小(图3D和补充图23)。分别用50 ng UBE1L(Addgene,12438)和UBE2L6(Addgene,98380)转染HEK293-ΔISG15细胞,转染后24小时收集细胞裂解物。
为了生成ISG15稳定的细胞系,通过使用MCHERRY-PORESITAIS细胞的BD膨胀系统对荧光激活的细胞分选(FACS)对MCHERRY-PRUMPENT SYSTEM通过MCHERRY-PROSISTEN进行了荧光激活的细胞分选(FACS)对慢病毒转导的HUH7,HEK293,A549,RSKT和VERO-E6细胞进行分选,并在各种培训中对AutofluoreSential Cellentive Perental Cellenty Complucation for Autofluoresents进行了归一化。通过GFP荧光强度直接测量VSV – GFP负载。For HCoV-229E, CD13 stable HEK293 cells were stained with 229E N protein (Sino biological, 1:2,000) and Ki67 (Beyotime, 1:500) for 30 min in FACS buffer containing 1× PBS (Gibco), 1% FBS and 1% Pen/Strep, after permeabilization with 0.05% TX-100 in TBS and blocking in 5% BSA inTBS-T。随后将细胞冲洗,用抗小鼠/兔CF-488/568/647二抗染色15分钟(Biotium,Biotium,稀释1:10,000),冲洗了3次,并在ACEA Novocyte流动系统上运行。
为了通过ATP的营业额来推断代谢活性,通过将10 µL CCK-8(Transgy Biotech)直接添加到DMEM中生长的细胞,1%FBS,PEN/StREP,然后孵育4 h,然后随着时间的时间在TECAN Spark Microplate中测量ABS 450 nm处,进行了测量,从而进行了可行性测定。减去背景并针对对照进行标准化。
为了检测蛋白质 - 蛋白质偶联(酰胺键的交联),使用了DI(N-核苷)3,3'-二二吡俄二酸酯(DSP)(Aladdin,Pubchem CID:93313)。为了检测二硫键 - 键连接的蛋白,1,6-双(MaleImido)己烷(BMH)(Aladdin,Pubchem CID:20992),一种同质功能(硫化物至硫化物)硫二烯酰基 - 羟基 - 羟基反应试剂。将DSP和BMH溶解在DMSO(高纯度,Sigma)中,并在最终浓度分别为0.2 mm和0.1 mm之前稀释在PBS中。转染后,将交联添加到细胞中,并在37°C下分别在37°C下孵育15分钟和25分钟。
在感染前或感染后48小时收集细胞上清液和细胞裂解物(HCOV-229E)或感染后24小时(H1N1 IAV和VSV – GFP)。将细胞在缓冲液1裂解缓冲液中裂解,并补充了磷酸酶抑制剂鸡尾酒(Phygene,PH0321)和蛋白酶抑制剂鸡尾酒(Phygene,PH0320)。将收集的细胞裂解物和细胞上清液与5×SDS -PAGE载荷缓冲液(Phygene,PH0333)混合,煮沸5分钟。所使用的蛋白梯为11–180 kDa结肠蛋白标记物(Solarbioc)或15-130 kDa两颜色的预售梯(Biomed 168)或10-250 kDa smartbuffers预先获得的梯子(N6619);在10%BIS-Tris凝胶和4–20%梯度凝胶(在Tris-mops中运行)之间观察到较小的尺寸差异。随后,通过10%SDS -PAGE凝胶分离细胞裂解物和上清液,转移到PVDF膜(Millipore,0.45μm)中,并用TBS中的5%脱脂牛奶阻塞。为了进行ISGYLATIOT检测,将蛋白质样品与4×Nupag LDS样品缓冲液(Invitrogen,np0007)混合,在运行缓冲液(Invitrogen,np0001)中,Nupage 4-12%BIS-Tris凝胶分开70 min,在120 v下,在120 v下,并转移了(Invitrogen,NP00000061),为90分钟,供90分钟。
使用以下抗体进行检测:兔抗MX1多克隆抗体(克隆N2C2,Genetex,GTX110256,稀释1:1,000);兔抗ISG15多克隆抗体(中区,Aviva Systems Biology,ARP59386_P050,稀释1:1,000);兔抗GAPDH单克隆抗体(克隆14C10,细胞信号,2118,稀释1:2,000);兔抗CD13多克隆抗体(Sino Biological,10051-T60,稀释1:2,000);Rabbit HCOV-229E Nucleocapsid多克隆抗体(Sino Biological,40640-T62,稀释1:2,000);小鼠抗MYC单克隆抗体(中清液中的100029-mm08,稀释1:2,000用于细胞裂解液,细胞上清液1:1,000);兔抗ube1l单克隆抗体(Huabio,HA721228,稀释:1:500);兔多克隆抗2L6抗体(Abclonal,A13670);兔多克隆抗HERC5抗体(Abclonal,A14889);和HRP偶联的山羊抗兔IgG(Transgen Biotech,HS101-01,稀释1:5,000)。
使用增强的ECL化学发光检测试剂盒(Vazyme)根据制造商的说明检测到化学发光,并随后由Li-Cor Odyssey FC成像系统(LI-COR Biosciences)成像。未编写的Western印迹图像作为补充数据。基于GAPDH(背景减去),ISG15细胞裂解液和ISG15超级图像的GAPDH(倒数)的灰度TIFF RAW文件(ISG15细胞的减法),根据斐济imageJ软件(多量)计算了光密度测量。将计数标准化为GAPDH水平,并相对于人类细胞裂解物ISG15信号(n = 3个独立印迹)表示。
ISG15的单引导RNA(SGRNA)是按照公开的协议130设计的,随后将每个SGRNA序列克隆到plenticrisprv2 vector中(Addgene质粒52961)。争夺非靶向的GRNA也被设计为负面对照。GRNA序列显示在补充表27中。使用上述方法生成慢病毒。首先将HEK293细胞转导并用嘌呤霉素(1 µg ML -1)选择两轮10天,然后是ISG15的Western Blot进行敲除验证。
HCOV-229E临床分离株是J. Zhao(广州医科大学)的礼物,IAV H1N1 PR8和VSV – GFP(印第安纳州)是L. Lu(Zhejiang University)的礼物。使用下一代测序131的序列验证后,将SARS-COV-2(SARS-COV-2/SB3-TYAGNC)的临床分离株用于感染研究。HCOV-229E在HUH7细胞或MRC-5细胞中培养。使用先前发布的协议131在VERO-76细胞中的HEK293细胞中的A549或VERO-E6细胞中传播IAV,在HEK293细胞中进行了VSV – GFP。所有储备均以低血清制备,用于细胞碎片,在各个细胞系中进行等分并滴定。病毒库存被解冻一次并用于实验。每个实验都使用一个新的小瓶,以避免重复冻融。在低MOI(0.1)的1%FBS中,对于荧光报告基因或HCOV-229E TCID50分析,就进行了病毒感染。HCOV-229E测定法在低名培养基中以十倍稀释液进行。H1N1 PR8 IAV感染是在Vero-E6中的MOI下进行的,在1%FBS中,在1%FBS中进行2小时,然后去除并用生长培养基替换。感染后24小时收集上清液和细胞裂解物。在4-6小时感染后冲洗VSV – GFP测定后,上清液收集类似,被增长培养基取代,随着时间的推移,直到大约70-80%的GFP阳性(过夜)。
对于SARS-COV-2感染,将A549-ACE2细胞以每孔1.5×105细胞的密度在12孔板中播种24小时。然后,用编码BAT ISG15的200 ng质粒(见上文)或载体对照24小时转染细胞,然后在0.01的MOI下用祖先SARS-COV-2(SARS-COV-2/SB3-TYAGNC分离株)感染48小时。对照细胞被假感染。将感染或假感染的细胞在37°C下孵育1小时,每15分钟轻轻摇动。1小时后,去除了病毒接种物,用PBS洗涤细胞,并用生长培养基补充。感染后48小时,使用先前发表的方案132收集了来自感染和虚假感染细胞的大量细胞RNA和培养基。用MCHERRY_PCDNA3.1(+) - P2A质粒转染的细胞并用SARS-COV-2感染了质粒DNA转染介导的对SARS-COV-2复制的影响的对照。使用经批准的方案,萨斯喀彻温大学的疫苗和传染病组织的3级实验室中,所有使用感染性SARS-COV-2的工作都是在3级实验室进行的。
为了在稳定表达ISG15的细胞中测试直接抗病毒功能,在A549稳定的细胞系中使用IAV H1N1 PR8进行了斑块测定(如上所述),通过在24粒元素中添加50 µL病毒在500 µL低FBS培养基(三)和10倍稀释液中(三)和10倍稀释液(三)。在冲洗之前,将细胞与病毒孵育4小时,并用2%甲基纤维素4000 CP直接叠加层(Beyotime)代替,补充了1%FBS和PEN/StREP 3-4天。
使用TCID50 Assay133,将来自SARS-COV-2感染细胞的上清液滴定在Vero-76细胞上的一式三份中。简而言之,将1.5×104个细胞在96孔板的每个孔中播种。将板孵育过夜以获得Vero-76细胞的汇合层。第二天,将培养基从细胞中取出,并将50μl1:10串联稀释的含病毒的上清液添加到板上。将板在37°C下孵育1小时。孵育后,将含有病毒的上清液丢弃,并将100μl完整的培养基添加到板中。将板在37°C下分别孵育三天和五天,并使用光学显微镜观察到细胞疗法。使用Spearman和Karber算法134,135计算每毫升TCID50。
根据ISG15(ENST00000649529)的序列,与人ISG15中Cys78相对应的残基与丙氨酸的密码子交换(会改变极性并去除半胱氨酸二硫键键)或丝氨酸(具有相似的形状和电荷,但具有相似的形状和电荷,但缺乏二硫化物键),而二硫化物的键则需要几乎需要的nitleotide。同样,艾affinis中的Ser77被更改为半胱氨酸或组合突变体,在77位置取代缺失的赖氨酸并将丝氨酸交换为半胱氨酸残基(在人Cys78上)。这些基因构成是在同一IRES -MCHERRY主链中产生的。分别在24小时或48小时后收集转染或转染后的Huh7细胞上清液,分别颗粒以去除细胞膜,并直接添加到SDS-PAGE-PAGE-PAGERAPARING染料染料中,以作为蛋白质印迹。同样,在HCOV-229E感染48小时后收集上清液。如前所述收集细胞裂解物。
使用先前的修饰136,使用Quikchange II位置定向的诱变试剂盒(Agilent)生成了鼻发脂和Yonghoiseni ISG15(LRGG至LRAA)突变体136;有关引物序列,请参见补充表27。加拿大国家研究委员会的桑格测序证实了突变。
除了由A.E.M.矢量化的BAT Silhouette外,从今天(https://www.phylopic.org)下载了数字中使用的动物轮廓。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。
本文来自作者[yjmlxc]投稿,不代表颐居号立场,如若转载,请注明出处:https://yjmlxc.cn/zsfx/202506-5072.html
评论列表(3条)
我是颐居号的签约作者“yjmlxc”
本文概览: 为了评估在蝙蝠和啮齿动物中以及属于不同BAT家族的物种中检测到的冠状病毒的频率,我们使用了Zover6的数据(最后一次进入,2023年1月25日),考虑到仅考虑元基因组学研...
文章不错《BAT基因组照亮了对病毒耐受性和抗病性的适应》内容很有帮助