微信号:8149027
不接反杀,想去别人群里开挂,开不了不用加。
复制微信号
涟漪使用突变注销树(MATS)20的空间数据结构,其中系统发育树的分支被注释,其中已推断出在其上发生的突变,以识别重组事件。图1说明了基础算法。涟漪识别了推定的重组节点,这些节点至少包含用户指定的突变数,并通过考虑其从根部的路径上在分支上注释的所有突变,从而在其相应的序列上发出突变集。然后,波纹在突变位点增加了一个或两个断点,并与起始简约相比,使用部分放置评估了简短的分数提高。有关更多详细信息,请参见补充文本1。为了确定推定的重组是否很重要,我们通过随机选择节点并添加k个从我们全球树中实际突变光谱中得出的k附加突变开发出无效的模型。然后,我们将这些样品放在树上,并使用波纹来确定其简约评分改进(补充文本2)。对于我们全球树中的每种推定重组,我们将其简约分数的提高与相同初始简约分数的Null Parsimony评分提高的分布进行了比较(补充文本3)。我们首先采用2021年5月28日的公共树19,20,掩盖了所有有问题的站点29,并修剪少于28,000个非N核苷酸以及具有两个或两个或多个非[ACGTN-]核苷酸的核苷酸(补充文本5)的样品(补充文本5)。此后,我们通过两次运行Matopimize(补充文本4)进行优化,并具有一个子树修剪和重新编排(SPR)半径(SPR)半径为前10个,然后在随后的回合中进行40,并带有屏蔽的变体呼叫格式(VCF) 文件作为输入。使用涟漪的说明可在https://usher-wiki.readthedocs.io/en/latest/tutorials.html上找到。我们在N2D-HIGHCPU-224上运行了涟漪,其中包含224个虚拟中央处理单元(VCPU)(补充文本18)。
为了测试涟漪的灵敏度,我们通过选择至少十个后代的系统发育中的两个随机内部节点来模拟重组样品,并在整个基因组中随机选择断点。我们使用https://github.com/bpt26/recombination/上可用的脚本,对一个和两个断点重组分别产生了1,000个模拟,其中一个,两个,两个,两个和三个突变添加到了序列中。这些组合产生了2,000个总模拟重组谱系。然后,我们测量了涟漪检测到断点的能力,这是断点位置的函数以及从重组节点到任一个父的最小遗传距离(补充文本6;遗传距离是根据推断的突变数估算的,以分离焦点样品,谱系,谱系或节点)。我们还通过确保它检测到Jackson等人16的每个高信心重组SARS-COV-2簇来评估了波纹的灵敏度。
我们应用了几个事后过滤器,以删除推定的重组节点,这些节点可能是由于几个可能的错误来源而导致的假阳性。对于每个三重组(推定重组,供体和受体节点)的每个内部节点,包括重组事件,我们下载了来自COG-UK,GenBank,Gisaid,Gisaid,Genbank,Gisaid和中国国家生物信息信息中心的每个节点最近的后代的共识基因组序列。然后,我们使用MAFFT30对每个三重奏的所有后代的序列对齐,专门针对重组信息位点,即重组节点的等位基因与一个父节点匹配,而另一个则不匹配。如果重组信息突变接近indels或缺失碱,或者重组的整个基础是20-核苷酸跨度中的单个突变簇(补充文本7)。我们还通过手动检查十个样本的原始读数来确认序列质量,在这些样本中,我们可以自信地将原始序列读取数据与给定的共有基因组联系起来(补充文本8)。为了估计与我们选择的特定方法和所选统计阈值相关的错误发现率(FDR),我们计算了事后经验FDR。我们获得了我们测试的内部节点的数量,并且与给定的简约评分有关。然后,对于每个初始简约评分和简约评分的提高,我们获得了预期的内部节点数量,这些数量将表明零模型下的简约分数提高。我们的FDR(扩展数据表3)是给定初始和最终简约评分的预期节点与具有相同初始和最终简约分数的重组节点的数量(补充文本9)。
我们还使用样品元数据进行了事后分析,以确定重组节点的祖先是否比偶然预期的空间或时间重叠更高。我们将地理重叠计算为从捐助者和受体节点的后代选择样本的联合概率。对于时间重叠,我们分别从最早到最新的样本记录了捐赠者和受体的最新样本的间隔,并计算了分隔两个间隔的最小天数(对于重叠间隔为0)。我们通过选择每个检测到的三重奏,从树中选择两个随机的内部节点,分别等于实际供体和受体。然后,我们以相同的方式计算了地理和时间重叠(扩展数据图4和补充文本10)。
为了确定确定的重组断点是否显着转移到基因组的3'末端,我们进行了置换测试,比较了均匀模拟断点的平均值与真实集合中检测到的断点位置分布的平均值之间的差异(补充文本12)。我们还使用更改点R软件包31进行了更改点分析,并将Poisson模型适合重组预测间隔中点的计数。然后,我们计算了在确定的变更点两侧的间隔内计算重组断点的平均速率,以估计基因组3'部分重组率的折叠增加(补充文本13)。为了估计r/m,我们发现与每个检测到的重组事件相关的简约评分下降,作为R的估计值。然后,我们通过获取该值并从整个系统发育中观察到的突变总数(补充文本16)中计算出M。r/m是这些值的比率。
有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。
本文来自作者[yjmlxc]投稿,不代表颐居号立场,如若转载,请注明出处:https://yjmlxc.cn/life/202506-6969.html
评论列表(3条)
我是颐居号的签约作者“yjmlxc”
本文概览: 涟漪使用突变注销树(MATS)20的空间数据结构,其中系统发育树的分支被注释,其中已推断出在其上发生的突变,以识别重组事件。图1说明了基础算法。涟漪识别了推定的重组节点,这...
文章不错《大流行级系统组学揭示了SARS-COV-2重组景观》内容很有帮助