微信号:8149027
不接反杀,想去别人群里开挂,开不了不用加。
复制微信号
在MD Anderson癌症中心评估了研究参与者,并接受了早期LUAD(I-IIIA)的护理标准手术切除。根据知情同意书,从银行或残留组织中获得了所有患者的样本,并获得了MD Anderson机构审查委员会方案的批准。然后使用残留的手术样本用于衍生多区域样品进行单细胞分析(补充表1)。手术后立即由经验丰富的病理学家助理处理切除的组织。记录并测量了标本的一侧,然后进行肿瘤边缘鉴定。基于肿瘤在样品中的放置,在沿着样品长度的一个方向上沿一个方向上的定义收集位点进行切口,并跨越整个叶片:肿瘤和肿瘤 - 偏见的正常实质,分别从肿瘤边缘和整体样品或叶的外围。为P2 – P16患者选择了另外的肿瘤中间正常组织样品,距肿瘤边缘3至5 cm。从肿瘤向内移动到肿瘤的NL组织开始采集样品,以最大程度地减少收集过程中的交叉污染。
将来自人类供体和小鼠肺的新鲜组织收集在补充2%FBS的RPMI培养基中,并保持在冰上以立即加工。将组织放在冰上含有汉克平衡盐溶液(HBS)的细胞培养皿中,并用剪刀去除肺上气道和结缔组织。将样品转移到冰上的新菜肴中,并将其切成大约1 mm3片,然后酶消化。对于人体组织,酶促溶液由胶原酶A(10103578001,Sigma Aldrich),胶原酶IV(NC9836075,Thermo Fisher Scientific),DNase I(11284932001,Sigma Aldrich),Sigma Aldrich),Sigma Aldrich),Dispase II(Dispase II(Dispase II)(NC9301601,Thermo Fisher Scientific)和Pronase(10165921001,Sigma Aldrich)如前所述40。对于小鼠肺消化,酶促溶液由I型I型(CLS-1 LS004197,Worthington),弹性酶(ESL LS002294,Worthington)和DNase I(D LS002007,Worthington)组成。将样品转移到5 mL叶叶脚epentorf管中,并在37°C的烤箱中孵育20分钟,并轻轻旋转。然后将样品通过70μm滤网(Miltenyi Biotech,130-098-462)过滤,并用冰冷的HBS洗涤。然后将滤液离心并重悬于冰冷的ACK裂解缓冲液(A1049201,Thermo Fisher Scientific)中,以进行红细胞裂解。在红细胞裂解后,将样品离心并重悬于冰冷的FBS中,过滤(使用40μmFlowMi尖端过滤器; H13680-0040,Millipore),并将等分试样用于计数细胞,并通过Thrpan Blue(T8154,Sigma Aldrich Aldrich分析)检查了计数。
将来自患者P1的单细胞用Sytox蓝色生存力染料(S34857,Life Technologies)染色,并在FACS ARIA I仪器上加工。将来自P2-P16的细胞用抗EPAM-PE(347198,BD Biosciences; 1:50含有2%FBS的冰冷PBS稀释)染色30分钟,在4°C下轻轻旋转。Mouse lung single cells were similarly stained but with a cocktail of antibodies (1:250 each) against CD45-PE/Cy7 (103114, BioLegend), ICAM2-A647 (A15452, Life Technologies), EPCAM-BV421 (118225, BioLegend) and ECAD-A488 (53-3249-80, eBioscience).然后将染色的细胞洗涤,使用40μM滤波器过滤,用Sytox Blue(人)或Sytox Green(小鼠)染色,并在FACS ARIA I仪器上加工(分别为人类和小鼠细胞的补充图1和4显示了上皮细胞分选的门控策略)。消除了双线和死细胞,并在含有2%FBS的PBS中收集了可行的(Sytox阴性)上皮旋风。再次洗涤细胞以消除环境RNA,并在加载10倍基因组铬微流体芯片之前通过锥虫蓝色排除来计数。
每个样品最多可将多达10,000个细胞分为纳米级凝胶珠乳胶(GEMS)(GEMS),使用铬下一个GEM单细胞5'GEL BEAD BEAD KIT KIT V.1.1(1000169,10X基因组学),并通过将其载入Chromium Next Gem Chips G(1000127,1000127,10x Genomics)。然后根据制造商的协议,将宝石恢复到使用铬的下一个宝石单细胞5'库试剂盒(1000166,10x基因组学)构建单细胞基因表达文库。简而言之,恢复的条形码宝石被打破并汇总,然后进行磁珠清理(Dynabeads Myone Silane,37002d,Thermo Fisher Scientific)。然后通过PCR扩增10倍 - 钢筋编码的全长cDNA,并使用生物分析仪高灵敏度DNA试剂盒(5067-4626,Agilent)进行分析。携带多达50 ng的cDNA来构建基因表达文库,并在5'基因表达文库构造之前被酶碎片碎片和尺寸选择,以优化cDNA扩增子大小。然后,使用单个索引试剂盒A集合A(2000240,10X基因组学)对样品进行最终修复,A量表,适配器连接和样品索引PCR,以生成适合Illumina的基因表达式库。使用生物分析仪高灵敏度DNA试剂盒(5067-4626,Agilent)和量子dsDNA高灵敏度测定试剂盒(Q32854,Thermo Fisher Scientific)测量文库质量和产量。通过调整每个库的目标单元格和单个文库浓度,然后汇总至最终浓度10 nm,将索引的文库标准化。然后根据建议在Illumina Novaseq 6000平台上进行测序,将图书馆池变性和稀释。
预处理原始SCRNA-SEQ数据(使用10倍基因组学提供的细胞Ranger单细胞软件套件(V.3.0.1),使用细胞Ranger单细胞软件套件(V.3.0.1)进行了预处理(消除型细胞条形码,读取和生成基因计数矩阵)。为了读取人和小鼠SCRNA-SEQ数据的对齐,分别使用了人参考GRCH38(HG38)和小鼠参考GRCM38(MM10)基因组。生成和评估详细的质量控制指标,并仔细而严格地过滤细胞以获取下游分析的高质量数据15。简而言 <200 genes such as cell debris, empty drops and low-quality cells) were filtered out and excluded from subsequent analyses. Probable dying or apoptotic cells in which >还排除了从线粒体基因组得出的转录本15%。对于gprc5a - / - ; sftpccreer/+; rosasun1gfp/+小鼠的SCRNA-seq分析,使用SEURAT41滤除了≤500个基因的细胞或用线粒体基因分数≤500个基因分数。
如先前的研究15,42所述,通过多步进方法识别并小心地删除了可能的双线或多重组。In brief, doublets or multiplets were identified based on library complexity, whereby cells with high-complexity libraries in which detected transcripts are aligned to >6,500 genes were removed and, based on cluster distribution and marker gene expression, whereby doublets or multiplets forming distinct clusters with hybrid expression features and/or exhibiting an aberrantly high gene count were also removed.仔细审查了每个鉴定出的簇中与规范谱系相关标记基因的表达水平和比例。识别并去除了共表达差异谱系标记的群集。还使用Doublet检测算法DoubleTfinder43鉴定了双线或多重组或多重组。根据SCRNA-Seq库构建之前获得的细胞计数,估算了预期双重组的比例。然后使用Seurat41在过滤的基因–细胞基质上使用SEURAT41进行数据归一化。如先前的研究15,42中所述,使用R软件包Rogue36对非恶性上皮细胞进行了可能的批次效应的统计评估,并使用默认参数运行Harmony44,以消除PCA空间中存在的批处理效应。
应用Seurat41的函数FindVariable Features识别无监督细胞聚类的高度可变基因。PCA是在前2,000个高度可变基因上进行的。用Seurat的肘部功能生成肘图,并根据该功能确定重要的主成分(PC)的数量。Seurat的FindNeighbors函数用于基于使用Seurat函数FindClusters执行的无监督聚类构建共享的最近邻居(SNN)图。进行了多轮聚类和亚集群分析,以识别主要的上皮细胞类型和不同的细胞转录状态。使用UMAP45和SEURAT函数RunuMap进行了细胞簇的尺寸降低和2D可视化。用于计算嵌入的PC的数量与用于聚类的PC相同。为了分析人类上皮细胞,流氓用于量化每个簇的细胞转录异质性。然后对Rogue确定的低纯度群集进行亚聚集分析。对和谐批处理校正的PCA降低空间进行了主要上皮子集的分层聚类。对于恶性细胞,除了全球UMAP可视化外,在没有和谐批次校正的情况下进行了下游分析,包括大规模CNV的鉴定,癌细胞分化状态的推断,元数据的定量,元数据的定量,轨迹分析和突变分析。使用病房链接方法基于欧几里得距离计算人类上皮细胞谱系的分层树,并使用R函数图生成树状图。为了对GPRC5A - / - 小鼠进行SCRNA-SEQ分析,使用肘部功能选择了排名最高的十个PC。用分辨率参数= 0.4进行SNN图构造, 并使用默认参数执行UMAP可视化。为了进行gprc5a - / - ; sftpccreer/+; rosasun1gfp/+小鼠的SCRNA-SEQ分析,将最高的20个和谐校正的PC用于SNN图构造,并使用分辨率参数= 0.4进行无用的聚类。使用min.dist = 0.1的RunuMap函数进行UMAP可视化。使用FDR调整后的P值鉴定出差异表达的簇基因(DEG)< 0.05 and log2(fold change) >1.2。
基于从以前的研究中所述的多个来源的信息,将恶性细胞与非恶性子集区分开。15,42。以下策略用于鉴定恶性细胞。(1)簇分布:由于高度的患者间肿瘤异质性,与正常上皮细胞相比,恶性细胞通常表现出明显的簇分布。尽管来自不同患者的非恶性细胞通常被细胞类型聚集在一起,但来自不同患者的恶性细胞可能形成单独的簇。(2)CNV:我们应用了UnderCNV16(V.1.3.2)来推断每个单独的细胞中的大规模CNV作为参考对照。为了量化细胞水平的CNV,使用先前描述的策略16汇总了CNV评分。简而言之,根据每个染色体臂的CNV值的平均值计算臂级CNV评分。通过使用R函数均值计算臂级得分的算术平均值,将臂级CNV得分进一步汇总在所有染色体臂上。(3)标记基因表达:在上皮细胞簇中确定肺上皮谱系特异性基因和与LUAD相关的癌基因的表达。(4)KRASG12D突变的细胞级表达:如前所述15,BAM文件被查询以krasg12d突变等位基因,然后将其映射到特定的细胞。如上所述,KRASG12D突变以及簇分布,标记基因表达和推断的CNV被用来区分恶性细胞与非恶性细胞。在所有患者的恶性细胞聚集后,注意到缺乏从p12或p16中鉴定出的恶性细胞。这可能归因于这些患者肿瘤样品中捕获的上皮细胞数量少(补充表2)。
为了以单细胞分辨率绘制躯体KRAS突变,使用突变位置信息从相应的BAM文件中提取对齐记录。将标记为PCR重复或辅助映射的唯一映射比对(MAPQ = 255)被过滤掉。使用综合基因组观察者(IGV)46评估了所得的体细胞携带读数,并使用CB标签来识别携带突变读数的细胞身份。To estimate the VAF of KRASG12D mutation and cell fraction of KRASG12D-carrying cells within malignant and non-malignant epithelial cell subpopulations (for example, malignant cells from all LUADs, malignant cells from KM-LUADs, KACs from KM-LUADs), reads were first extracted based on their unique cell barcodes and BAM files were generated for each subpopulation usingSamtools(v.1.15)。然后使用IGV对突变进行可视化,并通过将krasg12d的读数的数量除以每个亚群的唯一对准读数的总数来计算VAF。使用类似的方法来可视化KRASG12C携带的读数并计算来自KM-Luad病例的正常组织KAC的KRASG12C的VAF。为了计算携带突变的单元格的分数,使用AlignmentFile和PYSAM包装中的Fetch函数从BAM文件中映射提取的读数。使用“重复”和“质量”标签进一步过滤提取的读数,以删除PCR重复项和低质量映射。使用读取条形码中的CB标签总结了每个单元格中有或没有KRASG12D突变的读数。然后,计算携带突变的细胞分数为至少一个KRASG12D的细胞数量的比率,读取至少一个高质量读取的细胞数量,映射到该基因座。
原始的唯一分子标识符计数已识别的恶性细胞被对数均衡,并使用SEURAT(RUNPCA函数)用于PCA分析。使用嵌入函数提取PCA尺寸还原数据。排名最高的三个最高的PC是使用JMP(V.15)的可视化导出的。PCA数据的3D散点图是使用JMP中的散点图3D工具生成的(v.15)。使用r package fpc(v.2.2-9)的bhattacharyya函数计算bhattacharyya距离。排名前25位的PC均用于患者级和细胞级距离计算。对于Bhattacharyya在细胞水平上的距离定量,为每个由驾驶员突变定义的患者组随机采样100个细胞(例如,km-luads)。随机抽样过程重复100次,然后在患者组之间计算成对的bhattacharyya距离。使用Wilcoxon Rank-sum测试对患者组之间的Bhattacharyya距离之间的差异进行了测试,并使用R Package GGPLOT2(v.3.2.0)的GEOM_BOXPLOT函数生成盒平面。
基于无监督的聚类分析,使用Harmonony44确定了非理性细胞类型和状态。在非恶性细胞上进行了两轮聚类分析,以鉴定主要细胞类型中的主要细胞类型和细胞转录状态。使用具有默认参数的Seurat进行了人类正常上皮细胞的聚类和UMAP可视化(扩展数据图1A)。具体而言,参数k.param = 20和分辨率= 0.4分别用于SNN图构造和群集识别。使用默认参数(min.dist = 0.3)进行UMAP可视化。为了对气道和肺泡上皮细胞进行聚类分析,使用RUNPCA函数来确定每个子群的最有效的顶部PC和类似的聚类参数(K.Param = 20,分辨率= 0.4)用于SNN图构造和群集识别。使用seurat中的runumap函数生成min.dist = 0.3的UMAP图。使用r package ggplot2(v.3.3.5)中的stat_densit_2d函数生成肺泡中间细胞的密度图,前两个UMAP尺寸还原数据作为输入。使用FDR调整后的P中的seurat中的Findmarkers函数鉴定了每个群集的DEGS< 0.05 and a fold change cut-off >1.2。我们小组和其他15,47,48的规范上皮标记基因用于注释正常的上皮细胞类型和状态。为某些DEG和典型标记生成气泡图,以定义AT1细胞(AGER1+ETV5+PDPN+),AT2细胞(SFTPB+SFTPC+ETV5+),SCGB1A1+SFTPC+Dual-Persitive细胞(AGER1+ETV5+PDPN+PDPN+SFTPN+SFTPC,(SCGB1A1+SCGB3A1+CYP2F1+),基底细胞(KRT5+TP63+),纤毛细胞(CAPS+PIFO+FOXJ1+),离子组织(ASCL3+FOXI+),神经内分泌细胞(CARCA+ASCL1+)和Tuft Cell(ASCLE)和Tuft Cells(ASCl2+PT)。通过对AIC的无监督聚类来鉴定KAC,并根据先前报道的标记基因25,26,49定义,包括相对于其他肺泡细胞的显着上调:KRT8,CLDN4,Plaur,CDKN1A和CDKN2A。
从原始研究中下载了先前定义的ITH MPS19的基因。Among a total of 41 consensus ITH MPs identified, MPs with unassigned functional annotations (unassigned MPs 38–41; n = 4), neural and haematopoietic lineage-specific MPs (MPs 25–29, MPs 33–37; n = 10) and cell-type-specific MPs irrelevant to LUAD (MPs 22–24 secreted/cilia,MP 32皮肤色素; n = 4)被过滤,导致23 MP与癌症的标志密切相关,并用于进一步分析。如前所述15,42,使用Seurat中的AddModulesCore函数计算签名得分。这项研究中使用的KRAS签名是通过计算KRAS突变体恶性细胞增强簇和其他恶性细胞(FDR调整后的P值之间的DEG)得出的< 0.05, log(fold change) >1.2;扩展数据图2i)。人和小鼠KAC特征以及人类的“其他AIC”特征是通过使用牙槽细胞中的Findallmarker计算DEG来得出的(FDR调整后的P值< 0.05, log(fold change) >1.2)。从分子签名数据库(MSIGDB; https://www.gsea-msigdb.org/gsea/msigdb/msigdb/mouse/geneset/geneset/geneset/hallmark_p53_pathway; mmm3896)下载了p53途径中的鼠标基因。使用seurat中的AddModulesCore函数计算了KAC,其他AIC,KRAS和P53的签名分数。
通过根据细胞的转录组相似性来推断细胞的伪颞下序,对肺肺泡和恶性细胞的分化轨迹进行分析。使用带有检测基因函数的默认参数对P14进行的恶性细胞分析。需要至少50个细胞表达检测到的基因。为了构建谱系标记的上皮细胞(GFP+)的分化轨迹,前150度(FDR调整后的P值)< 0.05, log(fold change) >1.5,以≥50个细胞表示),通过从NNK处理的样品中对每个细胞群体的折叠变化进行排名,用于用setOrderingFilter函数订购细胞。使用降低的函数将轨迹与“ ddrtree”设置设置为“ DDRTREE”生成。根据以下标准选择轨迹根:(1)推断的伪颞梯度;(2)Cytotrace评分预测;(3)沿轨迹的DEG进行仔细的手动审查。为了描述ITH MPS19的表达动力学,使用JMP Pro(v.15)中的更平滑的工具绘制了ITH MP分数沿伪轴绘制并平滑线生成。使用没有标准化的原始计数作为输入,将Cytotrace18与默认参数应用于推断细胞分化态以补充轨迹分析并进一步了解细胞分化层次结构。使用R包装的正常碎函数用于确定k = 2的AIC中的细胞体得分阈值。使用0.58的最终阈值将AICS二分化为高分化和低分化组。使用R封装传输(V.0.13)应用Wasserstein距离度量,以量化细胞体评分分布的变异性。使用wasterstein1d功能来计算一个患者的实际细胞体评分分布与模拟数据的分布之间的距离,其平均值和标准偏差相同。单镜2基于单镜下的伪序列排序预测的鲁棒性通过包括Palantir51,Slingshot52和Cellrank53在内的独立假频率预测工具进行了验证。使用Slingshot(v.2.6.0)使用Slingshot函数进行降低的IM参数设置为“ PCA”,并将其他参数设置为默认值。使用Cellrank Python软件包(V.1.5.1)的默认参数进行Cellrank预测。使用Palantir Python软件包进行Palantir预测 (v.1.0.1)。使用run_diffusion_maps函数生成一个扩散图,其中n_components = 5。使用num_waypoints = 500的run_palantir函数生成palantir预测,而设置为默认值的其他参数。然后,通过三种独立方法推断出的假频率与每个单元2的单片2生成的方法集成在一起,然后进行成对映射和相关分析。使用JMP(V.15)中的轮廓工具生成细胞密度图,其n = 10梯度级别,并且将轮廓类型参数设置为“非PAR密度”。为了评估单镜2和三种独立方法之间的假次预测一致性,计算了Spearman的相关系数,并使用R.中的COR.TEST函数进行了统计测试。
根据制造商的建议,使用10倍基因组学的visioum平台,使用10倍基因组学的visioum平台对福尔马林固定和石蜡固定(FFPE)组织(FFPE)组织(FFPE)组织(FFPE)组织和来自两种GPRC5A - / - 小鼠的三个肺组织的ST分析。从SCRNA-SEQ分析的组织中收集P14 FFPE组织。根据仔细注释的H&E染色载玻片的仔细注释,使用APERIO扫描仪涡轮涡轮机扫描仪(Leica Microsystems)选择了每个组织或样品的感兴趣区域,每个组织或样品都包含6.5×6.5 mm捕获区域。HARO软件(Indica Labs)用于病理注释(肿瘤区域,血管,支气管,淋巴样细胞聚集体,巨噬细胞,肌肉组织,正常实质和反应性肺细胞)的H&E组织学图像。使用Loupe浏览器(v.6.3.0)生成点级组织病理学注释和可视化。简而言之,将来自太空游侠生成的插头文件加载到Loupe浏览器中。然后使用导出图工具以SVG格式生成注释的可视化。根据制造商的说明生成了ST RNA-Seq库,每个图书馆都有大约3,600个独特的条形码斑点。在Illumina Novaseq 6000平台上对图书馆进行了测序,以达到至少50,000个平均读取对的深度,每个位置至少有2,000个中位基因。
排列的反复列出的原始测序数据对齐,并如前所述使用分析管道生成基因水平表达定量。54。简而言之,将脱层的清洁读数与spaceranger的UCSC人GRCH38(HG38)或GRCM38(MM10)小鼠参考基因组对齐(v.1.3.0 for Human ST Data和V.2.0.0用于小鼠ST数据)并使用默认设置。然后使用Seurat(V.4.1.0)分析生成的ST基因表达计数矩阵,以执行无监督的聚类分析。使用默认参数,将最高的30个PCA组件用于SNN图构造和聚类,以及用于默认参数的UMAP低维空间。使用RunuMAP函数进行UMAP分析。SpatiaDimplot函数用于可视化无监督的聚类。R软件包USWERCNV16用于拷贝数分析。根据SEURAT和检查病理注释的检查,选择了CNV分析中使用的参考点。通过计算22个常染色体推断的CNV的标准偏差来计算CNV评分。Loupe浏览器(V.6.3.0)用于可视化病理注释结果。使用Tesla(v.1.2.2)机器学习框架55(https://githubub.com.com.com.com.com.com.com.com.com.com.com.com.com.com.com/jianhuupenn/jianhuupenn/tessla),测量并直接对感兴趣的基因(例如KRT8)以及感兴趣的签名(例如,KAC和KRAS)的表达水平进行了测量和直接注释。特斯拉可以通过整合来自高分辨率组织学图像的信息来计算超像素级基因表达并检测肿瘤内部和周围的独特结构。注释和可视化函数用于具有高签名信号的注释区域。在人类ST分析中,使用KRT8,Plaur,Cldn4,CDKN1A和CDKN2A进行“ KAC标记”签名注释。对于鼠标ST数据,KRT8,Plaur, CLDN4,CDKN1A和CDKN2A用于“ KAC签名”注释。使用Scanpy(V.1.9.1)的散点函数生成KRT8和Plaur的基因水平表达可视化。使用CytoSpace56(https://github.com/digitalcytometry/cytospace)进行反卷积分析。首先使用函数gentate_cytospace_from_scrna_seurat_object将带注释的SCRNA-SEQ数据转换为兼容格式。使用函数generate_cytospace_from_st_seurat_object制备visium空间数据。使用默认参数的CytoSpace函数(V.1.0.4)进行反卷积。为了确定森林数据中特定细胞群体的相邻细胞组成,首先应用细胞水平以注释最可能的细胞类型的每个位置。相邻的斑点定义为每个位置周围的六个斑点,因此计算了特定细胞类型的相邻细胞组成。使用Monocle 2(参考文献18)使用DDRTREE方法使用DEG进行了与FDR调整后的P值一起进行ST数据的轨迹构造< 0.05.
Total DNA was isolated from homogenized cryosections of human lung tissues and, when available, from frozen peripheral blood mononuclear cells (PBMCs) using a Qiagen AllPrep mini kit (80204) or a DNeasy Blood and Tissue kit (69504), respectively (both from Qiagen) according to the manufacturer’s recommendations. Qubit 4 Fluorometer (Thermo Fisher Scientific) was used for measurement of DNA yield. TWIST-WES was performed on a NovaSeq 6000 platform at a depth of 200× for tumour samples and 100× for NL and PBMCs to analyse recurrent driver mutations and using either PBMCs or distant NL tissues when blood draw was not consented, as germline control. WES data were processed and mapped to the human reference genome, and somatic mutations were identified and annotated as previously described57,58 with further filtration steps. In brief, only MuTect59 calls marked as ‘KEEP’ were selected and taken into the next step. Mutations with a low VAF (<0.02) or low alt allele read coverage (<4) were removed. Then, common variants reported by ExAc (the Exome Aggregation Consortium, http://exac.broadinstitute.org), Phase-3 1000 Genome Project (http://phase3browser.1000genomes.org/Homo_sapiens/Info/Index) or the NHLBI GO Exome Sequencing Project (ESP6500) (http://evs.gs.washington.edu/EVS/) with minor allele frequencies greater than 0.5% were further removed. Intronic mutations, mutations at 3′ or 5′ UTR or UTR-flanking regions, and silent mutations were also removed. The mutation load in each tumour was calculated as the number of nonsynonymous somatic mutations (nonsense, missense, splicing, stop gain, stop loss substitutions as well as frameshift insertions and deletions).
Analysis of OS in the TCGA LUAD and PROSPECT60 cohorts was performed as previously described15. KRAS mutation status in TCGA LUAD samples was downloaded from cBioPortal (https://www.cbioportal.org, study ID: luad_tcga_pan_can_atlas_2018). For TCGA dataset, clinical data were downloaded from the PanCanAtlas study18. The logrank test and Kaplan–Meier methods were used to calculate P values between groups and to generate survival curves, respectively. Statistical significance testing for all survival analyses was two-sided. To control for multiple hypothesis testing, Benjamini–Hochberg method was applied to correct P values, and FDR q values were calculated where applicable. Results were considered significant at P value or FDR q value of <0.05. Multivariate survival analysis was performed using a Cox proportional hazards regression model that calculated the hazard ratio, the 95% confidence interval and P values when using pathologic stage, age, KAC and ‘other AIC’ signatures as covariables.
Publicly available datasets were obtained from the Gene Expression Omnibus (GEO) database (https://www.ncbi.nlm.nih.gov/geo/) under accession numbers GSE149813, GSE154989, GSE150263, GSE102511 and GSE219124. Details of the studies28,29 analysed are as follows: GSE149813 investigated single lung cells from KrasLSL-G12D;LSL-YFP mice with Ad5CMV-Cre infection29; GSE154989 studied AT2 lineage-labelled cells from lungs of KrasLSL-G12D/+;Rosa26LSL-tdTomato/+ mice28. Gene expression count matrices of dataset interrogating KrasG12D-driven mouse model from GSE149813 were pre-processed using Seurat following the same filtering steps in that original report. For the GSE154989 dataset28, cells used for analysis were the ones labelled as “PASSED_QC” in supplementary table S7 in that study. For the GSE149813 dataset29, cells with >500 median number of genes detected and <10% fraction of mitochondrial genome derived reads, and according to the pre-processing methods described in their original report29, were retained for analysis. Cells with >7,500 number of genes detected were further filtered to remove potential doublets or multiplets, resulting in 8,304 cells in total for downstream analysis. Both datasets were integrated with mouse cell data generated in this study using Harmony18 with default parameters settings. The top ranked 20 Harmony-corrected PCs were used for clustering with the FindClusters function using resolution = 0.4. UMAP dimension reduction embedding was performed using the RunUMAP function with the same set of Harmony-corrected PCs. Gene expression levels and frequencies of representative cluster marker genes were visualized using DotPlot function from Seurat. The KAC signature score was calculated using the AddModuleScore function from Seurat. The mouse KAC signature was also studied in human AT2 cells with and without inducible KRASG12D (dataset GSE150263) also from ref. 29. Cell filtration criteria described in the original report29 were followed to filter out potential dead cells and doublets (number of detected genes >800和线粒体基因的百分比读取<25%)。使用FindClusters函数= 0.1,使用20个顶级PC进行聚类。使用相同的SNN图计算了UMAP尺寸还原嵌入。使用Seurat软件包的AddModulesCore函数计算KAC签名分数。
大量RNA-Seq数据集GSE102511是我们组先前发布的数据集,包括正常的肺组织,前体AAH和匹配的LUADS(n = 15,每个)61。先前发表的62个散装RNA-SEQ数据GSE219124是在癌症干细胞和类似干细胞的祖细胞上以球体的形式产生的(我们的父母MDA-F471对应物(我们从NNK-Luad开发并培养了NNK-Luad的细胞系,并培养了NNK-luad的GPRC5A-luad km-luad。为了询问KAC与肿瘤形成的关联,提取并使用MCPCounter(V.1.2.0)r包装来量化KAC签名表达的大量RNA-SEQ数据GSE数据GSE102511(TPM计数矩阵)和GSE219124(TPM计数矩阵)(TPM计数矩阵)(TPM计数矩阵)(FPKM计数矩阵)。使用Pheatmap(V.1.0.12)R软件包生成热图。
将这项研究的小鼠KAC与参与肺泡再生的小鼠KRT8+过渡细胞进行了比较,急性肺后损伤了先前的研究25。小鼠KAC和先前报道的KRT8+过渡细胞之间的重叠标记基因使用GGVENN(v.0.1.9)R套件统计评估,使用基于每项研究的折叠变化,使用顶级的50个标记基因。
以下抗体用于数字空间分析(DSP):Claudin 4(克隆3E2C1,AF594,LSBIO,LS-C354893,浓度0.5 µg ML – 1)和角蛋白8(克隆EP1628Y,AF647,AF647,ABCAM,ABCAM,ABCAM,AB192468,浓度0.25,使用结直肠癌和LUAD组织用不同的稀释液进行抗体的优化。如果仅使用标准的GEOMX DSP方案对三种匹配的LUAD和NL进行染色(PANCK:CLONE AE1/AE1/AE3,AF532,浓度,浓度为0.25 µg ML – 1,来自GEOMX实体瘤MORP KIT MORP KIT KIT HSP HSP,121300301,NOVUS BIBIOLICATS)。使用GEOMX DSP平台(纳米串技术)以×20扫描载玻片。扫描后,如果可视化图像载玻片,请多路复用,为每个荧光团调整通道阈值。在腺癌细胞,相邻的反应性肺组织和远处的非反应性肺组织中评估了KRT8,Panck和Cldn4的表达。
根据德克萨斯大学医学博士安德森癌症中心的机构动物护理和使用委员会(IACUC)批准的方案进行动物实验。将小鼠维持在无病原体的动物设施中。没有使用统计方法来预先确定样本量。在所有动物实验中,性匹配和年龄匹配的小鼠被随机分为治疗组。对于所有实验,直到达到终点(在接触盐水或NNK后长达7个月)之前,对小鼠的健康迹象进行监测,并测量其体重症的迹象,以确保体重减轻在72小时内不超过体重的20%。没有一只小鼠出现这些症状。因此,在达到IACUC批准的终点后,它们都被安乐死了。在任何实验中,我们的IACUC方案允许的终点均未超过。对动物实验的数据进行分析以盲目的方式进行。在体内KM-Luad发病机理的背景下研究KAC,GPRC5A - / - 小鼠被询问,因为它们形成了由烟草致癌物加速的LUAD,并获得了Somatic Krasg12d突变,这些突变 - 与KM-Luad开发相关的FEATIS,因此探索了这一开发21,63,64和64和64 kacs。如先前所述21,65,生成GPRC5A - / - 小鼠。每次暴露(NNK或盐水控制)和时间点(EOE或暴露后7个月,总共n = 16只小鼠),将性匹配和年龄匹配的GPRC5A - / - 小鼠分为4只小鼠的起始组。八周大的小鼠在腹膜内注射75 mg kg – 1的体重NNK或0.9%盐水(对照),每周3次,持续8周。在EOE或暴露后7个月时,收集肺部以推导SCRNA-SEQ的活细胞。如上所述处理的其他小鼠的全肺通过FFPE处理,用于分析IF(EOE的每个治疗组n = 2只小鼠,在暴露后7个月,总共8只小鼠)和ST (NNK暴露后7个月,来自n = 2只小鼠的3个肺组织)。
H. Chapman(加利福尼亚大学,旧金山分校)提供了SftPccreer/+; rosasun1gfp/+小鼠,并越过GPRC5A - / - 小鼠,以生成GPRC5A - / - ; SFTPCCREER/ - ; SFTPCCREER/ - + ROSASASUN1GFP/+小鼠,以分析Lineaege-lineaege-lineage-lineage-lineage-lineage-lineage-lineage-lineage-lineage-lineage-liineage-liineage-lineage-Labelled-Labelled at2 at 2。gprc5a - / - ; sftpccreer/+; rosasun1gfp/+小鼠用75 mg kg – 1 nnk或对照盐水(腹膜内)处理3次,持续8周。在治疗的第6周(EOE前2周),来自两组的小鼠连续四天溶解在玉米油中250 µg(腹膜内)他莫昔芬。在EOE或暴露于盐水或NNK后3个月,使用FACS ARIA I仪器通过流式细胞仪来消化肺(Sytox蓝色阴性)GFP+单细胞,如先前所述66(GFP细胞分类的门控策略在补充图6中显示了)。通过SCRNA-SEQ(暴露于盐水和NNK后3个月的n = 2小鼠的GFP+和GFP-级分)分析分类的单细胞,或用于得出器官(分别来自EOE的N = 4或5小鼠的GFP+细胞,分别来自n = 4或5小鼠,分别是盐水或NNK,以及n = 10或13个月的Saline或Nn NN,分别是NN的。如上所述,在NNK后3个月收集了上述盐水或NNK和他莫昔芬的其他小鼠的全肺(n = 2)(FFPE),并通过IF进行分析。
KRT8-CREER; rosatdt/+动物用于生成gprc5a - / - ; krt8-creer; rosatdt/+小鼠用于分析谱系标记的KRT8+细胞。从杰克逊实验室获得了KRT8-CREER(股票编号017947)和Rosatdt/+(AI14;股票号007914)小鼠。首次使用带有Krt8-creer; rosatdt/+的小鼠进行试验研究,以检查KRT8+细胞的标记。如上所述,将小鼠暴露于对照盐水(n = 2只小鼠)或8周的NNK(n = 3小鼠)中,然后是1 mg他莫昔芬连续6天,然后在他莫昔芬暴露结束时分析肺。为了检查标记的KRT8+细胞与肿瘤发育的相关性,GPRC5A - / - ; KRT8-CREER; ROSATDT/+小鼠在NNK中类似地暴露于NNK 8周,然后使用他莫昔芬,然后在NNK暴露后8-12周分析肺(n = 3小鼠)。收集并处理所有肺部,以进行福尔马林固定,OCT嵌入和如果分析。
GPRC5A - / - 小鼠的肺(每次治疗和时间点n = 2)通过重力滴水通货膨胀用福尔马林膨胀,通过宏观观察进行了切除,对肺表面病变进行了检查,并处理FFPE,切片和H&E染色。使用Aperio Scanscope Turbo幻灯片扫描仪(Leica Microsystems)以×200放大倍率对染色的载玻片进行数字扫描,并使用ImageScope软件(Leica Microsystems)可视化。获得未染色的肺组织切片,以进行IF分析LAMP3(克隆391005,突触系统),KRT8(来自爱荷华大学DSHB大学的Troma-i克隆)和PDPN(爱荷华大学DSHB大学的Clone 8.1.1)。在暴露于盐水或NNK后3个月后,以GPRC5A - / - ; sftpccreer/+; rosasun1gfp/+小鼠以相同的方式以相同的方式获得肺FFPE组织样品(每种情况下n = 2只小鼠),并在向他莫昔芬注射后,以相同的方式获得了肺FFPE组织样品。获得组织切片以进行H&E肿瘤发育的H&E染色和评估,并使用对GFP的抗体进行分析(AB13970,ABCAM,1:5000),LAMP3(391005,Synaptic Systems,1:10,000),1:10,000),krt8(Troma-i owa of hybrya hybress of iowa hybress of iowa hybres and owa hybryoma cancome p。8.1.1,爱荷华大学发育研究杂交瘤银行,1:100),克劳丁4(ZMD.306,Invitrogen,1:250)和PrkCDBP(Cavin 3,ProteIntech,1:250)。然后将载玻片用荧光团偶联的二抗和4',6'-diamidino-2-苯基吲哚(DAPI)染色。将部分用Aquapolymount(18606,Polysciences)安装,使用Andor Revolution XDI WD旋转磁盘共聚焦显微镜进行覆盖,并使用Imaris软件(Oxford Instruments)进行分析。
来自KRT8-CREER的福尔马林浸泡的肺裂; Rosatdt/+小鼠在20%蔗糖中冻结在含有10%OCT化合物(4583,组织Tek)的PBS中的20%蔗糖中,在4°C的摇杆上过夜,并在OCT中嵌入。第二天,在PBS中阻塞了10 µm的冷冻切除术,其Triton X-100和5%正常驴血清(017-000-121,Jackson Immunoresearch),并在4°C下在4°C的室内孵育过夜,在PBS中,PBS在PBS中用0.3%的Triton X-4000抗体稀释X-4000型X-4000抗体(SCANTAR CURID NKX2)(SCANTAR)(SCANTA)(SCANTA),SCANTAR(sc)LAMP3(与上面相同)和KRT8(与上述相同)。第二天早晨,将切片洗涤,然后用二抗(Jackson Immunoresearch)和DAPI孵育。然后洗涤载玻片,如上所述滑动,并使用Nikon A1Plus共聚焦显微镜成像。细胞计数器ImageJ插件用于在正常出现区域内的病变和细胞内计数TDT+细胞,即:AT2细胞(LAMP3+),TDT+AT2细胞(TDT+LAMP3+),AT1单元(LAMP3 – NKX2-1+)(避免使用lamp3 – NKX2-1+,避免使用明显的气道)和1个细胞(TDT+tdt+attt+attt+attt+attt+nkx2+nkx2+lamp3-)。计算了TDT+LAMP3+和TDT+NKX2-1+LAMP3–细胞的百分比。计数是每个时间点以×20放大倍数拍摄的一式三份图像的平均值。通过检查每个重复的整个叶片部分的TDT表达,可以估计由TDT+细胞覆盖的区域表面积百分比。
Gprc5a−/−;SftpccreER/+;RosaSun1GFP/+ were treated with NNK or saline and tamoxifen as described above, and they were euthanized at EOE (4 saline-treated and 5 NNK-treated mice) or at 3 months after exposure (10 saline-treated and 13 NNK-treated mice).收集肺部,分解为单个细胞(参见“从组织样品中的单细胞分离”中的小鼠单细胞推导),然后使用FACS ARIA I Instrument通过流式细胞仪来收集活细胞测量法(Sytox蓝色阴性)GFP+单细胞。立即洗涤来自NNK处理或盐水处理的基团的GFP+ AT2细胞,并以每50 µL 3D培养基的5,000个细胞的浓度重悬(F12培养基(补充了胰岛素,转铁蛋白和硒,10%FBS),青霉素 - 链霉菌素和甲氟丁胺)。将GFP+细胞以1:1的比率(按体积)与50,000小鼠内皮细胞(通过CD31选择从小鼠肺中收集,并如前所述地扩展),并重悬于50 µL的GELTREX还原因子减少生长因子基底膜基质(A1413301,Gibco)中。接下来,将100 µl的1:1 GFP+:将内皮细胞混合物镀在带有0.4 µm孔的式嵌入座上,并在一个加湿的CO2孵化器中固化30分钟(EOE:N = 3个井;暴露3个月;暴露3个月后:n = 4孔,用于盐水衍生的solline dernine dernine dernine dernine derfived strainine derfived strainine derfived strainine derfived bonsoids n = 12孔。然后,用含有岩石抑制剂(Y-27632,Millipore)和重组小鼠FGF-10(6224-FG,R&D Systems)的3D培养基补充每个孔,并在加湿的CO2培养箱中在37°C下在37°C下孵育板。每隔一天将井补充3D培养基。对于源自暴露于NNK的小鼠的GFP+类器官,将200 nm KRAS(G12D)特异性抑制剂MRTX1133或DMSO车辆添加到培养基中,每周补充3次(n = 6井)。使用EVOS M7000成像系统(Thermo Fisher Scientific)对类器官进行监测和分析,并分析两次 因此,记录了直径大于100 µm的类器官的数量和尺寸。在终点,使用温和的细胞解离试剂(100-0485,Stemcell Technologies)从基底膜基质中收集3D器官,并用4%多聚甲醛固定,透化,封闭,封闭并在4°C下与if初级抗体的混合物升起lamp3,krtin和krtin and krtin和krtin and krt and krt and krt and krt and a and and and and and and and and and and and and krtin和krtin 3°C的混合物。用荧光团偶联的二抗染色,在4°C下过夜,同时受到光保护。用DAPI核染色洗涤器官30分钟,然后将它们收集在Aqua-Poly/Mount(18606-20,Polysciences)中,并转移至幻灯片。使用Andor Revolution XDI WD旋转磁盘共聚焦显微镜捕获器官的图像,并使用Imaris软件(Oxford Instruments)进行分析。
小鼠支原体不含LuAD细胞系LKR13(突变krasg12d-driven31)和MDA-F471(GPRC5A - / - 和KRASG12D MUTANT27)在96孔平板上(每个孔)(103个细胞)(103个细胞),并在DMEM(GIBCO)中使用1%的1%FBS,并在96孔平板上进行。(A5955,Sigma-Aldrich)和1% - 谷氨酰胺(G7513,Sigma-Aldrich)。第二天,将细胞培养长达4天,其中含有0.5%FBS,0.5%FBS,具有50 ng ML – 1表皮生长因子(EGF)(E5160,Sigma-Aldrich)或0.5%FBS或EGF和EGF的0.5%FBS培养细胞,EGF和EGF和不同的MRTX1133(Mirtx1133(MirtX1133)(Mirtxi-atii Terapeutics)。将Alamarblue细胞活力试剂(25 µL; DAL1025,Thermofisher)添加到每个孔中。治疗后4天,通过在570 nm处通过荧光分光光度法(参考600 nm)评估生存能力。对于相对于空白井(每个细胞系和条件至少3口井),显示出净阳性吸光度的井,计算了处理井和对照井之间的减少百分比。
将LKR13和MDA-F471细胞铺在6孔板中(每孔106个细胞),并在不同条件下生长,如上所述。在治疗后3小时提取蛋白质裂解物,并在夜间与以下原代蛋白的抗体孵育后通过蛋白质印迹分析:Vinculin:vinculin(E1E9V,兔子,细胞信号技术,13901; 1:1,000);磷酸化的P44/42 MAPK(ERK1/2,兔子,细胞信号技术,9101; 1:2,000);磷酸化的S6核糖体蛋白(Ser 235/236,兔子,细胞信号技术,4858; 1:2,000);P44/42 MAPK(ERK1/2,兔子,细胞信号技术,9102; 1:2,000);或S6(E.573.4,兔子,Invitrogen,MA5-15164; 1:1,000)。随后是与稀释的二抗孵育1小时(1706515山羊抗兔IgG-HRP结合物,Bio-Rad)。Protein lysates from each cell line were analysed on multiple gels (four per cell line) with Precision Plus Protein Dual Color Standard (1610394, Bio-Rad) as the ladder and blotted to membranes to separately probe for phosphorylated and total forms of the same proteins, which have highly similar molecular weights (using phospho-specific antibodies or antibodies targeting total version of same protein).评估杂质蛋白蛋白水平作为对每个印迹的负载对照。LKR13和MDA-F471中的每个印迹(磷酸化,总ERK,磷酸s6和总S6)在补充图9中显示,每个图9中均具有相等的蛋白质负荷分析(Vinculin blot),仅在其中显示了具有绿色矩形的蛋白质载荷(Vinculin blot)。使用分子量标记作为指导水平切割膜,并将切割的膜与指定的抗体一起孵育(有关切割的位点,以及相同斑点的比色和化学亮度图像,请参见补充图9,分别显示梯子和分析的蛋白质)。使用Chemidoc触摸成像系统(Bio-Rad)成像印迹 具有化学发光和比色(用于蛋白质梯子)的应用以及自动暴露或手动设置。
HPLC的纯度为99.96%的烟草特异性致癌物(NNK)购自Targetmol。他莫昔芬和H&E染色试剂购自Sigma Aldrich。KRAS(G12D)抑制剂MRTX1133由J. Christensen(Mirati Therapeutics)提供。
除了上述算法和统计分析外,所有其他基本统计分析均在R统计环境(V.4.0.0)中进行。Kruskal – Wallis H检验用于比较三个或更多组的兴趣变量。Wilcoxon Rank-sum测试用于同一患者匹配的样品中的配对比较。Wilcoxon秩和测试用于比较其他连续变量,例如基因表达水平和组之间的特征分数。计算了Spearman的相关系数,以评估两个连续变量之间的关联(例如,细胞比例和基因签名分数)。Fisher的精确测试用于根据两个分类变量确定组频率的差异。使用内置R软件包质量(v.7.3)中的POLR函数进行序数逻辑回归。Benjamin – Hochberg方法用于控制多种假设检验。在这项研究中进行的所有统计检验均两侧。在p值或FDR Q值<0.05时,结果被认为是显着的。当R报告的P值小于2.2e-16时,据报道为P <2.2×10-16。
所有人类LUAD和正常的肺组织都是从德克萨斯大学MD Anderson Cancer Center的机构审查委员会批准方案下获得知情同意的患者获得的。该手稿中的所有人类数据均已识别,以确保患者隐私。所有动物研究均在德克萨斯大学医学博士安德森癌症中心根据IACUC批准的方案进行。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。
本文来自作者[yjmlxc]投稿,不代表颐居号立场,如若转载,请注明出处:https://yjmlxc.cn/yule/202506-4589.html
评论列表(3条)
我是颐居号的签约作者“yjmlxc”
本文概览: 在MD Anderson癌症中心评估了研究参与者,并接受了早期LUAD(I-IIIA)的护理标准手术切除。根据知情同意书,从银行或残留组织中获得了所有患者的样本,并获得了M...
文章不错《肺腺癌的上皮细胞状态和可塑性的地图集》内容很有帮助