跨哺乳动物的精子发生的分子进化

  没有使用统计方法来预先确定样本量。实验不是随机的,研究人员在实验和结果评估过程中并未对分配视而不见 。   我们生成了来自人类(Homo Sapiens) ,黑猩猩(Pan Troglodytes) ,Bonobo(Bonobo(Pan Paniscus),Gorilla(Gorilla Gorilla),Gorilla(Gorilla Gorilla) ,Lar Gorilla),Lar Gibbon(Hylobates lar),Rhesus Macaque(Macaca Mulatta)(Collith Marmosix JAS JACCH)(CONLITHA)(MAUSICT)(MAUSICT)的(hylobates lar)(hylobates lar)(hylobates lar)(hylobates lar)(lar trogila gorilla)(Marmosix JA) ,生成了成人睾丸样品的SnRNA-SEQ数据Musculus,应变:Rjorl:瑞士人;此外,我们从同一个体中生产了黑猩猩 ,大猩猩,长臂猿和果酱的大量RNA-seq数据 。从三个患有睾丸癌的个体的卵形切除术标本中获得了用于原位杂交实验的成年人类睾丸样品。与原位没有癌细胞和生殖细胞肿瘤的肿瘤相邻的组织,并使用了正常的精子发生小管。其他成年灵长类动物睾丸组织是从黑猩猩西部和婆罗洲猩猩(Pongo pygmaeus)获得的 。   我们的研究符合有关人类和其他物种样本的所有相关道德法规。SNRNA-SEQ数据基础的人类样品是从科学组织库(http://medschool.umaryland.edu/btbank/)或专门公司(https://www.tissue-solutions.com/)获得的;这些消息来源是从捐助者或近亲那里获得的。用于RNA的原位杂交实验的样品是从生长与生殖部(Rigshospitalet ,丹麦,丹麦的Rigshospitalet)的组织生物库中获得的,这些样本含有睾丸癌个体(丹麦数据保护局 ,许可证号J. 2001-54-54-0906)的元素切除术 。所有患者均给予知情同意 ,以捐赠残留组织进行研究。本研究中描述的所有人类样品的使用均由欧洲研究委员会(ERC)和地方道德委员会的伦理筛查小组批准:洛桑州的州伦理委员会(授权504/12);来自海德堡大学医学院伦理委员会(授权S-220/2017)和哥本哈根首都地区的区域医学研究伦理委员会(H-16019637)。这项研究中使用的所有灵长类动物均出于突然死亡,原因是他们参与本研究以外的原因,并且与采样器官无关 。ERC伦理筛查面板批准了所有其他哺乳动物样品用于本研究中描述的工作类型的使用。   对于来自Therian物种的样品 ,我们开发了一种核制剂方法,其中包括用Dithio-bis(丙酰丙酸酯)固定(DSP;或Lomant的试剂),这是一种可逆的交叉链链 ,可稳定分离的核。该方法是根据用于固定单细胞悬浮液的方案51和从存档的冷冻脑样品中分离出单核52的 。将重约5毫克的组织块在100-150 µl mg -1的预裂解缓冲液(250 mm蔗糖,25 mm KCl,5 mM MGCl2 ,10 mM HEPES pH 8,1%BSA,1%BSA ,1%BSA,0.1%igepal,0.1%igepal且新鲜添加了1 µm DTT ,0.4 U µM dTt ,Newnand),启用了inderand andior atnand and in n ground and Indictiation)0.2 U µL -1超蛋白酶(Thermofischer Scientific)),在冰上溶于5分钟。将裂解物在4°C下以100克离心1分钟。将上清液转移到新的反应管中 ,并在4°C下以500克离心5分钟 。除去上清液,并将沉淀重悬于0.67卷中 。(使用的体积裂解缓冲液)的新鲜固定溶液(PBS中的1 mg ml -1 dsp),并在室温下孵育30分钟。通过将TRIS-HCL添加到最终浓度为20 mm ,从而淬灭固定。将固定的核在4°C下以500克固定5分钟 。除去上清液,并将沉淀重悬于0.67卷中。洗涤缓冲液(250毫米蔗糖,25 mM KCl ,5 mM MGCL2,10 mM Tris-HCl pH 8,1%BSA和新鲜添加1 µM DTT ,0.4 U µl-1 RNase抑制剂,0.2 U µL-1超级蛋白酶)。在4°C下以500克离心5分钟 。除去上清液,然后将沉淀重悬于0.5卷中。PBS。然后使用40μm流量过滤器(Sigma)拧紧核 。为了估计核浓度 ,添加了Hoechst DNA染料 ,并使用Countess II FL自动细胞计数器(Thermofischer Scientific)对核进行计数。   对于鸭嘴兽和鸡肉,使用了类似的制备方法,但鉴于该方案为这些物种带来了最佳结果(固定方案未能产生足够质量的数据) ,但没有固定核。简而言之,在100-150 µl mg-1的预裂解缓冲液(250毫米蔗糖,25 mm kcl ,5 mm mgcl2,10 mm tris-hcl pH 8,1%bsa ,1%bsa,1%bsa,0.1%igepal ,0.1%igepal且新鲜添加1 µm dttttt,0.4 ul-dttt,0.4 ul-dttt ,0.4 ul-dtttt ,0.4 ul-1%r-ll-1 µm ll-1%ll-ll-1 µl-1%ll-1%ll-1%r-ll-1 µm ll-superasin),在冰上裂解5分钟 。将裂解物在4°C下以100克离心1分钟。将上清液转移到新的反应管中,并在4°C下以500克离心5分钟。除去上清液 ,并将沉淀重悬于0.67卷中 。洗涤缓冲液 。在4°C下以500克离心5分钟。除去上清液,然后将沉淀重悬于0.5卷中。PBS 。然后使用40μm流量过滤器(Sigma)将核应布。为了估计核浓度,添加了Hoechst DNA染料 ,并使用Countess II FL自动细胞计数器(Thermofischer Scientific)对核进行计数。   为了构建SnRNA-Seq库,根据制造商的指示,使用了铬单细胞3'试剂盒(10x基因组; V.2 V.2化学化学化学化学化学化学化学套件 ,Bonebon,Gorilla,Gorilla ,Gorilla,Gibbon,Gibbon ,Macaque ,Marmoset,Mouse和opossum; V.3 Platypus和Chicken for Platypus and Chicken)的化学 。然后在铬微流体芯片中加载15,000至20,000个核,并在12个PCR周期中扩增互补的DNA。根据制造商的说明 ,使用NextSeq 500/550高输出套件v.2.5(75个周期)和配对的测序(读取1 26 bp的读取长度,读取2 57 bp; Index1 8 bp,大约170至380亿读物读取v.2 read 2 28 BP ,读取v.2 read 2 28 bp read 28 bp read 2 28;56 bp索引1 8 bp,每个库的v.3化学库约为247至3.06亿读)(补充表2)。   对于大量RNA-Seq数据生成,使用RNeasy Micro Kit(Qiagen)提取RNA 。将组织在补充40 mM DTT的RLT缓冲液中匀浆。如参考文献中所述 ,使用Truseq绞合的Messenger RNA LT样品准备试剂盒(Illumina)构建RNA-Seq库。2 。图书馆在Illumina NextSeq550上使用单端运行(read1 159 bp; Index1 7 bp)进行了测序,每个库读数约为24-60万次(补充表2)。   鉴于基因组注释的质量在研究物种之间有很大不同,并且鉴于睾丸中基因组的特异性和广泛转录 ,我们根据睾丸RNA-seq数据对ENSEMBL53进行了完善并扩展了先前的注释。具体而言,类似于参考文献中描述的过程 。2,6, we used previous extensive stranded poly(A)-selected RNA-seq datasets2,54 (100 nt, single-end) for human, macaque, mouse, opossum, platypus and chicken, and generated and used stranded poly(A)-selected RNA-seq datasets (159 nt, single-end) for chimpanzee, gorilla, gibbon and marmoset.对于每种物种,我们从Ensembl发行87(参考53)中下载了参考基因组:HG38(Human) ,Chimp2.1.4(Chimpanzee) ,Rhemac8(Rhesus Macaque),C_JACCHUS3.2.1(MARMOSET)(MARMOSET),MM10(MM10) ,MM10(MMM10(MOYS),MONDOM5(MONDOM5),Mondom5(Mondom5)和Galglgal5(chalgal5(Chargal5)(Charger5);摘自Ensembl版本96(参考55):Gorgor4(Gorilla)和Nleu_3.0(Gibbon);并从Ensembl版本100(参考文献56):Mornana1.P.V1(Platypus) 。Raw reads were first trimmed with cutadapt v.1.8.3 (ref. 57) to remove adapter sequences and low-quality (Phred score <20) nucleotides, then reads shorter than 50 nt were filtered out (parameters: --adapter=AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC --match-read-wildcards --minimum-length=50 -q 20).Processed reads were then mapped to the reference transcriptome and genome using Tophat2 v.2.1.1 (ref. 58) (parameters: --bowtie1 --read-mismatches 6 --read-gap-length 6 --read-edit-dist 6 --read-realign-edit-dist 0 --segment-length 50 --min-intron-length 50 --library-type fr-firststrand --max-insertion-length 6- 最大删除长度6)。接下来 ,我们组装了使用StringTie v.1.3.3(参考59)(参数:-f 0.1 -m 200 -m 200 -a 10 -J 3 -C 3 -C 0.1 -V -v -g 10 -m 0.5)表示的转录本模型。对支持连接点(-j 3)的读数数量的严格要求,将被视为新的成绩单(-g 10)的比对之间的最小差距和多命中式读取的分数(-m 0.5) 用于避免合并独立的转录本,并减少由未剪接或不完全剪接的转录本引起的噪声 。我们使用CuffCompare程序v.2.2.1.1.2.2.1从Cufflinks Package60进行了比较组装的成绩单模型与相应的参考ENMBL注释。最后 ,我们将新鉴定的成绩单与相应的Ensembl基因注释相结合到单个GTF文件中。我们将原始的Ensembl注释延伸到2-61 MBP,并使用新的成绩单和23-49 MBP扩展了新的剪接同工型(补充表1) 。   Cellranger v.3.0.2用于鸭嘴兽和鸡肉,其他物种的Cellranger v.2.1.1与使用的铬化学一致。CellRanger MKREF功能与默认设置一起使用 ,以从基因组序列和自定义的扩展注释文件中构建每个物种的参考(补充表1)。鉴于前MRNA转录本在Nuclei61中很丰富,因此外显子和内含子特征被串联,如CellRanger v.2.1.1中所述 ,用于考虑基因表达定量的内含子和外显子读 。CellRanger计数函数与默认设置一起使用 ,以纠正用于测序误差的液滴条形码,对齐与基因组读取并计算每个基因和条形码组合的UMIS数量。   我们使用了一种合并的方法来检测可用的核。与整个细胞相比,这是为了最佳地解释核的较低RNA含量 。具体而言 ,为了识别可用的核,我们使用了一种基于膝关点的方法,结合了内含子读取的比例 ,作为前MRNA转录物的标志物(核中丰富)(补充图1F)和Malat1(核富集的长期非编码(LNC)RNA)表达了核的标记(当时是基因组成的核)。   对于每个样品,独立选择高质量的核,根据UMIS数量和线粒体RNA的百分比去除异常值(补充图1B ,C,E)。我们使用seurat r软件包v.3.1.4从子集的RAW UMI计数表中创建了一个seurat62对象,由CellRanger生成的cellranger生成的表对应于与上游确定的可用液滴相对应 ,使用归一化函数将数据归一化,并使用FindVariable Facte and actaled function function function function function,使用标准性函数确定了最高的10,000个大多数变量的函数 ,该函数是尺寸的 ,该函数的function,carnepaus function car runa函数,表演了尺寸的功能 ,使用Findneighbors(参数dim = 1:20)和FindClusters(DIMS = 1:20,分辨率= 0.5)功能的聚类 。为了最佳地说明睾丸细胞类型具有多种转录组特征11,我们独立地过滤了每个群集的离群液滴 ,其值低于第一个四分位数(Q1)-1.5×IQR(零件间范围),并且高于第三码(Q3)+1.5×IQR,以供umi Contration和fractian fratial rataild rate ratian rate rate rate rate 。然后 ,我们使用doubletfinder_v3 DoubleTfinder63 v.2.0.1的功能删除了潜在的双重组(参数PCS = 1:20,PN = 0.25,NEXP = 5%的单元格总数 ,使用paramsweep_v3识别PK,Summarize -Weep -Weep和Find.pk功能)。   从先前过滤的UMI计数表中,我们独立为每个样本创建了Seurat对象 ,将数据归一化 ,并确定了前10,000个最可变的基因。接下来,对于每个物种,我们使用find Integrationanchors和集成的函数与20个主要组件进行了Seurat62锚定方法 ,以将所有数据集集成到单个Seurat对象中,以纠正批处理效应 。对于每个集成物种特异性的Seurat对象,我们对(标准化函数)进行了归一化并缩放数据(ScalEdata函数)并执行了PCA(RUNPCA函数)。Louvain clusters were calculated using FindNeighbors and FindClusters functions (parameters dims = 1:20, 1:20, 1:20, 1:20, 1:20, 1:20, 1:20, 1:17, 1:8, 1:10 and 1:10, and resolution = 0.5, 0.5, 0.2, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.3 and 0.5, respectively, for human,黑猩猩 ,Bonobo,Gorilla,Gibbon ,Macaque,Marmoset,Mouse ,opossum,Platypus和Chicken)。The uniform manifold approximation and projection (UMAP) embedding coordinates were calculated using the RunUMAP function (parameters dims = 1:20, 1:20, 1:20, 1:20, 1:20, 1:20, 1:20, 1:17, 1:10, 1:10 and 1:10, and min_dist = 0.3, 0.3, 0.1, 0.1, 0.3, 0.3, 0.3, 0.1, 0.2, 0.3分别为人类,黑猩猩 ,Bonobo ,Gorilla,Gibbon,Macaque ,Marmoset,Mouse,Mouse ,opossum,Platypus和Chicken)分别为0.6 。我们注意到,与生物学重复之间的高相关性(补充图5a ,b)相吻合 - 数据已经在批次校正之前就已经整合了(补充图18c,d)。我们还注意到,关键标记基因在使用集成对象坐标(补充图18E)中评估其在不同重复的表达中时在相同的集成区域中表达 ,这支持了集成是正确的。   使用Liger64(V.0.5.0)集成工具合并了所有灵长类动物数据集 。使用基于灵长类动物1:1的createleiger函数从Ensembl版本87创建了Liger对象,并使用默认设置为标准化,SelectGenes和ScalEnotCenter函数进行了归一化。然后 ,使用优化函数(k = 20)对接头矩阵进行分级 ,并使用ventile_norm和默认设置进行分位数归一化。使用LouvainCluster函数和默认设置以及使用RunuMap函数的UMAP坐标来计算Louvain群集(N_NEIGHBORS = 100,min_dist = 0.2) 。   使用seurat r封装及其归一化功能将每个细胞的基因UMI计数标准化。因此,每个细胞中每个基因的UMI计数除以每个细胞的总UMI计数 ,乘以10,000并转换对数。   我们使用已知的标记基因65,66独立于人类和小鼠及其各自的其他物种中的1:1直系同源物,从灵长类动物综合,小鼠 ,负鼠,鸭嘴兽和鸡肉物体中鉴定出主要细胞类型的主要细胞类型种群 。Clu标记了Sertoli细胞;tagln和acta2周围和平滑肌细胞;CD34和TM4SF1内皮细胞;APOE和CD74巨噬细胞;星和CYP11A1 Leydig细胞;GFRA1,PIWIL4(未分化) ,DMRT1(区分)和Stra8 SG;Syce1(Leptotene),Sycp1(Zygotene),Piwil1(Pachytene) ,Sycp2,Tank和Aurka SC;LRRIQ1(早期),ACRV1和SPACA1(晚)RSD;SPATA3 ,NRBP1 ,PRM1和GABBR2 ESD 。通过互补分析和指标(例如UMAP坐标,伪段轨迹,转录活动(UMI计数)和先前的知识) ,可以强化细胞类型的分配。   使用Slingshot V.1.2.0 R Package67计算伪轨迹。我们使用上游计算的簇和UMAP嵌入生殖单元的坐标应用了Getlineages函数,使用最小跨越树来获得相邻簇之间的连接 。我们根据先前的细胞类型分配提供了启动和结束簇,并具有已知的标记基因表达。然后 ,我们将GetCurves函数应用于获得的谱系,以构建平滑曲线并沿假期轨迹订购细胞。伪频率值取决于使用的工具,因此我们根据其假频率值订购了单元格 ,并将其等级除以单元格的总数,以在0到1之间获得均匀分布的值 。最后,我们验证了根据先前的细胞分配模式 ,表达式模式,标记基因和Umap emped suding sugition和Umap emped suding seforce and emped seffers and emped anding pseudotime轨迹。   为了准确地识别沿精子发生的标记基因,我们将生殖细胞分成20个沿伪段轨迹的20个均匀分布的垃圾箱。然后 ,我们从seurat62 r软件包(仅参数= t ,min.pct = 0.25,logfc.threshold = 0.25,return.thresh = 0.05)中应用了Findallmarkers函数 。3.1.4r to to 22组(20个生殖器组 ,Sertoli和其他躯体数据组)(均匀的数据图)(4.3.1.4 r。   系统发育树和指示的分歧时间(图1A和4A)基于Timetree68(v.5)(http://www.timetree.org/)。   在我们的研究中,我们使用了四个不同的直系基因:(1)涉及所有11种羊膜种类的比较分析,使用4,498 1:1直系同源基因表达的(即 ,在所有细胞类型的至少三个细胞中)(总共8,045 1:1:1:1或Thologiuse)进行了表达(至少三个细胞中的一个UMI) 。(2)使用在所有灵长类动物物种中表达的8,451 1:1直系同源物基因(在11,948 1:1直系同源物中)进行了涉及七个灵长类动物的比较分析。(3)比较Sertoli-Germ细胞通信分析基于其他物种中的35,186个人类睾丸表达的基因至1:1直系同源基因(猕猴13,090;鼠标14,302;鼠标14,302;负鼠10,865和鸡肉10,515)。(4)使用给定物种中表达的所有基因进行特异性分析(每种细胞类型约15,000个基因;补充图1D) 。使用BiomArt R软件包v.2.40.5从ENSEMBL53中提取了直系同源基因集 。   使用Seurat R套件的平均表达函数以及各种细胞的平均表达函数,这取决于研究中产生的伪泡样品。对于图1B中显示的分析,我们基于4,498 1:1羊膜直系同源物 ,在羊膜睾丸细胞类型(伪型)中进行了归一化表达的PCA。使用STATS R软件包的PRCOMP函数进行PCA 。对于图1c,我们使用邻居加入方法构建了基因表达树(如参考文献1所述),基于对相应的伪泡样品之间的成对表达距离矩阵 ,用于跨物种的不同细胞类型。样品之间的距离计算为1 -ρ,其中ρ是Spearman的相关系数,并使用STATS R软件包的COR函数计算。使用APE R软件包v.5.3构建了邻居的树木 。通过自举分析评估分支模式的可靠性(4,498 1:1羊膜直系同源物被随机采样1000次)。自举值是复制树的比例 ,它们共享图中所示的多数规定共识树的分支模式(图1C和扩展数据图2A)。通过消除个体之间的种类内变异性来计算总树长度(图2A) 。   In Fig. 2c, we plotted the median pLI score69 across expressed genes (1 UMI) in each nucleus. We obtained the pLI scores from ref. 70. For Fig. 2d, we used a set of neutrally ascertained knockouts consisting in 4,742 protein-coding genes, 1,139 of which are classified as lethal. For each cell, the denominator is the number of genes expressed that were tested for lethality and the numerator the genes among those that resulted in a lethal phenotype. Tested genes for viability and associated phenotype information were downloaded from the International Mouse Phenotyping Consortium25. For Fig. 2e (and Extended Data Fig. 3a), we used the average dN/dS values across 1:1 orthologues in primates. For each cell, the mean dN/dS value is plotted. Conserved 1:1 orthologues across six primates (human, chimpanzee, gorilla, gibbon, macaque and marmoset) as well as their coding and protein sequences were extracted from Ensembl53, providing a set of 11,791 protein-coding genes. For each species and orthologue the longest transcript was extracted. Orthologous protein sequences were aligned using clustalo v.1.2.4; then pal2nal v14 was used (with protein sequences alignments and coding sequences as input) to produce codon-based alignments. The codeml software from the PAML package71 v.4.9 was used to estimate dN/dS ratios. The M0 site model was applied to the orthologue alignments to estimate one average dN/dS ratio per orthologous gene set across species (parameter NSites = 0, model = 0). In Fig. 2f (and Extended Data Fig. 3b), we plotted the percentage of positively selected genes expressed across nuclei. For each nucleus, the denominator is the number of expressed genes that were tested for signatures of positive selection, and the numerator is the number of genes among those with evidence for positive selection. We used sets of genes previously identified as carrying evidence for coding-sequence adaptation in primates72 (331 positively selected genes out of 11,170 genes tested) 和哺乳动物73(在16,419个基因中 ,有544个正面选择的基因)。   在图2G(和扩展数据图3C)中,我们绘制了跨体细胞和生殖细胞表达基因的平均系统发育年龄。基因的系统发育时代是一个指数,可为年轻的新基因提供更大的重量(如参考文献2,74所述) 。根据可用的外部谱系数量(在系统发育中允许更多细节允许更多谱系) ,分数的范围有所不同,因此不能在物种(即跨细胞和细胞类型中)进行比较。基因的系统发育年龄是从Gentree(http://gentree.ioz.ac.cn/)中获得的,并以Ensembl释放69(参考文献74)获得。在图2H(和扩展数据图3D)中 ,我们绘制了源自蛋白质编码基因和基因间元素的细胞转录的百分比 。基因生物型是从Ensembl获得的 。基因间元素是所有不是蛋白质编码基因(LNCRNA,假基因,假基因和其他序列)的元素。在图2i(图3E和扩展数据)中 ,使用在转录组(ETR)和翻译组(ETL)层上重复的归一化log2转换的中值表达值来计算Testis中RNA-SEQ和RIBO-SEQ的testis中所述的6)(如testis中所述)计算翻译效率(TE = log2(etr) - log2(etl))。翻译效率值是在整个睾丸水平上计算的,因此仅使用细胞类型的特异性基因(其在整个睾丸水平上的60%的转录本都集中在单细胞类型中) 。较高的值显示了转录本的更有效翻译,而较低的值表示相对翻译抑制。对于图2J(和扩展数据图3F ,G),我们使用了睾丸中体细胞和生殖细胞中表达基因的时间和组织特异性指数。如参考文献中所述 。2,组织和时间特异性指数是根据跨器官和发育阶段的RNA-seq数据计算得出的。这两个索引范围从0(宽表达)到1(限制表达)。这些索引是从参考文献中获得的 。2。对于每个核 ,我们绘制了跨表达基因的中位数指数。在图2K中 ,我们绘制了击倒时引起不育的基因的百分比(在3,252个敲除中,其中173个引起了不育症) 。从国际鼠标表型联盟数据库中下载了经过不育和相关表型信息的基因。对于每个核,分母对应于表达的基因数量 ,这些基因数量经过不育测试和分子与导致不育表型的基因中的基因相对应。   我们使用人类,黑猩猩,Bonobo ,Gorilla,Gorilla,Gibbon ,Macaque和Marmoset(基于Ensembl 87 - 正交原理)以及使用人类(作为灵长类动物的代表),小鼠,负责人 ,Platypus和Chicky(基于Ensem or Thologue)比较了基因表达轨迹跨灵长类动物发生的精子发生 。为了比较强劲表达的基因,我们使用了在所有被考虑的物种中至少一个簇中至少一个细胞中表达的基因 。我们使用了一种无监督的软聚类方法(v.2.44.0)(v.2.44.0),用于沿着dmin和混美功能的物种的精子发生(灵长类动物中的八种细胞类型;羊膜中的八种细胞类型)沿着基因表达轨迹进行聚类 ,以估计分子的数量和fuzzification commitearification参数(补充图2)。如参考文献中所述。2 ,我们在系统发育框架内推断出沿着精子发生的轨迹发生变化的概率,即,基因使用5%的概率截止 ,基因改变了在特定分支中的群集分配 。   我们计算了每种1:1直系同源基因集的物种跨物种的全局轨迹保护评分。对于给定的直系同源基因集,该分数对应于对数转换的概率,所有成员均属于相同的MFUZZ轨迹群集AS:   where g corresponds to a given orthologous gene set, c to all mfuzz trajectory clusters (1–9 for primates, 1–12 for amniotes), s to all species (human, chimpanzee, bonobo, gorilla, gibbon, macaque and marmoset for primates; human, mouse, opossum, platypus and chicken for amniotes) and Pg,i,j to the probability that thej的基因g落入群集i。较高的保护评分表明全球轨迹保护更大 。作为概念的证明 ,我们绘制了保守和变化的轨迹的轨迹保护评分,该评分显示了保守轨迹的较高保护评分(扩展数据图5A)。   将新鲜睾丸组织固定在GR固定(7.4%甲醛,4%乙酸 ,2%甲醇,0.57%磷酸钠,二比硫酸钠和0.11%磷酸钾 ,单基质)中过夜(至少在4°C下为16小时),在4°C下,脱水和胚胎。根据制造商的建议(高级细胞诊断) ,使用RNASCOPE 2.5 HD检测试剂红色试剂盒(根据Advance Cell诊断) ,在安装在SuperFrost Plus载玻片(Thermofisher Scientific)上的4μM部分上进行原位杂交实验 。简而言之,将睾丸组织切片在二甲苯中脱离,并在100%乙醇中洗涤 ,然后用过氧化氢处理10分钟。使用蒸锅进行目标检索15或30分钟(有关每个探针和物种的规格,请参见补充表6),然后在40°C下用蛋白酶加上30分钟的处理。将载玻片与目标探针(补充表6)在40°C杂交2小时 ,然后进行一系列信号放大(扩增约50或60分钟) 。这些部分用Mayer的血久毒素染色,并用Vectamount永久安装培养基(矢量实验室)安装。阴性对照探针DAPB(细菌RNA)与靶探针并行运行,并在每个部分显示≤5%的阳性细胞。   对于Adamts17和Myo3b ,计数了阳性(即带有红点)RSD和SG 。对于每个部分(人n = 3,黑猩猩n = 1,猩猩n = 1) ,使用NDP.Viewplus软件(Hamamatsu Photonics)计数十个小管 。两个独立的观察者(S.B.W.和K.A.)计算了阳性和负RSD和SG。没有对点的强度或每个单元的点数进行区分。基于小管中的核形态和定位进行细胞类型鉴定 。仅计数小管边缘的SG(补充图3A)。发现RSD和SG的观察者间方差分别为7%和9%。对于RubCNL,使用CountColors76(V.0.9.1)和Colordistance77(V.1.1.1)软件包对染色强度进行量化 。对于每个部分(人n = 3,黑猩猩n = 1 ,猩猩n = 1) ,将十个小管分为三个部分:由SG主导的区域,由SC(也包含Sertoli细胞)主导的区域(也包含Sertoli细胞)和由精子主导的区域(在不同类型的精子之间没有相同的精子)(Appermatid)(补充)(补充图3B)。在每个管状区域,使用NDP.View2Plus软件(v.2.8.24)手动计数细胞数量。然后 ,量化了红色染色所占据的像素,并通过将染色像素除以细胞数来计算每个细胞类型的表达水平 。对于每张图片,每种细胞类型的染色像素通过染色像素的总量进行标准化。   使用Limma R Package的Goana函数v.3.40.6(默认参数)鉴定了对具有保守和差异表达轨迹基因基因基因分析的富集术语。   我们使用CellphonedB78(V.2)方法和推荐参数设置(参数方法统计统计_analysis) ,分别确定了针对人,猕猴,小鼠 ,负鼠和鸡的Sertoli-Germ细胞通信的配体 - 受体相互作用 。将使用人体配体 - 受体相互作用数据库的细胞传感器应用于其他物种的数据,我们将人类睾丸表达的基因映射到了每个物种中的相应的1:1直系同源物。两种细胞类型之间的富集受体 - 配体相互作用是根据一种细胞类型的受体表达和另一种细胞类型的配体来预测的。仅考虑在每个细胞类型中超过10%的细胞中表达的受体和配体,以进行数据集中所有细胞类型之间的成对比较 。CellphonedB使用经验改组来计算哪种配体 - 受体对显示出显着(P <0.05)细胞类型特异性78 。使用r套件Issingr(V.1.4.0)说明了各种物种之间的显着相互作用。最后 ,鉴于细胞传播和类似方法的潜在假阳性(和阴性)预测79,我们考虑对几种物种进行预测的相互作用,并且可能反映了进化保护(扩展数据图8和补充表9) ,例如主文本中报道的相互作用 ,比物种特异性预测更可靠。   睾丸特异性基因是从先前生成的成年器官的RNA-seq数据获得的(睾丸中的RPKM 1,小脑,心脏 ,心脏,肾脏和肝脏中的RPKM <1) 。其中,研究了每个染色体的细胞型特异性基因。使用FindAllmarkers函数(仅参数= true ,min.pct = 0.05,logfc.threshold = 0.25,return.thres.thres.thresh = 0.05) ,使用FindAllmarker函数鉴定了特定体细胞类型中主要表达的基因。基因在特定生殖细胞类型中的主要表达是根据轨迹分析(上)分配的 。也就是说,主要表达是基于细胞类型分配的,在轨迹分析中 ,基因峰的表达水平。然后,我们首先计算了基因组中所有基因中给定染色体上的基因的百分比(扩展数据中的图x轴图9a,c; c;在图4B中的X连锁基因的红色水平线)。然后 ,我们将其与给定细胞类型中主要表达的睾丸特异性基因的百分比进行了对比(扩展数据中图9a ,c; y轴的图4b中的图4b中的c; y轴) 。最后,使用精确的二项式测试将每种细胞类型的睾丸特异性基因和染色体的睾丸特异性基因的百分比与基因组中的每个染色体的百分比进行了比较。   Y染色体具有较少的基因,并且在某些基因组组件中缺少。因此 ,我们专注于精子中X转录本的分数,以将其分类为X-或Y含X或Y的细胞 。为此,我们使用MixTools(V.1.2.0)R Package的函数normalMixem ,将每个重复的两个组件(双峰分布)独立地拟合了两个组件(双峰分布)的数据。使用95%的置信区间,使用了两个获得的正常分布来对X-(较高水平的X转录物)和b-Barearing(较低水平的X转录本)进行分类。异常值和重叠单元均未分配到任何一个类别 。最后,我们检查了含y的精子中Y转录本的分数明显更高(图4C) 。除了先前鉴定的高度可变基因以执行与UMAP坐标计算相关的PCA外 ,还使用X和Y连锁基因获得分叉UMAP(图4C)。对于鸭嘴兽,X转录本根据其在X染色体上的位置进行分离(即分别是PARS和SDR,如先前的研究46所述)。在使用的鸭嘴兽基因组组件中 ,X和Y Pars均分配给X染色体 。因此,报道的X转录本可能源于X SDR,X PARS或Y PARS ,而报道的Y转录本仅源自Y SDR。图4A中人类和鸭嘴兽性染色体的插图(及其各自的PARS/SDR)基于以前的工作46,80。   我们使用seurat62 r软件包(参数 ,默认值)的Findmarkers函数鉴定了X-和Y-Spermatid群体之间差异表达的基因 。使用Bonferroni校正进行多个测试,使用Wilcoxon cank-sum测试计算P值。仅测试了两个人群中至少10%的细胞中检测到的基因。在其中一个人群中,平均显示至少表达至少0.25倍的基因(log2级) ,同时以该人群的两倍表示,并且在该人群中的两倍,并且调整后的P值低于0.01 ,被认为是差异表达的 。我们注意到,几个差异表达的基因,包括人类中最重要的病例(图11a)是推测的非编码 ,这是值得注意的,因为LNCRNA通常是核81,因此 ,它们的差异表达水平不太可能被通过细胞通过胞质铜之间的小细胞之间的转录物交换所抵消。最Y-Spermatid特异性的三个转录本是从染色体13(FAM230C)上的同源低复制重复序列(即节段性重复)发出的,21(XLOC-095504)和22(FAM230F)通过触发非平行性药物构造而引起的基因组疾病。其中包括Q11.2染色体22(22q11.2)上的低复制重复区域中的FAM230F LNCRNA,该区域特别容易受到非平行性同源重组产生的缺失 ,这些缺失导致各种先天性畸形疾病 ,包括Digeorge综合征,包括最常见的微骨骼障碍疾病82 。   为了鉴定潜在的MSCI ESCAPEE基因,我们筛选了X连锁基因 ,从SG​​到SC阶段的转录丰度显着增加,这确保了MSCI的前期基因,这确保了潜在的逃生基因确实在SC中积极转录(也就是说 ,它们在SG中不仅在SC中表达的SC中仍然可以检测到SC的稳定转录中,还可以在SC中检测到先前的稳定转录)。具体而言,我们使用seurat62 r软件包(参数 ,默认值)的Findmarkers函数鉴定了SC和SG之间的差异表达基因。使用Wilcoxon秩和测试来计算P值,然后使用Bonferroni校正进行多个测试对其进行调整 。仅测试了在两个细胞类型群体中的任何一个中至少10%的细胞中检测到的基因 。平均显示两组之间至少显示至少0.25倍的表达差(LOGE尺度),而调整后的P值低于0.05被认为是差异表达的。在SC中表达明显高于SG的SDR中的X连锁基因被认为是潜在的逃生(扩展数据图12c)。   除非另有说明 ,否则所有统计分析和图均在R v.3.6.2(参考文献83)中进行 。使用GGPLOT2 V.3.2.1,Tidyverse V.1.3.0,Dplyr V.0.8.5 ,Cowplot V.1.0.0和PheatMap V.1.0.12创建图。   有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

本文来自作者[admin]投稿,不代表象功馆立场,如若转载,请注明出处:https://wap.xianggongguan.cn/xgzx/202506-888.html

(22)
admin的头像admin签约作者

文章推荐

发表回复

作者才能评论

评论列表(3条)

  • admin的头像
    admin 2025年06月19日

    我是象功馆的签约作者“admin”

  • admin
    admin 2025年06月19日

    本文概览:  没有使用统计方法来预先确定样本量。实验不是随机的,研究人员在实验和结果评估过程中并未对分配视而不见。   我们生成了来自人类(Homo Sapiens),黑猩猩(Pa...

  • admin
    用户061903 2025年06月19日

    文章不错《跨哺乳动物的精子发生的分子进化》内容很有帮助

联系我们

邮件:象功馆@gmail.com

工作时间:周一至周五,9:30-17:30,节假日休息

关注微信