古老的基因组揭示了美洲毛毛虫的深刻历史

  放射性碳年代在Curt-Engelhorn考古中心(德国曼海姆)进行 。使用超过滤胶原蛋白(分数> 30KD)处理骨骼碎片,并使用Klaus-tschira-Arch;用实验室代码MAMS报告了放射性碳日期 。   放射性碳和稳定的同位素测量是在秘鲁Jucusbamba(JUC013)的遗体上进行的 ,智利南部的Chonos群岛(GAP009)和阿根廷的DeánFunes(DFU001)。   在校准之前 ,对潜在的海洋储层偏移的个体提取的胶原蛋白提取的胶原蛋白进行了稳定的同位素测量,这可能会导致比当代人年龄大的放射性碳年龄,该年龄较大 ,该年龄是消耗完全基于陆地的饮食的当代人。数据是从用于放射性碳日期的胶原提取物(德国曼海姆,实验室代码MA)中生成的,并通过分析在德国Jena的Max Planck GeoNthrolopology生成的相同骨骼的第二个胶原蛋白提取物(实验室代码Jena) 。在后一个过程中 ,将1 mg的骨胶原蛋白在锡胶囊中重复,并在Thermo Scientific Flash 2000元素分析仪中燃烧,并在Max Geoanantopology的Max Planck Institute位于Max Planck Institute的Thermo Delta V优势质谱仪。同位素值报告为重量同位素与较轻同位素(13C/12C或15N/14N)的比率为δ值 ,相对于国际标准(Vienna Peedee Belemnite(VPDB))(δ13C和Δ13C和大气N2(Air)Δ15N)的δ值(VIENNA PEEDEE BELEMNITE(VPDB))。根据国际标准(国际原子能局(IAEA)-CH-6:Δ13C= -10.80±0.47‰,IAEA-N-2:Δ15N= 20.3±0.2‰,USGS40:Δ13C= -26.38±0.042±0.5N = 4.5N = 4.5N = 4.5N = 4.40 = 4.40 = 4.5N = 4. 5n = 4.5N = 4. 40 = 4.40 = 4.40 = 4.40 = 4.40 ,(鱼类明胶:Δ13C≈ -15.1‰,Δ15n≈14.3‰) 。基于重复分析,一年内的长期机器误差为Δ13C的±0.2‰ ,Δ15N的机器误差为±0.2‰。通过测量鱼类明胶的重复序列研究了总体测量精度(Δ13C的n = 80 ,±0.2‰,Δ15N的±0.2‰)。同位素数据在补充表2中报告 。所有样品均符合质量控制条件57,58,C/N比在2.9-3.6之间 ,%C为15-48%,而5-17%的%n。   来自Jucusbamba(JUC013)的个体具有稳定的同位素,表明完全基于陆地的C4饮食 ,因此不考虑海洋偏移。相比之下,来自Chonos群岛(GAP009)的个人具有与C4和海洋饮食输入(-10.5‰)一致的Δ13C值,但δ15N值指向饮食中高海洋成分(+18.2‰) 。智利以C3植物为主59 ,因此,饮食中海洋蛋白的高输入可能导致稳定同位素的转移。有趣的是,该个体的δ13C值比来自该地区的高营养水平的海洋食肉动物显示出更多的富集 ,例如Yesner等人总结的Tierra del Fuego的海狮数据。60 。对于DeánFuees的个人(DFU001),仅在AMS上测量的Δ13C可用,这缺乏饮食矫正所需的精度 。无论如何 ,该地点位于距离海岸600公里以上 ,因此海洋饮食成分被认为是极不可能的。   必须采用建模方法来说明单个GAP009中相关的放射性碳的偏移。由于缺乏与解释该个体的解释直接相关的同位素数据(例如,对同一地点的动物样品进行的测量)进行了文献搜索,以近似于全层和海洋饮食的预期δ13C和δ15N值的范围 。陆生饮食的Δ13C范围估计为-22.5至-19.5‰ ,海洋饮食的Δ13C范围为-16至-16至-12‰,而Δ15N分别设置为 +7-11‰和 +14-22‰。这些范围是从Tierra del Fuego的考古动物学数据估计,并总结了Yesner等人60 ,以及来自马(Equus andium)和Llama(Hemiauchenia paradoxa)的晚更新世稳定的同位素数据,来自西北Chilean Patagoniaia61。遵循线性插值方法62,63进行日期校正,Δ13C末端成员为-20和-12‰(分别为100%陆地和海洋)和+10和 +22‰(分别为100%陆地和海洋)的δ15N末端成员 。使用两种同位素进行插值进行插值 ,以检查对该校正的总体敏感性。这尤其重要,因为(1)没有关于相关的动物材料的同位素数据,可以产生时间和空间相关的生物利用基线;(2)Δ13C值富集了完全由海洋蛋白组成的饮食的预期。当使用Δ13C和Δ15N值时 ,建模的结果估计了100%或85%的海洋饮食 。   由于所有三个人(GAP009,JUC013和DFU001)都居住在南半球,因此使用Oxcal V4.451的Hogg et al.52的SHCAL20校准曲线将放射性碳结果校准为日历量表。   Jucusbamba ,秘鲁位于受热带收敛区(ITCZ)的西部 ,这是Marsh等人指示的混合区。64 。因此,在北半球Intcal2053和SHCAL20之间使用50/50的混合物进行了第二次校准,其1σ误差为25% ,作为混合校准的相对模糊的近似值,因此可以评估效果。   没有ITCZ混合的建模,校准日期为双峰 ,范围为1308–1363(73.7%的概率)和1380-1399(21.7%的概率)。建模的校准也是双峰的,稍早,范围为1296–1328(40.0%的概率)和1342–1394(55.5%的概率) 。   对于来自智利的Chonos群岛的个人 ,这两个校准分别以85±10%和100±10%的形式将SHCAL20和Marine20校准曲线混合在一起 。Marine20还具有-93±30年的局部ΔR校正,这是Calib.org Marine20数据库(http://calib.org/marine/)中八个最接近点的加权平均值。85%的建模校正校正为1226–1451(95.4%的概率),100%建模校正校准校准为1255-1483(95.4%的概率)。   最后 ,DeánFunes很好地在Marsh等人指定的区域内,因为需要使用SHCAL20进行校准 。因此,不需要建模或其他校正 ,因此仅使用SHCAL20进行校准。该人死于1226–1281(概率95.4%)。   以上的其他数值数据可以在补充表2中找到 。建模日期如图1G所示。   在Max Planck进化人类学研究所的古老DNA洁净室设施中进行了考古组织的处理。用低旋转和高扭矩以牙齿钻的牙齿产生了骨骼粉碎的材料 。对于JUC013的未成熟摩尔 ,通过未连续的根部进入皇冠,将粉末钻入粉末,以生成两个约50 mg的等分试样 ,以进行牙本质以提取。在现场(由D.A.R.,R.B。和T.V.H.)进行了阿根廷和智利组织的子采样,随后在洁净室设施中处理了材料 。智利的生物材料收集包括软组织 ,这些软组织直接溶解在蛋白激酶消化缓冲液中。对于单个GAP009,具体来说,在下有骨病变的部位和与病变相邻的位置获得了粉末。单个MXV001在表现出与treponemal感染一致的位置的多个骨骼元素上进行采样 。在显示病变的枕骨和左股骨的远端隔膜上对单个RAZ007进行采样 。最后 ,从左叶峰中采样了单个DFU001,其中观察到可归因于非特异性感染的病变。用基于二氧化硅的方法提取DNA,以优化用于恢复短DNA片段65。简而言之 ,通过在2.0-mL eppendorf lo-bind Tubes 65,66中加入1-1.8 ml提取缓冲液(0.45 m EDTA,pH 8.0,0.25 mg ML-1蛋白酶K ,0.05%Tween-20) ,并在37°C下旋转37°C的管道 。对于GAP009,DFU001和RAZ007此裂解物直接用于图书馆准备。对于MXV001粉末和JUC013,裂解液进一步纯化并集中在二氧化硅65上。用10 µL提取28的JUC013手动生成双链DNA库 , 后来产生了shot弹枪筛选库JUC013.A0101 。使用30 µL提取物为MXV001 DNA分离株制造了部分UDG处理的文库。通过Rohland等人66中所述,通过具有自动化液体处理系统(Bravo ngs Workstation B,Agilent Technologies)的自动液体处理系统(Bravo ngs Workstation B ,Agilent Technologies)纯化了来自两种GAP009的消化物的150μl-aliquots的裂解物。66 。洗脱体积为30 µL。RAZ007,DFU001和GAP009裂解物的单链库(GAP009.A0101)以及与之相邻的区域(GAP009.A0201),以及随后的库 ,以及30 µL JUC013提取物(JUC013.0102)的30 µL(JUC013.0102)和其他粉末(JUC01112)(JUC0113);通过自动化制造。使用自动版本的单链DNA库制剂制备制备DNA文库从30 µL提取物中制备68详细描述了Gansauge等人29 。在库制备过程中(与磷酸酶一起)添加了大肠杆菌udg和大肠杆菌核酸内切酶VIII,以去除分子内部的尿酸(部分或完整),以生成库的生成gap009.a09.a09.a09.a09.a0303030303.a09.a09.a09.a09.a09.a0401 ,gap009.a093.a0133.a.a0101.a.a01.ac.auc0a,Juc0a。对所有提取和文库并联产生阴性对照。使用两种定量PCR分析确定库的产量和图书馆制备的效率29 。   使用MALT69数据库筛选来自GAP009(两个库),MXV001(三个库) ,MXV001(三个库) ,DFU001(一个库)和RAZ007(两个库)(两个库)的测序数据 。2017年10月30日)以及通过NCBI组装门户获得的一系列真核基因组。通过NextFlow(NF) - 核/急切/急切的v2.4.432管道进行读取处理,删除人类读取以及对驴输出的啤酒花分析,并构建在NextFlow V21.04.170工作流语言上。NF核/渴望是可再现的管道 ,用于对测序数据进行质量控制和评估,生成以及分析映射数据和生成SNP调用等功能,以及其他功能 。NF核/急切的管道针对ADNA进行了优化 ,并采用了几个金标准发布的软件包,包括辅助量v271,用于去除衔接器 ,并在读取的3'末端进行较低的基本呼叫,BWA v0.7.1772的映射,Samtools c1.1273 report for powers c1.1273 reads reads re reads(bwa v0.7.1772)<37), dedup v0.21.8 for removal of duplicates, and DamageProfiler74 for analysing damage percentages in reads, among others. A full list of the software used by this nf-core/eager pipeline can be found in Supplementary Table 3. Candidates were assessed based on their HOPS candidate profiles (Supplementary Fig. 10). JUC013 was identified as a T. pallidum candidate via an alternative computational approach to the one described above (Supplementary Information, section 3). The number of reads from RAZ007 that were assigned to the genus Treponema in MALT (n = 3 for the femur and n = 2 for the occipital) were too low to permit an assessment in HOPS.   Sample and control libraries were enriched for TPA DNA in two rounds of consecutive in-solution capture75 automated on the Bravo NGS workstation. Both non-enriched and enriched library products were sequenced on an Illumina HiSeq 4000 using single-end 75 bp chemistry.   See Supplementary Information, sections 6–8.   We analysed the shotgun and human-enriched capture data using nf-core/eager v. 2.3.432. AdapterRemoval v.271 was used to trim adapter sequences and to remove adapter dimers and low-quality sequence reads (min length = 30; min base quality = 20). Pre-processed sequences were mapped to the human genome assembly GRCh37 (hg19) from the Genome Reference Consortium76 using BWA v. 0.7.1272 and a seed length of 32. The C to T misincorporation frequencies typical of aDNA were obtained using mapDamage 2.077 to assess the authenticity of the ancient DNA fragments. Genetic sex of the analysed individuals was assigned using SNP capture data by calculating the ratio of average X chromosomal and Y chromosomal coverage to the average autosomal coverage normalized by the chromosome length at the targeted SNPs78. Samples with an X rate between 0.35 and 0.55 and a Y rate between 0.4 and 0.7 were confirmed male (JUC013, DFU001, MXV001 and RAZ007). ANGSD v. 0.935 (as implemented in nf-core/eager) was used to estimate nuclear contamination, since males are expected to be homozygous at each X chromosome position79. The contamination estimates returned a value of 0.0 ± 0.0 for all individuals analysed. We used samtools mpileup (parameters –q 30 –Q 30 –B) to generate a pileup file from the merged sequence data of each individual, and used a custom script (pileupCaller v. 8.2.280) to genotype the individuals, using a pseudo-haploid random draw approach. Only individuals with >10,000个snps(gap009:156,533; juc013:761,151; mxv001:1,027,622; dfu001:43,818(在人类起源面板上)被保留用于进一步的人口遗传学分析(RAZ007)被称为较低的人口遗传学分析(RAZ007) ,称为较低的SNPS,Snps snps snps snps,2,1111,11,11,2,2,2,2,23。   通过映射从shot弹枪和捕获后富集获得的测序读数(仅对MXV001的捕获后富集)来确定个体的线粒体基因组的共识序列。将线粒体DNA(mtDNA)序列对齐并用Geneious Prime 2021.1.1(https://www.geneious.com)进行对齐 。对于所得序列 ,我们以高于30的可能性过滤位置 ,并使用了Haplogrep282和HaplofInd83来分配和确认相应的mtDNA单倍群。将对齐的mtDNA基因组与文献中的其他可用基因组进行比较。在人类数据处理后,进行了新的污染估计,这次是使用MTDNA信息和Mitoverse84中的单倍型污染检测v1.0.0进行的 。除RAZ007(MTDNA的平均覆盖范围:549X(MXV001) ,1252X(DFU001),721x(GAP009),53X(JUC013)(JUC013)(JUC013)和224(Raz0007级别) ,在污染状态和污染水平上获得的五个个体获得的结果是不可检索的。对于Y-Haplogroup分配,我们为每个个体创建了读取的读数,这些读数映射到ISOGG Y-DNA Haplogroup树(v15.73; https://isogg.org.org/tree/)上列出的y-chromosoms snps。然后 ,我们根据Rohrllach等人85中所述,根据沿y染色体单倍型单倍群的系统发育评估了上游突变的存在后,根据检索到最下游突变后 ,根据检索到最下游的SNP手动分配了Y染色体单倍群 。   我们将JUC013,MXV001,DFU001和GAP009的序列数据与补充表27中汇总的已发表的基因组数据来源合并了。该全球参考集中的主要成分分析(PCA)包括7271古代和现代个人(593,115 SNP)(593,115 snps)(593,115 SNP)(593,115 SNP)(593,115 snps) ,用于构造的(图4)。RAZ007由于其低覆盖率而被排除在此分析之外(在1240 K参考面板中少于10,000个已解决的SNP) 。   我们使用了一组来自五个大陆区域的祖先人群来估计混合物比例来测试与非本地人群的混合物(这清楚地表明 ,在接触后时期出生的个人出生):我们包括Huichol43,Huichol43,Mayan ,Mayan,Karitiana86和Karitiana86和Mixtec87作为Antotic Americal Americal撰写的一部分,以评估我们的本地人撰写我们的Same Same for Same for Same same same same same same same same same same same same same same same;通过使用来自约鲁巴86,88 ,Esan,Mende和LuO78组的个体的遗传数据来估算非洲成分;西班牙语87,89和法国86,89用于对欧洲遗传贡献进行建模;东亚遗传贡献由汉和柬埔寨88组成;并且近乎大洋洲的成分是由巴布亚邦88的基因型估计的 。然后,我们使用Ambixture90和AmbixturePlotter91来计算最佳的K(即具有最低的交叉验证误差(CVE); K = 5)的最佳K ,并且在每个建模的父母种群中最大化的组件的混合比例(图4D,e)。为了进一步完善所分析的个体中美国原住民血统的可视化,进行了另一种混合性运行 ,但只有以美洲的本地人口为祖先人群:来自北极,北美,加勒比海 ,中美洲和南美地区的人群包括作为祖先(图4F ,G)。CVE的最低估计为k = 5 。结果产生了预期的混合比例,预期的是为分析的个人提供的上下文信息提供的上下文信息。   为了评估混合分析中建议的遗传关系和混合事件,我们使用Poseidon Framework92的Xerxes CLI软件进行了F统计分析92。我们进行了F3形式的F3测试(外部群体; X) ,以测量美国土著测试人群之间共享遗传漂移的数量和在非洲外来群体发散后分析的每个人(图4A-C)(X),X指的是分析的每个人,包括我们分析的每个人 ,并参与了我们的分析范围 。   To infer putative functional differences among ancient and modern treponemal genomes, we investigated the presence or absence of genes potentially associated with virulence profiles in the pallidum (syphilis) and pertenue (yaws)/endemicum (bejel) lineages, as well as in their outgroup T. paraluiscuniculi93,94,95 (Supplementary Table 25).为此,使用samtools73映射质量过滤器之前的BAM文件用于计算Nichols参考基因组(NC_021490.2)上68个染色体基因的覆盖范围(补充表26),如前所述 ,如前所述26,96。用BedTools97计算每个研究基因的覆盖率比例,然后使用R版本4.2.2的GGPLOT2在热图上绘制(扩展数据图3和补充表26)。此外,我们使用了SNPEFF版本3.1i [build 2012-12-12] 98的程序来推断八个古代和53个现代的treponemal基因组中所谓的SNP的可能功能影响(有关SNP调用策略的补充信息 ,第7.3节) 。推断的SNP效应使用MultivCfanalyzer V0.85.299集成了为我们的分析生成的所有treponemal基因组的比较SNP表。该表被过滤以识别SNP及其对三个新报告的谱系的影响,这些谱系产生了古代基因组MXV001(补充表21),DFU001(补充表22)和JUC013/GAP009(补充表23)(补充表23) ,以及在所有现代TPA(Syphilis)多元化表中得出的(补充表24)。   为了研究分子约会分析的潜力 ,我们使用两种不同的方法正式评估了数据集中的时间信号 。首先,我们执行了用clockor239实现的根对尖端回归(补充图18)。这表明样品日期和遗传距离与根之间存在正相关(R2 = 0.25)。独立于TPA和TPE/TPE/十个进化枝独立安装的回归表明,谱系中的进化速率相似(分别为6.7×10-8和8.4×10-10-10-8个位置的每个位置替代 ,尽管本地时钟模型比全球钟模型(Bayesian Information Model(Bayesian Information criterion criterion(BIC)(BIC)= -1-1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2555 and prient Clock模型略有优先 。在第二步中,我们使用路径采样41比较了严格的时钟和不相关的对数正态放松时钟的拟合度,如《野兽2模型选择》中的实现38 。在这种情况下 ,由于天际线结合的已知问题以进行模型比较100,因此使用了指数的合并树先验。最终人口规模使用了0到100万之间的适当统一之前。对于这些分析,古代基因组的日期固定在其中值估计中 。然后使用路径采样40估算每个模型的边际可能性。我们使用1000万次燃烧前的迭代和100个步骤最初设置为300万次迭代(包括50%的燃烧) ,然后将其扩展到相同的长度,以确保所产生的贝叶斯因子估计收敛。后者显示出对放松时钟模型的压倒性支持(log bf = 167) 。最后,我们对时间信号(BETS)40进行了贝叶斯评估。然后将先前选择的放松时钟模型与等于的模型进行了比较 ,其中所有样品均设置为0,并且时钟速率固定在一个,所有其他参数否则相同。为此 , 如上所述 ,使用路径采样40 。结果表明对异量模型(log bf = 11.1)的强烈支持确认了我们数据集中存在明显的时间信号。   在我们数据集中评估了显着的时间信号后,使用野兽2.6.738估算了基于包含上述2104个SNP的比对(图3和补充表20),估算了一个时间校准的系统发育树。在应用所有过滤步骤后 ,使用过滤后的对准来说明剩余的恒定位点的数量 。使用样品约会信息对树进行校准。隔离日期用于现代菌株。对于古代菌株,根据饮食模型的2σ14C日期范围或历史数据(补充表28),将约会信息作为统一的先验分布输入 。使用四个离散类别101的一般时间可逆(GTR)替代模型与伽马分布的速率异质性一起使用 ,每个位置都有25%丢失的数据(模棱两可的基本调用)的许可 。将带有十组的贝叶斯天际线结合模型用作Prior102的树,以允许估计人口大小的变化,并随着Majander等人的26。按照时钟模型选择 ,使用了一个不相关的对数正态放松时钟模型103(补充数据,Beast2_ucln.xml),平均速率每年每个位点0到1个替换均匀。所有其他参数均设置为默认值(Beauti v.2.6.7)38 。该分析是使用3亿迭代的MCMC进行的 ,每30,000个步骤进行一次采样。在Tracerv。1.7.1104中评估了10%的迭代,并评估了收敛性,以确保所有有效的样本量(ESS)值均高于200 。我们还使用相同的MCMC规范对参数的先前分布进行了抽样 ,以确保时钟速率和TMRCA估计值是由数据驱动的(补充图19)。最大进化枝的信誉(MCC;图4) 树是使用Treeannotator105的树的后部分布构建的。采样的树木和人口参数用于使用专用的R脚本重建贝叶斯天际线图(扩展数据图4) ,以可视化细菌种群大小的估计 。   此外,为了说明观察到的进化速率可能会根据所考虑的时间尺度而有所不同,我们使用野兽1.10.442,106中实现的时间依赖性速率(TDR)模型进行了第二次分析(补充数据 ,Beast1_tdr.xml)。但是,后一个模型不能像不相关的松弛时钟模型那样适应二线间率变化。我们使用了具有指数结构的三个上述模型,其中包括100年前的过渡和1000年前的第二个 。每个时期的中点被用作参考点(在上一个时期花费了5000年前)。我们使用了平均= -14.5和0的普通先验 ,以及S.D.分别在替代率和时间之间的对数线性关系的截距和坡度系数的= 5和5(相当于时间0的平均每年5.10–7替换量约为5.10–7近约5.10–7替换,并且在关系方向上没有事先假设)。其他模型规格与上述主要分析相同(补充图20) 。补充表29中列出了约会分析的结果 。   有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

本文来自作者[admin]投稿,不代表象功馆立场,如若转载,请注明出处:https://wap.xianggongguan.cn/kexue/202506-728.html

(15)
admin的头像admin签约作者

文章推荐

发表回复

作者才能评论

评论列表(3条)

  • admin的头像
    admin 2025年06月19日

    我是象功馆的签约作者“admin”

  • admin
    admin 2025年06月19日

    本文概览:  放射性碳年代在Curt-Engelhorn考古中心(德国曼海姆)进行。使用超过滤胶原蛋白(分数> 30KD)处理骨骼碎片,并使用Klaus-tschira-Arch;...

  • admin
    用户061905 2025年06月19日

    文章不错《古老的基因组揭示了美洲毛毛虫的深刻历史》内容很有帮助

联系我们

邮件:象功馆@gmail.com

工作时间:周一至周五,9:30-17:30,节假日休息

关注微信