博格斯是巨大的遗传因素,具有扩大代谢能力的潜力

  我们分析了来自美国科罗拉多州步枪含水层的沉积物的序列,这些序列是从2011年7月从Surface15低于5 m至6 m以下5 m至6 m以下的5 m和6 m的核心检索到的,2013年5月从Corona Counter at Colledia ,Colledia,Same,Same ,Same,Same,Same colutian frounter的O2浓度收集的同一含水层的泵送地下水中的细胞浓度。科罗拉多州的布雷特(Butte)在东河的河床上进行了采样。土壤是从位于加利福尼亚州莱克县的永久潮湿湿地之间的1厘米至1 m之间的深度间隔采样 。在10月下旬和2017年11月上旬和2019年11月上旬对湿地土壤进行采样。使用BBDUK33和镰刀34进行了读取和质量修剪。使用IDBA-UD35组装过滤波的读数 ,并使用prodigal36建立基因预测,并将USEARCH37用于初始注释34,35,37,38 。TRNA的功能预测和预测遵循先前报道的方法19。   根据其分类学概况,将数百个从头组装的序列肯定为潜在的ECES。分类学概况是通过一个投票方案确定的 ,在该计划中,通过与序列数据库(uniprot和ggkkbase中的蛋白质注释:https:///ggkbase.berkeley.edemics nexonsightions ne semains neworme ness semains noce necormant of Secutsion:https:///ggkbbase.berkele.educiens nexention n semallice nexons n semainsion note semain note note note note note note note note note note 。选定的用于进一步分析的组装序列即使在域级别也没有分类学概况。大多数感兴趣的重叠群具有更多的基因,其基因与甲烷植物属的古细菌相似。而不是其他任何属(见扩展数据图4) 。感兴趣的第二个特征是假设蛋白质占主导地位 ,但缺乏将表明鉴定为噬菌体或病毒或质粒的基因。   这些最初确定的大片段是手动策划的 ,以消除脚手架间隙和局部组装误差,以扩展并连接与相同轮廓,GC和覆盖范围的重叠群 ,然后将接近完整的序列完全扩展到其长时间重复序列中。最后一步需要重新分配一端映射的读取,并在两端的两端进行双重深度 。尽管全基因组的深层覆盖范围,但完全扩展的序列没有未找到的读数向外延伸 。鉴于此 ,并且没有任何可能是较大基因组一部分的片段,因此得出的结论是,序列代表了线性基因组。   更详细地 ,我们的策划方法涉及将读取到从差距和差距中的映射到差距和扩展,并在Termini中使用先前不合格的读数,我们基于重叠或通过放错位置的读数添加的读数(通常可以基于不正确的配对读取距离和/或错误的方向来识别这些读数)。通过可视化整个组件中映射的读取的读数 ,并根据不完善的读取支持,或者在读取部分是部分差异,并且差异涉及串联直接重复相同区域(即串联直接重复区域在组装过程中偏移) 。从头组装的序列通常以串联直接重复区域结束 ,因为重复片段组件。为了解决局部组装错误 ,插入了间隙并读取重新定位以生成填补空白所需的序列。这确保了读取与最终共识序列之间的全面完全完美的一致性 。在某些情况下,串联直接重复区域具有大于映射读取的预期深度,而没有读取跨越侧翼的独特序列。在这些情况下 ,重复数近似以达到预期的读取深度,但是有些阵列可能比显示的大。使用IREP39计算GC偏斜和累积GC偏斜,以完全手动策划的完整基因组 ,并使用模式来识别复制的起源和末端 。将用于基因的编码链的使用模式(细菌代码11中的预测)与这些来源和末端预测进行了比较,以解决基因组组织。搜索策划的序列,使用重复发现器中的重复序列的50或更多核苷酸长度的完美重复序列。当重复序列重叠时 ,确定了直接重复的单位,并且该重复的长度,重复次数 ,位置数(在基因与基因间内) 和基因组位置被制表 。一旦确定了感兴趣的特征的特征,我们就会寻求相关元素。基于(1)具有完整序列的可靠部分比对鉴定了感兴趣的序列,(2)无域级别的轮廓 ,(3)GC含量为30–35% ,(4)区域,分别散布在整个基因组片段中的三个或更多直接串联重复序列;蛋白质比来自任何其他生物的蛋白质。如果脚手架达到标准(1),则立即将其归类为目标 。如果他们符合大多数或所有其他标准并且具有相似的覆盖范围值 ,则将它们与来自同一样本的其他脚手架一起使用这些特征 。通常,在同一垃圾箱中的某些重叠群的末端完美重叠,并且可以加入 ,从而提高了对垃圾箱质量的信心。使用MAUVE40将基因组序列相互对齐。如果在Borgs之间检测到了最新重组的异常高(完美)序列身份,则可以看到映射到该区域的读取以验证组件是否正确(即,不是嵌合;也请参见扩展数据中的信息) 。   基因组片段是在系统发育中分析的 ,以与公共数据库中的序列建立相关性。如果蛋白质没有类似的数据库序列,则将序列分类为无可检测的命中。   每个样品的读数都与每个甲烷基因和BORG基因组对齐 。使用以下参数使用BBMAP41进行比对:EditFilter = 5,minid = 0.96 ,IDFILTER = 0.97,模棱两可=随机。然后将与每个基因组排列的读数排列成对准矩阵,然后使用SCIPY42中实现的Pearson相关度量计算甲烷基因和BORG基因组的丰度模式之间的相关性。如果两个基因组之间的皮尔逊相关性高于0.92 ,则甲烷基基因组与BORG基因组之间的相关性被认为是显着的 。用于此分析的代码可通过Zenodo(https://doi.org/10.5281/zenodo.6887003)获得。   使用CRISPRDETECT43鉴定了Borg和甲烷编码的CRISPR重复序列和垫片。使用E <1×10-5的HMMSEarch搜索了这项研究的编码序列 ,以与先前的研究44报道的CAS基因序列进行搜索,以识别完整的基因座 。使用HMMSCAN和BLAST搜索与NCBI NR数据库进行了检查,并通过识别CRISCPR阵列和CAS基因进行了手动验证。比较了从CRISPR基因座的重复序列之间提取的间隔者与使用Blastn-Short 45鉴定Borgs的序列组件的序列组合。对齐长度超过24 bp的匹配保留了1个或更少的不匹配 ,并将目标保留并归类为细菌,噬菌体或其他 。通过发现更多的三个或更少的不匹配的命中,进一步搜索了目标序列中更多的间隔匹配的CRISPR阵列 ,以进一步搜索了更多的隔次匹配 。   在对BORG基因组的识别和策划和编码序列的USEARCH注释的积累之后,通过针对PFAM R32,KEGG ,PVOG搜索来进一步分配功能注释。用TMHMM预测蛋白质中的跨膜区域。从NCBI REFSEQ数据库下载了所有甲烷基因组和基因组组件,以及1,153种古细菌病毒和ECE 。使用浪子预测了开放式读取框,并且将BORG基因组的所有蛋白质和重建的ECE数据库聚集在蛋白质家族中 ,并如前所述的基因组进行比较。19。简而言之,使用两步程序将编码序列聚集到家族中 。首先,使用1×10-3的E值临界值 ,灵敏度为7.5和0.5的覆盖率进行全面序列搜索 ,并基于成对相似性构建了序列相似性网络,贪婪的集合覆盖算法算法以定义蛋白质子群。使用隐藏的马尔可夫模型的比较将所得的子簇分组为蛋白质家族。对于概率分数至少为95%且覆盖率至少0.50的亚科,使用Markov clustering算法在最终聚类中 ,将相似性得分(概率×覆盖率)用作输入网络的权重,并用2.0作为通胀参数 。这些簇被定义为蛋白质家族。   进一步验证了感兴趣的基因并使用NCBI和Intercoscan46中的保守域搜索进行比较,以鉴定氨基酸序列中的保守基序。基于一个基因中的三个或更多CXXCH基序鉴定了MHC 。使用古细菌作为生物类型预测蛋白质的细胞定位(v3.0.3)。使用BLASTP比较蛋白质 ,并使用MAFFT47 v.7.407对齐以可视化同源区域并检查构成活性位点的保守氨基酸残基,或者是辅助因子和配体结合所必需的。   对于每个基因,通过针对NCBI NR数据库爆炸相应的基因来汇编参考 ,并使用90%的相似性阈值48通过CD-HIT聚集了前50个命中 。使用MAFFT v.7.407对齐最终的基因,并使用IQTREE v.1.6.6使用自动模型Selection49推断系统发育树,并使用itol50进行了可视化 。使用Adobe Illustrator和Gggenes使用Mauve51和基因簇生成同步图。   有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。

本文来自作者[admin]投稿,不代表象功馆立场,如若转载,请注明出处:https://wap.xianggongguan.cn/zskp/202506-1615.html

(16)
admin的头像admin签约作者

文章推荐

发表回复

作者才能评论

评论列表(3条)

  • admin的头像
    admin 2025年06月20日

    我是象功馆的签约作者“admin”

  • admin
    admin 2025年06月20日

    本文概览:  我们分析了来自美国科罗拉多州步枪含水层的沉积物的序列,这些序列是从2011年7月从Surface15低于5 m至6 m以下5 m至6 m以下的5 m和6 m的核心检索到的,...

  • admin
    用户062010 2025年06月20日

    文章不错《博格斯是巨大的遗传因素,具有扩大代谢能力的潜力》内容很有帮助

联系我们

邮件:象功馆@gmail.com

工作时间:周一至周五,9:30-17:30,节假日休息

关注微信