ssrgenotyper:自由生物信息工具以数字基因型简单序列重复
SSRGenotyper是一种新的开发的免费生物信息工具,允许研究人员使用简单的序列重复(SSR)来进行数字基因型测序群体,这是先前需要耗时的基于实验室的方法的任务。
在最近的植物科学中的应用程序问题中,该工具开发人员设计了该计划,可以与目前用于检测和分析SSR的其他应用程序无缝集成。
简单的序列重复是重复突变的重复核苷酸的短链。这些DNA序列的可变性使得它们适用于遗传分析,以区分习惯性,并且通常是亲属性和法医检测的选择标记。
在研究领域,SSRS具有选择性中立的额外好处,这意味着他们不会为任何物理特征编码,因此不受大多数类型的自然选择,使其成为研究人群的绝佳工具而没有模糊的效果收敛演变。
下一代测序的最新进展有助于简化SSR鉴定的过程,尤其是在具有可用参考基因组组件的模型生物体或组中。随着技术继续提高和测序成本的降低,即使在非模型生物中,SSR分析的目的序列为基因组的大部分正在变得越来越可行,在科学文献中变得更加可行。
描绘SSR发现,DNA放大和读取映射的过程的工作流程。一旦SSRS被识别并映射,该信息可以作为SAM导出到SSRGenotyper以进行所有相关的基因分型,除去伪等位基因和过滤。然后可以在几个文件时间内将基因分型结果导出,以进一步下游分析。
然而,基因分型的过程 - 确定哪种渗透的方法 - 仍然主要依赖于在电泳凝胶上可视化扩增的DNA,所涉及的和潜在危险的过程,因为DNA片段通常用致癌化学品染色。
它还具有基于所得条带的大小测量的等位基因的添加问题,这是扩增的DNA片段中的核苷酸数量的估计。因为围绕其感兴趣的SSR的侧翼区域可能存在轻微的变化,因为没有使用这些方法确定等位基因尺寸的标准化方法,因此不能容易地将来自一个实验的基因分型结果与另一个实验的基因分型结果。
SSRGenotyper的发展使得基于实验室的努力过时。通过在串联中使用其他生物信息性程序,该程序检测参考DNA中的SSRS和将序列数据与相应的SSR参考文件对齐序列数据,SSRGenotyper能够快速基因型,每个SSR都适用于均匀测序的样本。
“SSRGenotyper通过测序群体内的基因分型SSR进行了下一步 - 严格来自测序数据(无PCR或电泳),”Brigham Young大学和研究高级作者植物和野生动物科学教授Jeff Maughan说。“SSRGenotyper的输出是用于种群遗传分析或联系地图地层的文件。”
该程序不仅可以减少基因型群所需的时间和工作量,还通过直接计数给定序列重复的碱基对的总数来解决电泳估计中固有的可转移性问题。
“由于SSRS是基于SSR基因座的重复主题的数量而不是PCR产品尺寸的基因分型,因此等位基因呼叫是标准化和可从项目到项目或从实验室转移到实验室的标准化和可转让的。”
在Python 3中编码的程序仅需要运行三个位置参数,提供指定几个条件参数的选项(例如杂合子的百分比阈值,侧翼区域的尺寸,以及用于去除虚假等位基因),并且可以在常规桌面计算机上执行。
一旦完成,SSRGenotyper会生成多种文件类型,包括基本摘要和统计文件,以及.pop,a .map,以及格式化的对齐文件,以便在其他程序中使用以促进下游分析。
作为概念证据,穆恩和他的同事通过在公开可用的奎奴亚藜(藜喹啉毒素)和燕麦物种Avena atlantica的公开可用序列中正确测定杀虫基因型来测试Ssrgenotypers准确性。得到的精度率为97%或更大,随着含有额外的序列读数而增加。
随着下一代测序方法的持续发展和效率,SSRGenotyyper等工具似乎有望减少遗传研究中所需的实验室工作量。
“测序已经是大多数遗传研究项目中首选方法,”墨守说。“由于成本继续下降,并且开发了新的生物信息工具,很可能是未来的群体遗传学研究将完全基于下一代测序 - 完全避免PCR和电泳的麻烦任务。”
参考:“ssrgenotyper:简单的序列重复基因分型申请全基因组重构和减少的丹尼尔H. Lewis,David E. Jarvis和Peter J. Maughan,2020年12月3日,在植物科学中的应用.DOI:
10.1002 / APS3.11402