科学家创建了首个完整折叠基因组的3D地图
DNA在核内形成环和结构域。
一组研究人员创建了首个完整折叠基因组的3D图,确定了人类基因组中约10,000个折叠环。
为了取得细胞生物学的胜利,研究人员组装了第一张完整折叠基因组的高分辨率3D图,并发现了基因调控的结构基础,这是一种“基因组折纸”,它可以使同一基因组产生不同类型的细胞。该研究于周四在线发表在《细胞》杂志上。
这项为期五年的项目的中心目标是确定人类基因组中的环,这是哈佛大学,贝勒医学院,莱斯大学以及哈佛大学和麻省理工学院广泛研究人员之间的合作。当在基因组序列中相距甚远的两个DNA末端紧密接触后,形成细胞核中的基因组折叠形式,从而形成环。
研究人员使用了一种称为“原位Hi-C”的技术来收集数十亿个DNA片段,随后对这些片段进行分析以寻找环的迹象。研究小组发现环和其他基因组折叠模式是遗传调控的重要组成部分。
研究的第一作者,贝勒基因组建筑中心研究员,2012年毕业于哈佛大学的Suhas Rao说:“越来越多,我们意识到折叠是规则。”“当您看到基因打开或关闭时,其背后是折叠的变化。这是思考细胞如何工作的另一种方式。”
哈佛工程与应用科学学院(SEAS)博士生的共同第一作者Miriam Huntley说:“我们的循环图已经揭示了成千上万个科学家以前不知道的隐藏开关。对于可能导致癌症或其他疾病的基因,知道这些转换在哪里至关重要。”
高级作者埃雷兹·利伯曼·艾登(Erez Lieberman Aiden)博士’10曾是哈佛研究员协会的初级研究员,现在是贝勒大学遗传学的助理教授以及莱斯大学的计算机科学,计算和应用数学的助理教授。艾登说,这项工作是五年前开始的,就在他和布罗德研究所的同事发表了一项开创性的研究后不久,介绍了Hi-C方法对3-D基因组进行测序。
艾登说:“ 2009年的研究很好地证明了原理,但是当我们查看实际地图时,看不到任何细节。”“我们花了几年时间才能将分辨率提高到生物学上可用的水平。新的图谱使我们第一次真正看到了单个基因水平的折叠情况。”
当艾登(Aiden)于2013年移居休斯敦,在贝勒(Baylor)建立基因组架构中心并在莱斯(Rice)加入理论生物物理中心时,继续完善Hi-C并产生具有基因水平分辨率的全基因组图谱的工作。艾登(Aiden),获得应用物理学硕士学位和博士学位。在SEAS的应用数学专业中,亨特利和饶(Rao)领导了这项研究工作。
除了大修Hi-C实验设计的挑战外,该团队还面临着巨大的计算障碍。
艾登的学生亨特利说:“ 2009年,我们将基因组划分为一百万个碱基的块,在这里,我们将其划分为一千个碱基的块。”“由于任何一个区块都可能与任何其他区块发生冲突,因此我们最终面临的问题要复杂一百万倍。整个数据库非常庞大。”
识别循环是另一个挑战。
“普通的计算机CPU [中央处理器]不能很好地适应环路检测的任务,” Rao说。“要找到循环,我们必须使用GPU(通常用于生成计算机图形的处理器)。”
亨特利说,还开发了新方法来加速数据处理并减少实验性“噪声”,即不规则的波动,这些波动往往会掩盖数据中的微弱信号。
“我们面临一个真正的挑战,因为我们在问:“数据库中数百万个DNA中的每一个如何与其他数百万个DNA中的每一个相互作用?”亨特利说。“我们必须从头开始创建用于本文的大多数工具,因为执行这些实验的规模如此罕见。”
为该研究创建的大数据工具包括用于高性能计算机集群的并行管道,动态编程算法和自定义数据结构。Rao说,该小组还严重依赖于合著者Neva Durand和James Robinson创建的数据可视化工具。
“在研究大数据时,可能会倾向于仅依靠统计分析来查看结果,从而试图解决问题,但我们团队的心态却有所不同,” Rao说。“即使有太多数据,我们仍然希望能够查看,可视化并理解它。我要说的是,我们观察到的几乎所有现象都是首先用肉眼看到的。”
通过这些方法,研究小组发现了一系列有关基因组中环如何形成和在何处形成的规则。
“如果DNA是一小撮,那么您可以在任何地方进行循环。但是在细胞内,环的形成受到高度限制,”饶说。“我们看到的循环几乎都跨越不到200万个遗传字母;它们很少重叠;而且它们几乎总是与称为CTCF的单一蛋白质相关联。”CTCF参与染色质3-D结构的调节,染色质是染色体的组成部分。
该论文的通讯作者埃里克·兰德(Eric Lander)说:“最令人震惊的发现是关于CTCF蛋白如何形成一个环。”“即使它们相距很远,构成回路的CTCF元素也必须彼此指向-形成基因组的阴阳。”兰德是布罗德研究所所长,麻省理工学院生物学教授和哈佛医学院系统生物学教授。
有趣的是,研究小组发现基因组中最大的环仅存在于女性中。亨特利指出:“雌性中缺失的X染色体副本包含巨大的环,其大小是我们在雄性中看到的任何东西的30倍。”
研究人员还发现,人类中存在的许多环也存在于小鼠中,这意味着这些特定的折叠在近一亿年的进化过程中得到了保留。
“我们的发现表明,哺乳动物不仅共享相似的1-D基因组序列,而且共享相似的3-D基因组折叠模式,” Aiden说。
其他合著者包括Baylor的Elena Stamenova,Ivan Bochkov,Adrian Sanborn,Ido Machol和Arina Omer。该研究得到了美国国家科学基金会,美国国立卫生研究院,美国国家人类基因组研究所,NVIDIA,IBM,谷歌,得克萨斯州癌症预防和研究所以及麦克奈尔医学研究所的支持。
出版物:Suhas Rao等人,“在千碱基分辨率下的人类基因组3D图揭示了染色质环化的原理”,细胞,2014年; doi:10.1016 / j.cell.2014.11.021
图像:艾德里安·桑伯恩(Adrian Sanborn),埃雷兹·利伯曼·艾登(Eiden Lieberman Aiden)