2024-11-13 16:11来源:本站编辑
检查基因ex压力变化有助于研究人员在分子水平上了解细胞功能,从而深入了解o各种疾病的发作。
然而,人类拥有大约2万个基因,这些基因以复杂的方式相互作用,确定要研究的特定基因群是具有挑战性的。此外,基因通常在相互连接的模块中起作用,调节彼此的活动。
麻省理工学院(MIT)的研究人员现在已经开发出了一种方法的理论基础,这种方法可以将基因最佳地分组成簇,从而更容易识别多个基因之间的因果关系。至关重要的是,这种创新的方法完全依赖于观测数据,不需要昂贵或不切实际的实验干预来建立因果关系。
在未来,这种方法可以帮助科学家更准确地识别影响特定行为的基因目标,有可能为患者带来精确的治疗。
Zhang与共同主要作者Ryan Welch(工程硕士研究生)和资深作者Caroline Uhler(麻省理工学院电子工程与计算机科学系和数据、系统与社会研究所教授)合作。
乌勒还是麻省理工学院和哈佛大学布罗德研究所埃里克和温迪施密特中心的主任,也是麻省理工学院信息与决策系统实验室的研究员。他们的研究将在神经信息处理系统会议上发表。
研究人员解决了学习基因程序的挑战——在细胞发育或分化等生物过程中,基因如何协同作用来调节其他基因。由于研究所有20,000个基因之间的相互作用是不切实际的,他们使用了一种称为因果解缠的技术,将相关的基因组组合成一个模型,简化了因果关系的探索。
此前,研究人员证明,通过改变网络变量收集的介入数据可以有效地做到这一点。然而,干预性实验是昂贵的,在某些情况下,不道德或受技术限制。
由于只有观察数据,研究人员缺乏比较干预前后基因以了解基因组相互作用的能力。
麻省理工学院研究生、埃里克和温迪·施密特中心研究员张嘉琪解释说:“大多数因果关系解开研究都假设有干预措施,所以不清楚我们能通过观察数据解开多少信息。”
麻省理工学院的研究人员开发了一种更广泛的方法,利用机器学习算法对观察到的变量(如基因)进行分组,仅使用观察数据。这项技术使他们能够识别因果模块,并准确地重建潜在的因果机制。
“虽然我们的研究是由了解细胞程序的需要驱动的,但我们首先开发了新的因果理论,以确定仅从观察数据中可以学到什么。有了这个基础,我们可以将这些见解应用于基因数据,以识别基因模块及其调控关系,”乌勒说。
利用统计方法,研究人员计算了每个变量的雅可比值的方差。不影响任何后续变量的因果变量的方差应为零。
他们的方法逐层重建表示,在每个阶段去除方差为零的变量。这种反向消除有助于确定哪些基因组有因果关系。
“识别哪些方差为零很快就变成了一项复杂的组合任务,因此推导出一种有效的算法来解决这个问题是一个重大挑战,”张佳琪解释说。
由此产生的模型产生了观察到的数据的抽象表示,将相互关联的基因组组织成精确捕获因果结构的层。每个变量代表一个共同工作的基因组,而变量之间的关系表明一个基因组如何调节另一个基因组。该方法保留了确定每个变量层结构所需的所有信息。
在确认了他们的方法在理论上的合理性之后,研究人员进行了模拟,以表明他们的算法可以仅使用观测数据有效地揭示有意义的因果关系。
展望未来,他们计划将这项技术应用于现实世界的基因数据集。他们还打算探索当一些干预数据可用或帮助设计有效的基因干预时,该方法如何提供额外的见解。
最终,这种方法可以帮助研究人员更有效地识别在特定程序中共同起作用的基因群,可能有助于发现靶向疾病治疗的药物。