深度学习满足基因组生物学-赢咖4注册

aihot 2017-05-07 23:03:01 未来医疗 | 查看评论

赢咖4

作为我们正在进行的系列访谈调查机器智能前沿的一部分，我最近采访了布伦丹·弗雷。 Frey是Deep Genomics的联合创始人，多伦多大学教授，机器学习组的联合创始人之一，加拿大高级研究所的神经计算项目的高级研究员，以及皇家学会加拿大社会。他的工作重点是使用机器学习来了解基因组和实现基因组医学的新可能性。

关键因素

• 深入学习基因组医学的应用是一个有希望的开始;它可能影响诊断，重症监护，药品和保险。

• “基因型 - 表型分化” - 无法将遗传学与疾病表型相连 - 正在阻止基因组学将药物推向其潜力。

• 深度学习可以跨越基因型 - 表型分裂，通过并入指数生长的数据量，并考虑将基因型与表型相关的复杂生物过程的多层。

• 深度学习在人类自然熟练的应用中已经取得成功，例如图像，文本和语音理解。然而，人类思维本质上并不是为了理解基因组而设计的。这种差距需要对问题应用“超人类智力”。

• 在这个空间的努力必须考虑到底层的生物机制;过于简单，“黑箱”的方法只会带来有限的价值。

David Beyer：让我们从你的背景开始。

Brendan Frey：我完成了我的博士学位。与Geoff Hinton在1997年。我们合作的第一篇关于深度学习的论文，发表在1995年的“科学”。这篇论文是大多数近期关于无监督学习和自动编码器的工作的前身。当时，我专注于计算视觉，语音识别和文本分析。我还在深层架构中处理消息传递算法。 1997年，David MacKay和我写了关于“循环信念传播”或“和产物算法”的第一篇论文，其出现在顶级机器学习会议，神经信息处理系统会议或NIPS。

1999年，我成为滑铁卢大学计算机科学教授。然后在2001年，我加入了多伦多大学，并与其他几位教授共同创立了机器学习小组。我的团队使用基于变分法，消息传递和马尔可夫链蒙特卡罗（MCMC）模拟的算法研究深层架构中的学习和推断。多年来，我教了十多门机器学习和贝叶斯网络课程，一千多名学生。

在2005年，我成为加拿大高级研究所神经计算的高级研究员，这是一个惊人的机会，与领域的领导者分享想法和合作，如Yann LeCun，Yoshua Bengio，Yair Weiss和导演， Geoff Hinton。

DB：你在基因组学开始了什么？

BF：这是一个个人的故事。 2002年，在我作为多伦多大学教授的新作中，我的妻子几年了，我得知她所携带的婴儿有遗传问题。我们遇到的顾问没有做太多的事来澄清事情：她只能建议没有什么错，或者，另一方面，一些可能是非常错误的。这种经验，令人难以置信的困难，由于许多原因，也让我的职业生涯突击：我的工作的主流，说，在检测猫在YouTube视频，似乎不太重要 - 所有事情考虑。

我学到了两个教训：第一，我想使用机器学习来改善面临类似遗传挑战的亿万人的生活。第二，减少不确定性是非常有价值的：给某人新闻，不管是好还是坏，让他们相应地计划。相反，不确定性通常很难处理。

这样，我的研究目标就改变了。我们的焦点集中于理解基因组如何使用深度学习。

DB：为什么你认为机器学习加上基因组生物学很重要？

BF：基因组生物学作为一个领域，正在产生数据的洪流。您将很快能够使用手机大小的设备，对不到一个旅行到角落商店序列您的基因组。然而，基因组只是故事的一部分：存在大量的数据描述细胞和组织。作为人类，我们不能完全掌握所有这些数据：我们还不知道足够的生物学。机器学习可以帮助解决问题。

同时，机器学习社区中的其他人也认识到这一需求。在去年的机器学习首脑会议上，4位专家 - Facebook的AI主管Yann LeCun; DeepMind的联合创始人Demis Hassabis;谢菲尔德大学教授尼尔·劳伦斯（Neil Lawrence）和来自Google识别的医学的Kevin Murphy作为深度学习的下一个前沿。

为了成功，我们需要桥接“基因型 - 表型分化”。基因组和表型数据丰富。不幸的是，有意义地连接这些数据的最先进的技术导致文献搜索和详细的wetlab实验的缓慢，昂贵和不准确的过程。要闭合循环，我们需要能够确定称为“分子表型”的中间表型的系统，其作为从基因型到疾病表型的垫脚石。为此，机器学习是不可或缺的。

在我们说话的时候，有一个新一代的年轻研究人员使用机器学习来研究遗传如何影响分子表型，如在斯坦福大学的Anshul Kundaje's。仅举几个即将到来的领导者：多伦多大学和哈佛大学的Andrew Delong，Babak Alipanahi和David Kelley，他们研究蛋白质-DNA相互作用; MIT的Jinkuk Kim，他研究基因抑制;和Alex Rosenberg，他正在开发用于检查数百万突变及其对华盛顿大学拼接影响的实验方法。同时，我认为看到在这一领域工作的初创公司的兴起，例如Atomwise，Grail和其他人，是令人兴奋的。

DB：当你开始探索它的时候，基因组学领域的状态是什么？

BF：研究人员使用各种简单的“线性”机器学习方法，例如支持向量机和线性回归，例如，可以从患者的基因表达模式预测癌症。这些技术通过他们的设计是“浅”的。换句话说，对模型的每个输入将净类一个非常简单的“倡导者”或“不主张”类标签。这些方法没有考虑到生物学的复杂性。

隐马尔可夫模型和相关技术用于分析序列在20世纪90年代和21世纪初流行起来。理查德·杜宾和戴维·霍斯勒是这一领域的领导小组。

1/2 1 2 下一页尾页

除特别注明外，本站所有文章均为赢咖4注册原创，转载请注明出处来自深度学习满足基因组生物学

留言与评论（共有 0 条评论）

关于本站

加入我们

网站合作

标签（推荐）