ramy  2021-01-05 16:17:09  赢咖4平台 |   查看评论   

图神经网络GNN)

图神经网络(GNN)是目前热门的研究方向,但我们是否应把注意力过多地放在这上面?数据科学家 Matt Ranger 从模型的本质、性能基准测试、实践应用等方面陈述了自己的观点。alternativeto

图神经网络(GNN)是机器学习中最热门的领域之一,在过去短短数月内就有多篇优秀的综述论文。但数据科学家 Matt Ranger 对 GNN 却并不感冒。他认为这方面的研究会取得进展,但其他研究方向或许更重要。

图神经网络(GNN)

博客链接:http://www.singlelunch.com/2020/12/28/why-im-lukewarm-on-graph-neural-networks/

机器之心对这篇博客进行了编译整理,以下是博客内容。

模型的关键是压缩

图经常被认为是一种「非欧几里得」数据类型,但实际上并不是。正则图(regular graph)只是研究邻接矩阵的另一种方式:

图神经网络(GNN)

如上图所示,充满实数的矩阵却被称为「非欧几里得」,这很奇怪。

其实这是出于实际原因。大多数图都相当稀疏,因此矩阵中会包含很多 0。从这个角度看,非零数值非常重要,这让问题接近于(计算上很难的)离散数学,而不是(容易的)连续、梯度友好的数学。alternativeto

有了全矩阵,情况会变得容易

如果不考虑物理领域的内容,并假设存在全邻接矩阵,那么很多问题就会迎刃而解。

首先,网络节点嵌入不再是问题。一个节点就是矩阵中的一行,因此它本身已经是数字向量。

其次,所有网络预测问题也都被解决。一个足够强大且经过良好调整的模型将只提取网络与附加到节点上的目标变量之间的全部信息。

NLP 也只是一种花哨的矩阵压缩

让我们把目光从图转移到自然语言处理(NLP)领域。大多数 NLP 问题都可以看成图问题,所以这并不是题外话。

首先,像 Word2Vec、GloVe 这类经典词嵌入模型只进行了矩阵分解。

GloVe 算法基于词袋(bag of words)矩阵的一种变体运行。它会遍历句子,并创建一个(隐式)共现图,图的节点是词,边的权重取决于这些单词在句子中一同出现的频率。之后,Glove 对共现图的矩阵表示进行矩阵分解,Word2Vec 在数学方面是等效的。

语言模型也只是矩阵压缩

NLP 中许多 SOTA 方法都离不开语言模型。以 BERT 为例,BERT 基于语境来预测单词:

 1/4    1 2 3 4 下一页 尾页
 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自2021年的第一盆冷水:有人说不要太重视图神经网络(GNN)-alternativeto

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]