目录(当前的章节数是对应论文的)

  • 第二章:一个完整的图构建包括哪四步?
  • 第三-五章:给出了完整图构建的关键步骤,其中蕴含了当前变种的修改点
  • 第六章:一个样例:图应用的样例
  • 第七章:分别从理论和经验角度分析了GNN的当前研究
  • 第八章:引入了结构化场景,非结构场景,以及其他场景的图网络应用。
  • 第九章:给出四个当前的开放领域问题。

第二章->管道分四步

找到合适的图结构

尤其在文本图像数据中,图结构不容易寻找到。

指定合适的图的类型和规模。

  • 图是有向图还是无向图。也就是边的指向是否是单向的,因为无向图是两个有向图。
  • 图是同质图还是异质图。节点和边的对应类型是相同的,就是同质图;否则是异质图。
  • 静态图还是动态图。输入特征,图的拓扑结构发生改变,就是动态图。否则不是。

图的类型是不一的,重点应该放在如何理解图的额外信息。
对于图的规模则是按照空间复杂度是否超过O(N2)O(N^{2})O(N2)来考虑的。

设计合适的损失函数

按照任务类型,主要分为下面三种:

  • 节点层面:任务关注节点,包括节点分类,节点回归,节点聚类。
  • 边层面:任务关注边,包括边分类,链路预测,主要是要求模型分类边的类型和预测两个节点间是否存在边。
  • 图层面:任务包括图分类,图回归,图匹配,所有的都是要求模型学习图表征。

按照训练方式类型分类:

  • 有监督训练:
  • 半监督训练:通过提供少部分标签数据,大部分无标签数据。测试阶段,转化设置要求模型预测大量无标签数据,然后归纳设置中,根据相同分布去推断新的无标签数据。大部分的节点和边的预测都是半监督。后面一种研究就是混合设置。
  • 无监督训练:比如聚类。

使用计算模块构建模型

计算模块可以认为是图更新部分的计算方式,这里根据论文描述给出4中计算模块。

  • 传播模块:传播模块可以通过传播节点信息帮助聚集信息,使得特征信息和拓扑信息被获取。在传播模块中疮痈操作包括卷积算子循环算子,以及跳跃连接(类似残差网络)。其中跳跃连接被解释是为了聚集历史信息。
  • 采样模块:如果图的规模很大,此时可能需要采样模块来决定传播模块。
  • 池化模块:获取高维度的子图或者图的信息,需要从节点上面获取信息。
    各个模块间的关系
    整篇论文读完,感觉计算模块过于简单,无法实现对于公式的理解,这篇文章暂时这样。决定找一篇切合的文章以及对应源码,深入阅读,这样才能了解图神经网络的基本处理方法。
Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐