图是一种强大的数据结构,能够模拟许多现实世界中的场景。尽管图可以捕捉实体间的关系信息,但很多传统的机器学习模型却忽视了这些关系信息,或者缺乏有效的方法来建模这些关系信息。
《图机器学习导论》一书介绍了当前较新的基于图的机器学习方法。图数据通常包含丰富的关系信息,然而,许多以前的机器学习模型往往只关注单个样本的特征,而忽略了样本之间的关系信息。
图机器学习提供了一种利用这些关系数据的方法。这种方法使我们不仅能够考虑图中每个节点自身的特性,还可以考虑到其相邻节点及其特性,从而获得更佳的表现。
图机器学习主要通过两种方式实现:一种是将图转换成表格形式,然后使用传统的机器学习方法;另一种是直接在图结构上应用机器学习技术,如图神经网络。
例如,DeepWalk、Node2Vec等基于随机游走的算法就是第一种方法的代表。它们通过随机游走将网络结构转化为序列,再用成熟的Skip-Gram方法进行处理。而图神经网络则属于第二种方法,直接在图结构上进行机器学习操作。
《图机器学习导论》详细介绍了图机器学习的发展历程和应用场景,包括网络表示学习、图神经网络等方法,并探讨了它们在问答系统和知识图谱等领域的应用。
以上内容展示了图机器学习的重要性和多样性,它正在成为机器学习领域的一个重要分支。无论是学术界还是工业界,图机器学习都展现出了巨大的潜力和价值。