在本论文中,我们从机器学习和理论的角度研究图问题。特别地,我们探索了金融领域中的应用,重点关注欺诈检测、中央银行救助和贷款问题。论文分为两个主要部分,大致对应于这两种视角。 第一部分,我们对图神经网络(GNN)进行了修改,以提高其表达能力,并使其适应不同类型的图。首先,我们研究了交易图中的金融犯罪检测。该领域存在明显的真实世界数据缺乏,因此我们首先建立了新的基准数据集。我们引入了一种新的模拟器,用于生成逼真的反洗钱数据集,并将这些数据集贡献给公众使用。在此数据的基础上,我们使用GNN进行欺诈检测。我们提出了一组对标准GNN的修改,使其能够在有向多重图中检测复杂的子图模式,包括常见的欺诈模式。我们的实验表明,这些修改后的GNN在检测洗钱方案和网络钓鱼攻击方面具有有效性。此外,我们证明这些修改使得GNN能够检测所有子图模式,突出了它们在图学习中的更广泛应用。 远离欺诈检测,我们还探索了通过预先计算的节点特征来提高GNN的性能。空间嵌入在提高表达能力的同时,证明了在泛化方面最为成功。然而,比较其他节点特征时,我们发现理论上的表达能力并不总是能够转化为实际中的效果。 最后,我们提出了一种新工具——Graphtester,用于系统地分析GNN的表达能力。我们为评估图变换器的表达能力奠定了理论基础,使其能够与传统的GNN进行统一分析。该工具提供了明确的证据,表明表达能力在真实世界数据集中很少是瓶颈。我们还展示了如何使用Graphtester来分析并提高模型和基准的有效性。 论文的第二部分聚焦于金融网络的理论分析,即由金融机构通过未偿债务相互连接所构成的图。我们研究了中央银行的最佳银行救助问题,确定了在不同条件下的计算复杂性,并突出了潜在的易受利用的漏洞。我们证明了该优化问题是NP困难的,并且在某些条件下,甚至对其进行近似也是NP困难的。 随后,我们分析了网络结构对金融网络中贷款行为的影响。我们探索了网络拓扑如何影响贷款价格和网络稳定性。有趣的是,在确定性资产的情况下,网络拓扑仅影响借款人的回收率,而不影响贷款人的均衡价格。因此,网络中的所有银行都会为贷款收取相同的价格。然而,在随机资产的情况下,银行可能会有不同的均衡价格。 最后,与当前时代相关的是,我们简要探讨了大语言模型的领域。我们提出了一种简单有效的方法,将特定的关键词或主题融入文本生成中。我们的方法改善了对生成内容的控制,同时保持了流畅性。 总的来说,这篇论文在两个主要领域作出了贡献。我们介绍了改善GNN表达能力的有效方法,并证明了金融网络中的救助和贷款问题的重要结果。论文展示了机器学习和理论方法在图问题中的互补优势。