- 一种用于比较无向图和有向图嵌入的多用途无监督框架;
- 描述性与推断性社区检测:陷阱、神话和半真半假;
- 利用图的图神经网络的不平衡图分类;
- 多跳推荐程序中的不平等机会;
- 全球企业级供应网络中经济冲击风险的不平等;
- 基于零模型的数据增强用于图分类;
- 基于孔多塞原则的接近中心性;
- 图神经网络的考虑结构的标签平滑;
- “纠缠”——衡量团队流动的新动态指标;
- 引文不是引用:在 Twitter 上解开隶属关系和互动;
- 人物推荐器对回声室和极化的影响;
- STEM:用于姿态检测的无监督结构嵌入;
- 可变强度的球员和球队的 Elo 型评分模型;
一种用于比较无向图和有向图嵌入的多用途无监督框架
原文标题: A Multi-purposed Unsupervised Framework for Comparing Embeddings of Undirected and Directed Graphs
地址: http://arxiv.org/abs/2112.00075
作者: Bogumił Kamiński, Łukasz Kraiński, Paweł Prałat, François Théberge
摘要: 图嵌入是将网络的节点转换为一组向量。一个好的嵌入应该刻画底层的图拓扑和结构、节点到节点的关系以及有关图、其子图和节点本身的其他相关信息。如果实现了这些目标,嵌入就是一个有意义的、可理解的并且通常是压缩的网络表示。不幸的是,选择最佳嵌入是一项具有挑战性的任务,而且通常需要领域专家。在本文中,我们扩展了作者最近引入的用于评估图嵌入的框架。现在,该框架为每个嵌入分配两个分数,局部和全局,用于衡量需要良好表示网络的局部和全局属性的任务的评估嵌入的质量。如果需要,可以以无监督的方式选择最佳嵌入,或者框架可以确定一些值得进一步研究的嵌入。该框架灵活、可扩展,可以处理无向/有向、加权/未加权图。
描述性与推断性社区检测:陷阱、神话和半真半假
原文标题: Descriptive vs. inferential community detection: pitfalls, myths and half-truths
地址: http://arxiv.org/abs/2112.00183
作者: Tiago P. Peixoto
摘要: 社区检测是网络科学最重要的方法论领域之一,并且在过去几十年中引起了广泛关注。该领域涉及将网络自动划分为基本构建块,目的是提供其大规模结构的摘要。尽管它很重要并且被广泛采用,但被认为是最先进的方法与在各个领域实际使用的方法之间存在明显的差距。在这里,我们试图通过根据现有方法是否具有“描述性”或“推理性”目标来划分现有方法来解决这种差异。虽然描述性方法基于社区结构的直观概念在网络中找到模式,但推理方法阐明了精确的生成模型,并试图将其拟合到数据中。通过这种方式,他们能够深入理解网络形成的机制,并以统计证据支持的方式将结构与随机性分开。我们回顾了采用具有推理目的的描述性方法如何充满陷阱和误导性答案,因此通常应该避免。我们认为推理方法通常更符合更清晰的科学问题,产生更可靠的结果,并且通常应该是首选。我们试图消除在实践中使用社区检测时经常相信的一些神话和半真半假,以努力改进这些方法的使用以及对其结果的解释。
利用图的图神经网络的不平衡图分类
原文标题: Imbalanced Graph Classification via Graph-of-Graph Neural Networks
地址: http://arxiv.org/abs/2112.00238
作者: Yu Wang, Yuying Zhao, Neil Shah, Tyler Derr
摘要: 图神经网络 (GNN) 在学习图表示以识别图的分类标签方面取得了前所未有的成功。然而,大多数现有的 GNN 图分类问题都遵循平衡的数据分割协议,这与许多现实世界场景不一致,其中某些类别的标签比其他类别少得多。在这种不平衡的情况下直接训练 GNN 可能会导致少数类图的无信息表示,并损害下游分类的整体性能,这表明开发有效的 GNN 来处理不平衡图分类的重要性。现有方法要么针对非图结构化数据量身定制,要么专门针对不平衡节点分类而设计,而很少关注不平衡图分类。为此,我们引入了一个新颖的框架,Graph-of-Graph Neural Networks (G^2GNN),它通过从相邻图全局和局部从图本身获得额外监督来缓解图不平衡问题。在全球范围内,我们基于内核相似性构建了一个图(GoG)图,并执行 GoG 传播以聚合相邻图表示,这些表示最初是通过节点级传播通过 GNN 编码器进行池化获得的。在本地,我们通过屏蔽节点或丢弃边来使用拓扑增强来提高模型在识别未知测试图的拓扑方面的通用性。在七个基准数据集上进行的广泛的图分类实验表明,我们提出的 G^2GNN 在 F1-macro 和 F1-micro 分数中比许多基线高出大约 5%。 G^2GNN 的实现可在 hrefhttps://github.com/YuWVandy/G2GNNhttps://github.com/YuWVandy/G2GNN 获得。
多跳推荐程序中的不平等机会
原文标题: Unequal Opportunities in Multi-hop Referral Programs
地址: http://arxiv.org/abs/2112.00269
作者: Yiguang Zhang, Augustin Chaintreau
摘要: 由于现代社会网络允许与朋友和熟人进行更快、更广泛的互动,通过现有用户促进销售的在线推荐计划正变得越来越流行。由于在线网络再现历史结构性偏见太普遍了,弱势群体的成员往往从这种推荐机会中获益较少。例如,仅在成对的朋友或追随者之间分配奖励的单跳推荐计划可能会为网络中的少数群体提供较少的奖励和机会,因为他们的学位在统计上证明较小。在这里,我们检查了一般推荐计划的公平性,这是一种越来越流行的营销形式,其中鼓励现有推荐人通过多跳发起新推荐用户的招募。虽然这显然扩大了获得奖励的机会,但尚不清楚它是否有助于解决公平问题,还是使问题变得更糟。我们通过研究 4 个真实世界的网络并对以少数族裔多数从属关系和同质性创建的网络进行理论分析,表明多跳推荐程序中偏差的变化高度依赖于网络结构和推荐策略。具体而言,在将每个人可以共享的推荐数量限制为固定数量的三种不同的受限推荐策略下,我们表明即使没有明确的歧视意图并且无法获得性别和种族等敏感属性,某些推荐策略仍然可以当允许更高的跳跃时,进一步放大结构偏差。此外,当每个人可以分配的推荐数量没有限制并且当推荐策略的影响被消除时,我们证明了一个精确的条件,在该条件下,1-hop 推荐程序的偏差在更高的 hop 推荐程序中被放大。
全球企业级供应网络中经济冲击风险的不平等
原文标题: Inequality in economic shock exposures across the global firm-level supply network
地址: http://arxiv.org/abs/2112.00415
作者: Abhijit Chakraborty, Tobias Reisch, Christian Diem, Stefan Thurner
摘要: 几个世纪以来,国民经济通过参与国际贸易和生产创造了财富。由此产生的国际供应网络不仅增加了国家的财富,而且还造成系统性风险:一国公司倒闭引发的经济冲击可能会传播到其他国家。使用公司层面的全球供应网络数据,我们提出了一种方法来估计一个国家因另一国公司倒闭而遭受的直接和间接经济损失。我们展示了世界范围内的系统性风险流动网络。我们发现,与相反的情况相比,富国使穷国面临更多的系统性风险。我们证明,较高的系统性风险水平并没有用 GDP 的风险溢价来补偿,也与经济增长无关。全球系统性风险的分配似乎比财富分配更不平等。这些发现以新的视角重新审视了发展中国家经常受到称赞的全球化生产带来的好处,因为它们将这些好处与生产过程中所涉及的风险联系起来。暴露风险是全球不平等的一个新维度,在供应冲击危机中对穷人的影响最大。使用所提出的方法,它变得完全可量化。
基于零模型的数据增强用于图分类
原文标题: Data Augmentation Based on Null Model for Graph Classification
地址: http://arxiv.org/abs/2112.00476
作者: Qi Xuan, Zeyu Wang, Jinhuan Wang, * Yalu Shan, 1
摘要: 在网络科学中,空模型通常用于在一定条件下基于随机化生成一系列图,它被广泛用作比较术语,以验证所讨论的网络是否显示一些非平凡的特征,例如社区结构。由于此类非平凡特征可能在图分类中发挥重要作用,因此空模型可以为正则化提供新的视角,从而提高分类性能。在本文中,我们提出了一种基于空模型的图分类数据增强框架,它包含四个部分:特征排序、图数据增强、数据过滤和模型再训练。此外,在该框架中,针对不同的特征提出了三种启发式空模型生成方法。在五个著名的基准数据集上进行了实验,结果表明我们的框架具有良好的性能,为图分类的数据增强提供了新的方向。
基于孔多塞原则的接近中心性
原文标题: Closeness Centrality via the Condorcet Principle
地址: http://arxiv.org/abs/2112.00494
作者: Oskar Skibski
摘要: 我们揭示了接近中心性和孔多塞原则之间的新关系。我们将图中的 Condorcet 获胜者定义为与任何其他节点相比更接近更多节点的节点。换句话说,如果我们假设节点投票给更接近的候选人,则孔多塞特的获胜者将赢得两个候选人的选举,以多数票反对任何其他节点。我们证明了接近中心性及其随机游走版本,随机游走接近中心性,是唯一在树上 Condorcet 一致的经典中心性度量,即,如果 Condorcet 获胜者存在,他们将其排在第一位。虽然它们在一般图中不是 Condorcet 一致的,但我们表明 Closeness 中心性满足 Condorcet 比较属性,该属性表明在两个相邻节点中,更多节点首选的节点具有更高的中心性。我们表明接近中心性是唯一具有这种属性的基于距离的常规中心性。
图神经网络的考虑结构的标签平滑
原文标题: Structure-Aware Label Smoothing for Graph Neural Networks
地址: http://arxiv.org/abs/2112.00499
作者: Yiwei Wang, Yujun Cai, Yuxuan Liang, Wei Wang, Henghui Ding, Muhao Chen, Jing Tang, Bryan Hooi
摘要: 将标签分布表示为 one-hot 向量是训练节点分类模型的常见做法。然而,one-hot 表示可能无法充分反映不同类中节点的语义特征,因为某些节点在语义上可能与其他类中的邻居在语义上接近。这会导致过度自信,因为鼓励模型在对每个节点进行分类时分配完整的概率。虽然带有标签平滑的训练模型可以在一定程度上缓解这个问题,但它仍然无法捕捉到图结构所隐含的节点语义特征。在这项工作中,我们提出了一种新颖的 SALS( Structure-Aware Label Smoothing)方法作为流行节点分类模型的增强组件。 SALS 利用图结构来刻画连接节点之间的语义相关性,并生成结构感知标签分布来替换原始的 one-hot 标签向量,从而在不产生推理成本的情况下提高节点分类性能。对七个节点分类基准数据集的大量实验揭示了我们的 SALS 在改进转导和归纳节点分类方面的有效性。实证结果表明,SALS 优于标签平滑方法,并增强了节点分类模型以优于基线方法。
“纠缠”——衡量团队流动的新动态指标
原文标题: ‘Entanglement’ – A new dynamic metric to measure team flow
地址: http://arxiv.org/abs/2112.00538
作者: P. A.Gloor, M. P. Zylka, A. Fronzetti Colladon, M. Makai
摘要: 我们引入了“纠缠度”,这是一种衡量团队成员之间同步沟通程度的新指标。此度量计算团队成员的社会网络指标时间序列之间的欧几里得距离。我们通过四个案例研究验证了该指标。第一个案例研究使用 11 个医疗创新团队的纠缠来预测团队绩效和学习行为。第二个案例着眼于一家国际服务公司的 113 名高级管理人员的电子邮件通信,通过没有员工纠缠来预测员工流失。第三个案例分析了81名经理的个人员工绩效。第四个案例研究通过比较电子邮件交互中的纠缠与通过净推荐值 (NPS) 衡量的客户满意度来预测一家大型国际公司的 13 个客户专用团队的绩效。虽然我们只能推测是什么导致了纠缠效应,但我们发现它是一个用于分析员工沟通的新的、通用的指标,分析在线社会网络迄今为止未被充分利用的时间维度,可以用作一个强有力的预测指标员工和团队绩效、员工流失率和客户满意度。
引文不是引用:在 Twitter 上解开隶属关系和互动
原文标题: Quoting is not Citing: Disentangling Affiliation and Interaction on Twitter
地址: http://arxiv.org/abs/2112.00554
作者: Camille Roth, Jonathan St-Onge, Katrin Herms
摘要: 交互网络通常比附属网络少得多,可以容纳更多的交叉链接。通过从用户的网络级别从属模式统计地为用户分配政治效价,并通过进一步对比特定话语事件(即引用树)内的交互和从属关系(引用和转推),我们描述了各种交叉模式,这些模式显著地改变了传统的“回声室”叙事。
人物推荐器对回声室和极化的影响
原文标题: The Effect of People Recommenders on Echo Chambers and Polarization
地址: http://arxiv.org/abs/2112.00626
作者: Federico Cinus, Marco Minici, Corrado Monti, Francesco Bonchi
摘要: 由于这些现象可能对我们的社会造成破坏性后果,社交媒体对诸如两极分化和错误信息等关键问题的影响正在受到审查。在社交媒体平台经常使用的算法中,人物推荐系统特别受关注,因为它们直接有助于社会网络结构的演变,影响用户接触到的信息和意见。在本文中,我们提出了一个框架来评估人员推荐对意见演变的影响。我们的提议基于结合了链接推荐和意见动态模型的蒙特卡罗模拟。为了控制初始条件,我们定义了一个随机网络模型来生成带有意见的图,具有可调数量的模块化和同质性。我们将这些元素结合成一种方法来研究推荐系统对回声室和极化的影响。我们还展示了如何使用我们的框架通过模拟来衡量不同干预策略的影响。我们彻底的实验表明,人们推荐实际上可以导致回声室的显著增加。然而,只有在网络中存在相当大的初始同质性时才会发生这种情况。此外,我们发现如果网络已经包含回声室,则推荐算法的影响可以忽略不计。这些发现对两种截然不同的意见动态模型(有界置信模型和认识论模型)是稳健的。
STEM:用于姿态检测的无监督结构嵌入
原文标题: STEM: Unsupervised STructural EMbedding for Stance Detection
地址: http://arxiv.org/abs/2112.00712
作者: Ron Korenblum Pick, Vladyslav Kozhukhov, Dan Vilenchik, Oren Tsur
摘要: 立场检测是一项重要任务,支持许多下游任务,例如话语解析和建模假新闻、谣言和科学否认的传播。在本文中,我们提出了一种新的姿态检测框架。我们的框架是无监督且独立于领域的。给定一个声明和一个多参与者的讨论 - 我们构建了交互网络,从中我们为每个说话者推导出拓扑嵌入。这些说话人嵌入具有以下特性:立场相同的说话人往往由相似的向量表示,而对映向量表示立场相反的说话人。然后使用这些嵌入将说话者划分为立场分区。我们在来自不同平台的三个不同数据集上评估我们的方法。我们的方法优于或可与监督模型相媲美,同时为其输出提供置信水平。此外,我们展示了结构嵌入如何与说话者表达的价态相关。最后,我们讨论了该框架固有的一些限制。
可变强度的球员和球队的 Elo 型评分模型
原文标题: An Elo-type rating model for players and teams of variable strength
地址: http://arxiv.org/abs/2109.15046
作者: Düring Bertram, Fischer Michael, Wolfram Marie-Therese
摘要: Elo评级系统最初是由Arpad Elo为国际象棋提出的,现已成为当今体育、经济和博弈领域最重要的评级系统之一。它的原始公式基于两人零和博弈,但已针对团队运动和其他设置进行了调整。 2015 年,Junca 和 Jabin 提出了 Elo 模型的动力学版本,并表明在某些假设下,评级确实会趋向于球员的实力。在本文中,我们概括了他们的模型以解释单个球员或团队的可变表现。我们讨论基本的建模假设,推导出相应的正式平均场模型,并用计算结果说明动力学。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20211202/