- 超越节点和同质性的图表示学习;
- 曲率图生成对抗网络;
- 一种有效的基于图学习的时间链路预测方法:WSDM Cup 2022 第一名;
- 具有社区结构的 ABCD 随机图模型的模块化;
- 暴露于错误信息中的党派不对称;
- 考虑隐私的人群标签用于机器学习任务的;
- Twitter 上 COVID-19 反疫苗话语的自动聚类;
- 具有多个交互层的网络中同步稳定性的平均场性质;
- SaPHyRa:一种在大型网络中对节点进行排序的学习理论方法;
- 民主治理与国际研究合作:全球科学网络的纵向分析;
- 通过跨学科和基于社区的行动研究生成综合但现实的人口贩运网络用于建模干扰;
超越节点和同质性的图表示学习
原文标题: Graph Representation Learning Beyond Node and Homophily
地址: http://arxiv.org/abs/2203.01564
作者: You Li, Bei Lin, Binli Luo, Ning Gui
摘要: 无监督图表示学习旨在将各种图信息提炼成与下游任务无关的密集向量嵌入。然而,现有的图表示学习方法主要是在节点同质假设下设计的:连接的节点往往具有相似的标签并优化以节点为中心的下游任务的性能。他们的设计显然违背了任务无关原则,并且通常在任务中表现不佳,例如边分类,这需要超出节点视图和同质假设的特征信号。为了将不同的特征信号凝聚到嵌入中,本文提出了一种新颖的无监督图嵌入方法 PairE,它使用两个配对节点作为嵌入的基本单元,以保留节点之间的高频信号,以支持节点相关和边相关的任务。因此,设计了一个多自监督自编码器来完成两个借口任务:一个更好地保留高频信号,另一个增强共性的表示。我们对各种基准数据集的广泛实验清楚地表明,PairE 优于无监督的最先进基线,在依赖于高频和低频信号的边分类任务上相对改进高达 101.1%。在节点分类任务上,这对和高达 82.5% 的相对性能增益。
曲率图生成对抗网络
原文标题: Curvature Graph Generative Adversarial Networks
地址: http://arxiv.org/abs/2203.01604
作者: Jianxin Li, Xingcheng Fu, Qingyun Sun, Cheng Ji, Jiajun Tan, Jia Wu, Hao Peng
摘要: 生成对抗网络 (GAN) 被广泛用于对图数据进行广义和鲁棒的学习。然而,对于非欧几里得图数据,现有的基于GAN的图表示方法通过在离散空间中随机游走或遍历产生负样本,导致拓扑属性(例如层次结构和循环性)的信息丢失。此外,由于图数据的拓扑异质性(即跨图结构的不同密度),它们存在严重的拓扑失真问题。在本文中,我们提出了一种新的曲率图生成对抗网络方法,命名为 textbfmodelname,这是黎曼几何流形中第一个基于 GAN 的图表示方法。为了更好地保留拓扑属性,我们将离散结构近似为连续的黎曼几何流形,并从包裹的正态分布中有效地生成负样本。为了处理拓扑异质性,我们利用 Ricci 曲率来处理具有不同拓扑属性的局部结构,从而获得低失真表示。大量实验表明,CurvGAN 在多个任务中始终且显著优于最先进的方法,并显示出卓越的鲁棒性和泛化性。
一种有效的基于图学习的时间链路预测方法:WSDM Cup 2022 第一名
原文标题: An Effective Graph Learning based Approach for Temporal Link Prediction: The First Place of WSDM Cup 2022
地址: http://arxiv.org/abs/2203.01820
作者: Qian Zhao, Shuo Yang, Binbin Hu, Zhiqiang Zhang, Yakun Wang, Yusong Chen, Jun Zhou, Chuan Shi
摘要: 时间链路预测作为含时图中最重要的工作之一,引起了研究领域的广泛关注。 WSDM Cup 2022 寻求在含时图上预测时间跨度内边的存在概率的解决方案。本文介绍了竞赛中获得第一名的 AntGraph 的解决方案。我们首先通过去除时间信息来分析性能的理论上限,这意味着只有图上的结构和属性信息才能获得很好的性能。基于这个假设,然后我们介绍几个精心设计的功能。最后,在竞争数据集上进行的实验表明了我们提议的优越性,在数据集 A 上的 AUC 得分为 0.666,在数据集 B 上为 0.902,消融研究也证明了每个特征的效率。代码在 https://github.com/im0qianqian/WSDM2022TGP-AntGraph 上公开。
具有社区结构的 ABCD 随机图模型的模块化
原文标题: Modularity of the ABCD Random Graph Model with Community Structure
地址: http://arxiv.org/abs/2203.01480
作者: Bogumil Kaminski, Bartosz Pankratz, Pawel Pralat, Francois Theberge
摘要: 社区检测的人工基准 (ABCD) 图是一个随机图模型,具有社区结构和度数和社区大小的幂律分布。该模型生成的图具有与众所周知的 LFR 相似的属性,并且可以调整其主要参数 xi 以模仿其在 LFR 模型中的对应物,即混合参数 mu。在本文中,我们研究了 ABCD 模型的各种理论渐近性质。特别是,我们分析了模块化函数,可以说是社区检测中网络最重要的图属性。实际上,模块化函数通常用于衡量网络中社区结构的存在。它还在许多社区检测算法中用作质量函数,包括广泛使用的 Louvain 算法。
暴露于错误信息中的党派不对称
原文标题: Partisan Asymmetries in Exposure to Misinformation
地址: http://arxiv.org/abs/2203.01350
作者: Ashwin Rao, Fred Morstatter, Kristina Lerman
摘要: 健康错误信息被认为是导致 Covid-19 大流行期间疫苗犹豫不决的原因,这凸显了人们对社交媒体在两极分化和社会稳定中的作用的担忧。虽然先前的研究已经确定了政治党派偏见与在线错误信息共享之间的联系,但党派偏见与人们在其社会网络中看到的错误信息之间的相互作用尚未得到很好的研究。因此,我们不知道党派之争是否会导致暴露于错误信息,或者人们在暴露于事实内容的情况下选择性地分享错误信息。我们研究 Twitter 关于 Covid-19 大流行的讨论,根据政治和事实维度对用户进行意识形态分类。我们发现在分享行为和曝光方面存在党派不对称,保守派更有可能看到和分享错误信息,而温和的自由派看到最真实的内容。我们识别多维回声室,让用户接触到意识形态一致的内容;然而,政治和事实层面之间的相互作用为高度两极分化的用户——强硬派保守派和自由派——扩大错误信息创造了条件。尽管如此,与代表我们样本中大部分用户的事实内容和政治温和派相比,错误信息受到的关注较少,它们有助于过滤错误信息,减少信息生态系统中低真实性内容的数量。确定两极分化的程度以及政治意识形态如何加剧错误信息可能有助于公共卫生专家和政策制定者改进他们的信息传递以促进共识。
考虑隐私的人群标签用于机器学习任务的
原文标题: Privacy-Aware Crowd Labelling for Machine Learning Tasks
地址: http://arxiv.org/abs/2203.01373
作者: Giannis Haralabopoulos, Ioannis Anagnostopoulos
摘要: 在线社交媒体的广泛使用凸显了隐私在数字空间中的重要性。随着越来越多的科学家分析在这些平台中创建的数据,隐私问题已经扩展到学术界的数据使用。尽管文本分析是学术文献中一个有大量应用程序的有据可查的主题,但确保用户生成内容的隐私却被忽视了。大多数情感分析方法都需要情感标签,这些标签可以通过众包获得,非专家个人参与科学任务。文本本身必须暴露给第三方才能被标记。为了减少在线用户信息的暴露,我们提出了一种基于众包的针对不同应用程序的隐私保护文本标记方法。我们转换具有不同隐私级别的文本,并分析转换在标签相关性和一致性方面的有效性。我们的结果表明,隐私可以在标签中实现,保留传统标签的注释多样性和主观性。
Twitter 上 COVID-19 反疫苗话语的自动聚类
原文标题: Automated clustering of COVID-19 anti-vaccine discourse on Twitter
地址: http://arxiv.org/abs/2203.01549
作者: Ignacio Ojea Quintana, Marc Cheong, Mark Alfano, Ritsaart Reimann, Colin Klein
摘要: 关于疫苗接种的态度变得更加两极分化;在网上看到疫苗虚假信息和边阴谋论很常见。 Ojea Quintana 等人发现了 Twitter 疫苗话语的观察性研究。 (2021 年):作者分析了大约 6 个月的 Twitter 话语——2019 年 12 月至 2020 年 6 月期间的 130 万条原始推文和 1800 万条转发,范围从 Covid-19 流行之前到之后。这项工作扩展了 Ojea Quintana 等人。 (2021 年)有两个主要贡献来自数据科学。首先,基于作者最初的网络聚类和定性分析技术,我们能够清楚地划分和可视化 Antivaxxers(反疫苗接种运动者和疫苗否认者)与其他集群(统称为“其他”)在话语中使用的语言模式。其次,利用 Antivaxxers 推文的特征,我们开发了文本分类器来确定给定用户使用反疫苗接种语言的可能性,最终有助于早期预警机制改善我们的认知环境的健康并支持(而不是阻碍) ) 公共卫生倡议。
具有多个交互层的网络中同步稳定性的平均场性质
原文标题: Mean-field nature of synchronization stability in networks with multiple interaction layers
地址: http://arxiv.org/abs/2203.01673
作者: Charo I. del Genio, Sergio Faci-Lázaro, Jesús Gómez-Gardeñes, Stefano Boccaletti
摘要: 许多现实世界系统的组件之间的交互最好由具有多层的网络建模。已经提出了不同的理论来解释多层连接如何影响动态系统中同步的线性稳定性。然而,由此产生的方程在计算上是昂贵的,因此即使不是不可能,也很难为大型系统计算。为了弥合这一差距,我们为具有多个交互层的网络开发了一种同步平均场理论。通过依赖准相同层的假设,与使用实际交互架构的精确结果相比,我们获得了很高的准确性。事实上,即使对于具有非常不同层的网络,我们的理论的准确性仍然很高,因此提出了关于多层网络中同步稳定性的平均场性质的一般性问题。此外,我们的方法大大简化了计算,从而随着系统尺寸的增加提供了更好的尺度比例,并允许研究迄今为止被排除在外的系统。
SaPHyRa:一种在大型网络中对节点进行排序的学习理论方法
原文标题: SaPHyRa: A Learning Theory Approach to Ranking Nodes in Large Networks
地址: http://arxiv.org/abs/2203.01746
作者: Phuc Thai, My T. Thai, Tam Vu, Thang N. Dinh
摘要: 基于节点的中心性对节点进行排名是大规模网络中一个基本但具有挑战性的问题。近似方法可以快速估计节点的中心性并识别出最中心的节点,但对其余大多数节点的排名可能没有意义。例如,众所周知,搜索查询中鲜为人知的网站的排名是嘈杂且不稳定的。为此,我们研究了一个具有两个重要区别的新节点排序问题:a)作为主要目标的排序质量,而不是中心性估计质量; b) 仅对感兴趣的节点进行排名,例如匹配搜索条件的网站。我们提出了样本空间分区假设排名,或 SaPHyRa,它将节点排名转换为机器学习中的假设排名。这种转换将节点的中心性映射到假设的预期风险,为理论机器学习 (ML) 工具打开了大门。 SaPHyRa 的关键是将样本空间划分为精确子空间和近似子空间。确切的子空间包含与感兴趣的节点相关的样本,从而提高了估计和排名质量。可以使用基于 ML 的技术有效地对近似空间进行采样,从而为估计误差提供理论保证。最后,我们展示了 SaPHyRa_bc,这是 SaPHyRa 在排名节点的中介中心性 (BC) 上的说明。通过结合新颖的双分量采样、2 跳样本分割和改进的 Vapnik-Chervonenkis 维度边界,SaPHyRa_bc 可以有效地对 BC 中的任何节点子集进行排序。在近似 BC 方面,它的性能比最先进的方法快 200 倍,而它与地面实况的等级相关性提高了多倍。
民主治理与国际研究合作:全球科学网络的纵向分析
原文标题: Democratic Governance and International Research Collaboration: A Longitudinal Analysis of the Global Science Network
地址: http://arxiv.org/abs/2203.01827
作者: Travis A. Whetsell
摘要: 传统上,民主与科学之间的联系是通过哲学猜想和单一国家案例研究来检验的。因此,关于该主题的全球规模实证研究仍然有限。然而,有大量证据表明研究合作与科学生产力和绩效相关。此外,国际关系理论表明,民主国家更有可能通过多种方式进行合作。本研究探讨了影响全球科研合作网络动态的国家层面因素,重点关注民主治理对国际研究合作关系的形成、持久性和强度的结构性影响。本研究结合了 2008 年至 2017 年间来自各种民主项目、世界银行指标、Scopus 和 Web of Science 文献计量数据的纵向数据。分析方法包括时间和加权指数随机图模型的组合,以测试有关民主治理和全球协作模式之间联系的假设。结果表明,民主治理对国际研究合作和民主治理水平相似的国家之间的分类混合都产生了积极的显著影响。最后,结果还显示了对合作驱动因素的支持,包括外生经济、人口和地缘政治因素,以及内生网络效应,包括优先依附和传递性。
通过跨学科和基于社区的行动研究生成综合但现实的人口贩运网络用于建模干扰
原文标题: Generating Synthetic but Realistic Human Trafficking Networks for Modeling Disruptions through Transdisciplinary and Community-Based Action Research
地址: http://arxiv.org/abs/2203.01893
作者: Daniel Kosmas, Christina Melander, Emily Singerhouse, Thomas C. Sharkey, Kayse Lee Maass, Kelle Barrick, Lauren Martin
摘要: 与应用运筹学 (OR) 模型来破坏人口贩运网络相关的主要挑战之一是可供公众使用的可靠数据源数量有限,因为操作被故意隐藏以防止被发现,并且来自已知操作的数据通常不完整.为了帮助解决这一数据差距,我们通过整合 OR 概念和定性研究,为国内性交易网络提出了一个网络生成器。已对多个来源进行了三角剖分,以确保生成器生成的网络是现实的,包括执法案例文件分析、与领域专家的访谈,以及以幸存者为中心的咨询小组,拥有第一手的性交易知识。输出模拟了贩运者(所谓的“底层”)和受害者之间的关系。该生成器允许运营研究人员以负责任的方式访问现实的性交易网络结构,而不会透露相关人员的可识别细节。我们展示了使用输出网络来探索最大流量网络拦截和重组的策略建议。为此,我们提出了一种新颖的流动概念,即贩运者控制受害者的能力。我们的研究结果表明,理解性贩子如何应对干扰非常重要,尤其是在招募新受害者方面。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20220304/