- 随机游走的网络社区检测和聚类;
- 探索节点分类的边解耦;
- 使用随机游走学习复杂网络的暴露理论;
- 学者网络:学者知识图谱;
- 用于异常引文检测的深度图学习;
- 档案数据中关系发现的探索性方法;
- COVID-19 响应中的数据驱动决策:一项调查;
- 在复杂网络中利用目标搜索的意想不到的优势;
- 多策略更新规则下无标度社区网络公共品博弈合作演化;
- 流动性和 SARS-CoV-2 在比利时的空间异质传播;
- 时间网络上基于交互的传染模型表明,降低时间网络密度会降低总感染率;
- 离群成员离开时如何优化学术团队?;
- 唤醒城市:手机网络数据中的昼夜节律痕迹;
- MuMiN:大规模多语言多模式事实检查的错误信息社会网络数据集;
随机游走的网络社区检测和聚类
原文标题: Network community detection and clustering with random walks
地址: http://arxiv.org/abs/2202.11171
作者: Aditya Ballal, Willow B. Kion-Crosby, Alexandre V. Morozov
摘要: 我们提出了一种将网络节点划分为非重叠社区的新方法——这是揭示网络模块化和分层组织的关键步骤。我们的方法适用于具有加权和未加权对称边的网络,使用随机游走来探索同一社区中的相邻节点。游走似然算法 (WLA) 将网络节点最佳划分为给定数量的社区。步行似然社区查找器 (WLCF) 使用 WLA 来预测最佳社区数量和相应的网络分区。我们对这两种算法进行了广泛的基准测试,发现它们在预测分区的模块化和社区之间的链接数量方面优于或匹配其他方法。利用我们方法的计算效率,我们调查了科罗拉多州道路和十字路口的大比例地图。我们的聚类在相邻社区之间产生了地理上合理的界限。
探索节点分类的边解耦
原文标题: Exploring Edge Disentanglement for Node Classification
地址: http://arxiv.org/abs/2202.11245
作者: Tianxiang Zhao, Xiang Zhang, Suhang Wang
摘要: 现实世界图中的边通常由多种因素形成,并带有不同的关系语义。例如,社会网络中的联系可能表示友谊、同事关系或住在同一个社区。然而,由于数据收集和图形成过程,这些潜在因素通常隐藏在仅仅存在边的背后。尽管这些年来图学习发展迅速,但大多数模型采用整体方法并将所有边视为平等。解开边的一个主要困难是缺乏明确的监督。在这项工作中,通过仔细检查边模式,我们提出了三种启发式方法并设计了三个相应的借口任务来指导自动边解开。具体来说,这些自我监督任务在设计的边解缠结模块上强制执行,与下游节点分类任务联合训练,以鼓励自动边解缠结。解缠结模块的通道有望刻画可区分的关系和邻域交互,并且它们的输出被聚合为节点表示。提出的 DisGNN 很容易与各种神经架构结合,我们在 6 美元的真实世界数据集上进行了实验。实证结果表明,它可以实现显著的性能提升。
使用随机游走学习复杂网络的暴露理论
原文标题: Exposure theory for learning complex networks with random walks
地址: http://arxiv.org/abs/2202.11262
作者: Andrei A. Klishin, Dani S. Bassett
摘要: 随机游走是探索和发现复杂网络的常用模型。虽然已经提出了许多算法来绘制未知网络,但出现了一个补充问题:在已知网络中,随机游走者最有可能在有限时间内发现哪些节点和边?在这里,我们介绍了暴露理论,这是一种统计力学框架,可预测跨多种类型网络(包括加权和时间)的节点和边的学习,并表明边学习遵循通用轨迹。虽然单个节点和边的学习是嘈杂的,但暴露理论对聚合探索统计数据产生了高度准确的预测。
学者网络:学者知识图谱
原文标题: Web of Scholars: A Scholar Knowledge Graph
地址: http://arxiv.org/abs/2202.11311
作者: Jiaying Liu, Jing Ren, Wenqing Zheng, Lianhua Chi, Ivan Lee, Feng Xia
摘要: 在这项工作中,我们展示了一个新颖的系统,即 Web of Scholars,它集成了最先进的挖掘技术来搜索、挖掘和可视化计算机科学领域学者背后的复杂网络。依托知识图谱,提供快速、准确、智能的语义查询服务和强大的推荐服务。此外,为了实现信息共享,它提供了一个开放的API作为高级功能的底层架构。 Web of Scholars 利用知识图谱,这意味着如果存在更多搜索,它将能够访问更多知识。它可以作为学者在科学科学中进行深入分析的有用且可互操作的工具。
用于异常引文检测的深度图学习
原文标题: Deep Graph Learning for Anomalous Citation Detection
地址: http://arxiv.org/abs/2202.11360
作者: Jiaying Liu, Feng Xia, Xu Feng, Jing Ren, Huan Liu
摘要: 异常检测是医疗保健、金融科技和公共安全等各个关键领域中最活跃的研究领域之一。然而,很少有人关注学术数据,即引文网络中的异常检测。引文被认为是评估科学研究影响的最重要指标之一,可以通过多种方式进行博弈。因此,引文网络中的异常检测对于识别引文的操纵和膨胀具有重要意义。为理解决这个开放性问题,我们提出了一种新颖的深度图学习模型,即 GLAD(用于异常检测的图学习),以识别引文网络中的异常。 GLAD 通过图神经网络添加节点属性和链接属性,将文本语义挖掘与网络表示学习相结合。它不仅利用了引文内容的相关性,还利用了论文之间的隐藏关系。在 GLAD 框架内,我们提出了一种称为 CPU(Citation PUrpose)的算法来根据引文文本发现引文的目的。 GLAD 的性能通过模拟的异常引文数据集进行验证。实验结果证明了 GLAD 在异常引文检测任务上的有效性。
档案数据中关系发现的探索性方法
原文标题: Exploratory Methods for Relation Discovery in Archival Data
地址: http://arxiv.org/abs/2202.11361
作者: Lucia Giagnolini, Marilena Daquino, Francesca Mambelli, Francesca Tomasi
摘要: 在本文中,我们提出了一种整体方法来发现艺术史社区中的关系,并使用与艺术史学查询相关的图模式来丰富历史学家的传记和档案描述。我们使用探索性数据分析来检测模式,选择特征,并使用它们来评估分类模型以预测新关系,并在编目阶段推荐给档案管理员。结果表明,与基于研究主题或机构关系的关系相比,基于传记信息的关系可以更精确地处理。确定性和先验规则比概率方法提供更好的结果。
COVID-19 响应中的数据驱动决策:一项调查
原文标题: Data-Driven Decision Making in COVID-19 Response: A Survey
地址: http://arxiv.org/abs/2202.11435
作者: Shuo Yu, Qing Qing, Chen Zhang, Ahsan Shehzad, Giles Oatley, Feng Xia
摘要: COVID-19 已蔓延到世界各地,对我们的日常生活和工作产生了巨大影响。为了应对这一流行病,需要做出许多重要的决定来拯救全球的社区和经济。数据显然在有效决策中起着至关重要的作用。数据驱动的决策使用与数据相关的证据和见解来指导决策过程并在行动计划提交之前对其进行验证。为了更好地应对这一流行病,政府和决策机构已经调查了源自 COVID-19 的大量数据。这些数据包括与医学、知识、媒体等相关的数据。基于这些数据,制定了许多防控政策。在这份调查报告中,我们总结了数据驱动决策在应对 COVID-19 方面的进展,包括 COVID-19 预防和控制、心理咨询、经济援助、复工和学校重新开放。我们还提出了数据驱动决策中当前的一些挑战和未解决的问题,包括数据收集和质量、复杂的数据分析以及决策的公平性。这份调查报告揭示了当前以数据为驱动的政策制定,也为进一步的科学研究提供了可行的方向。
在复杂网络中利用目标搜索的意想不到的优势
原文标题: Unexpected advantages of exploitation for target searches in complex networks
地址: http://arxiv.org/abs/2202.11438
作者: Youngkyoung Bae, Gangmin Son, Hawoong Jeong
摘要: 开发普遍出现在各种决策环境中,例如动物觅食、网上冲浪、科学家研究主题的演变以及我们的日常生活。尽管它无处不在,但利用(指重新访问以前的经验的行为)通常被认为会延迟寻找目标的搜索过程。在本文中,我们通过应用非马尔可夫随机游走模型来研究利用如何影响搜索性能,其中步行者使用长期记忆随机重新访问先前访问过的节点。我们分析研究了两种广泛形式的网络结构,即(i)类团网络和(ii)类棒棒糖网络,发现利用可以显著提高类棒棒糖网络中的搜索性能,而阻碍类团组中的目标搜索网络。此外,我们通过使用价值 550 美元的多样化现实世界网络,在数值上验证了利用可以减少充分探索底层网络所需的时间。基于分析结果,我们定义了网络的棒棒糖相似度,并观察到利用优势与棒棒糖相似度之间的正相关关系。
多策略更新规则下无标度社区网络公共品博弈合作演化
原文标题: The evolution of cooperation in the public goods game on the scale-free community networks under multiple strategy updating rules
地址: http://arxiv.org/abs/2202.11482
作者: Mingzhen Zhang, Naiding Yang, Xianglin Zhu
摘要: 社会网络具有无标度的属性和社区结构,生活中的很多问题都具有资源短缺等公共品的特征。由于个体偏好不同,网络中存在采用异构策略更新规则的个体。我们研究了无标度社区网络与公共产品博弈的合作演变以及多种策略更新规则的影响。这里,考虑两种类型的策略更新规则,即成对比较规则和愿望驱动规则。进行了数值模拟并给出了相应的结果。我们发现社区结构促进了公共产品博弈中合作的出现。同时,合作者的频率与两种策略更新规则的比例呈“U”型关系。随着两个策略更新规则比例的变化,成对比较规则似乎更敏感。与愿望驱动规则相比,成对比较规则在促进合作方面发挥着更重要的作用。我们的工作可能有助于理解社会网络中合作的演变。
流动性和 SARS-CoV-2 在比利时的空间异质传播
原文标题: Mobility and the spatially heterogeneous spread of SARS-CoV-2 in Belgium
地址: http://arxiv.org/abs/2202.11528
作者: Michiel Rollier, Gisele Miranda, Jenna Vergeynst, Joris Meys, Tijs Alleman, Ellen Van De Vijver, the Belgian Collaborative Group on COVID-19 Hospital Surveillance, Ingmar Nopens, Jan Baetens
摘要: 鉴于社会互动推动了传染病在人类之间的传播,人们预计比利时的人类流动性会在 2020 年的两波“浪潮”中影响 COVID-19 的传播。对抗这种蔓延的措施反过来影响了流动模式。在这项研究中,我们分析并相互比较了比利时 43 个区(NUTS 3 级)的 COVID-19 相关数据和流动性数据的时间序列。首先,我们确认总体流动性确实在大流行的连续阶段发生了显著变化。因此,我们定义了一个表示两个区之间流动程度的量:“连通性指数”。其次,我们使用动态时间扭曲和时滞互相关分析时空 COVID-19 相关发病率和住院数据。这使我们能够量化局部波之间的时间滞后和形态相似性。第三,通过结合这些分析,我们得出结论,区之间的流动性实际上表明了 COVID-19 在比利时的时空传播,正如之前在其他欧盟国家中所展示的那样。这一结论支持在大流行期间进行流动性分析和/或控制的必要性,并由此推动了我们在空间上明确的比利时元种群模型的发展。
时间网络上基于交互的传染模型表明,降低时间网络密度会降低总感染率
原文标题: An interaction-based contagion model over temporal networks demonstrates that reducing temporal network density reduces total infection rate
地址: http://arxiv.org/abs/2202.11591
作者: Alex Abbey, Yanir Marmor, Yuval Shahar, Osnat Mokryn
摘要: 接触者的时间顺序和动态,例如他们的顺序和时间,对于理解传染病的传播至关重要。使用保留路径的时间网络,我们评估了空间豆荚(社交距离豆荚)和时间豆荚(会议率降低)对疾病传播的影响。我们使用我们为 COVID-19 实例化的交互驱动的传染模型,通过历史维护随机时间网络以及现实世界的接触。我们发现时间豆荚显著减少了感染个体的总数并减缓了疾病的传播。这个结果在不断变化的初始条件下是稳健的,例如初始患者的数量和位置。社交距离(空间)吊舱仅在疾病的初始阶段表现良好,即初始患者数量最少。使用现实生活中的联系信息并扩展我们的交互驱动模型以考虑暴露,我们证明了降低时间密度对总体感染率的有益影响。我们进一步表明,在密集拓扑中,缓慢传播的病原体几乎与快速传播的病原体一样传播。我们的研究结果表明,在相同的传播水平下,疾病的发病率和在密度较低的网络中的传播会降低。因此,降低相遇率比保持社交距离更有效。
离群成员离开时如何优化学术团队?
原文标题: How to optimize an academic team when the outlier member is leaving?
地址: http://arxiv.org/abs/2202.11608
作者: Shuo Yu, Jiaying Liu, Feng Xia, Haoran Wei, Hanghang Tong
摘要: 学术团队是由学者组成的高度凝聚的协作群体,已被公认为从质量和数量两方面提高科学产出的有效途径。然而,高员工流动带来了一系列问题,可能对团队绩效产生负面影响。为了应对这一挑战,我们首先检测可能离开的成员的趋势。这里的异常值是根据熟悉度定义的,它是通过使用协作强度来量化的。假设如果团队成员对团队外的学者有较高的熟悉度,那么该成员可能会离开团队。为了尽量减少这种离群成员离开造成的影响,我们提出了一种优化解决方案,以找到可以替换离群成员的合适候选人。基于图核随机游走,我们的解决方案涉及熟悉度匹配、技能匹配以及结构匹配。当应用于计算机科学学术团队时,所提出的方法被证明是有效的并且优于现有方法。
唤醒城市:手机网络数据中的昼夜节律痕迹
原文标题: Awakening City: Traces of the Circadian Rhythm within the Mobile Phone Network Data
地址: http://arxiv.org/abs/2202.11620
作者: Gergő Pintér, Imre Felde
摘要: 在这项研究中,覆盖匈牙利布达佩斯的呼叫详细记录 (CDR) 已经过处理,以分析用户的昼夜节律。引入一个称为唤醒时间的指标来描述一组订阅者的行为。它被定义为一个群体的手机活动在早上上升的时间。它的对应物是活动在晚上进行的时间。还介绍了居民和基于区域的聚合。前者是考虑居住在一个地区的人,后者是用一个地区的交通活动来描述城市一部分的行为。商场的营业时间和派对区的夜生活被用来演示这个应用程序,作为现实生活中的例子。建议的方法还用于估算工作场所的工作时间。研究结果与匈牙利的实践非常吻合,也支持工作场所检测方法。发现起床时间与流动性指标(熵、回转半径)之间存在负相关:在工作日,人们起得更早,出行更多,而在节假日则恰恰相反。唤醒时间在不同的社会经济阶层中进行了评估,也使用了房价和手机价格。结果发现,社会经济地位较低的群体往往起得更早。
MuMiN:大规模多语言多模式事实检查的错误信息社会网络数据集
原文标题: MuMiN: A Large-Scale Multilingual Multimodal Fact-Checked Misinformation Social Network Dataset
地址: http://arxiv.org/abs/2202.11684
作者: Dan Saattrup Nielsen, Ryan McConville
摘要: 错误信息在社交媒体和新闻文章中变得越来越普遍。它已经变得如此普遍,以至于我们需要利用机器学习来检测此类内容的算法辅助。训练这些机器学习模型需要足够规模、多样性和质量的数据集。然而,自动错误信息检测领域的数据集主要是单语的,包括有限数量的模式,并且规模和质量都不够。针对这个问题,我们开发了一个数据收集和链接系统 (MuMiN-trawl),以构建一个公共错误信息图数据集 (MuMiN),其中包含丰富的社交媒体数据(推文、回复、用户、图像、文章、主题标签),涵盖 2100 万条推文属于 26,000 个 Twitter 线程,每个线程都在语义上与 13,000 个经过事实检查的声明相关联,涉及 41 种不同语言的数十个主题、事件和领域,跨越十多年。该数据集通过 Python 包 (mumin) 以异构图的形式提供。我们提供了与涉及社交媒体的声明的真实性相关的两个节点分类任务的基线结果,并证明这些是具有挑战性的任务,这两个任务的最高宏观平均 F1 分数分别为 62.55% 和 61.45%。 MuMiN 生态系统可在 https://mumin-dataset.github.io/ 获得,包括数据、文档、教程和排行榜。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20220224/