- 用于多层网络中社区检测的类Louvain方法;
- 基于边的随机块模型统计推断;
- 通过边概率顺序推理选择图模型;
- 图空间:同时使用几何和概率结构来评估统计图模型;
- 链接重叠影响多重网络上的意见动态:自旋模型方法;
- 通过网络拓扑暴露个体差异;
- 世界线和社会网络;
- 为什么事后同行评审鼓励高风险研究,而事前评审则不鼓励高风险研究;
- 科学影响的随机建模;
- 用于选择集生成和选择建模中备选方案的隐式感知的变分自编码器方法;
- 寻找星际文明对人类生存和旅行速度的先前估计的影响;
- 趋势、政治、情绪和错误信息:理解人们在 COVID-19 早期的反应;
- 人机协作推文的细粒度地理位置预测;
- 带有缺失邻居生成的子图联合学习;
- 通过蒙特卡罗马尔可夫链算法统一建模流行病耦合动力学;
- 具有环路的配水网络的增长模型;
用于多层网络中社区检测的类Louvain方法
原文标题: Louvain-like Methods for Community Detection in Multi-Layer Networks
地址: http://arxiv.org/abs/2106.13543
作者: Sara Venturini, Andrea Cristofari, Francesco Rinaldi, Francesco Tudisco
摘要: 在许多复杂系统中,实体通过嵌入不同关系的复杂模式相互交互,从而生成具有多层次和/或多种类型边的网络。当试图提高我们对这些复杂网络的理解时,在分析中明确考虑多层连接是至关重要的。在本文中,我们专注于检测多层网络中的社区结构,即检测层间共享的连接良好的节点组,这是一项非常流行的任务,带来了许多有趣的问题和挑战。在这种情况下,大多数可用的算法要么将多层网络简化为单层网络,要么尝试通过使用共识聚类来扩展单层网络的算法。无论如何,这些方法最近都受到了批评。它们确实忽略了不同层之间的连接,因此精度较低。为了克服这些问题,我们提出了基于定制的类似 Louvain 策略的新社区检测方法,该策略同时处理多个层。我们考虑信息丰富的情况,其中所有层都显示社区结构,以及嘈杂的情况,其中某些层仅向系统添加噪声。我们报告了关于人工和现实世界网络的实验,显示了所提出策略的有效性。
基于边的随机块模型统计推断
原文标题: Edge based stochastic block model statistical inference
地址: http://arxiv.org/abs/2106.13571
作者: Louis Duvivier, Rémy Cazabet, Céline Robardet
摘要: 图中的社区检测通常依赖于临时算法,没有关于它们定义为最佳的节点分区的明确规范,这会导致无法解释的社区。随机块模型 (SBM) 提供了一个框架来严格定义社区,并使用统计推理方法检测它们以区分结构与随机波动。在本文中,我们介绍了基于边采样的 SBM 的替代定义。我们从这个定义中推导出一个质量函数来统计推断用于生成给定图的节点分区。然后我们在合成图和 zachary 空手道俱乐部网络上对其进行测试。
通过边概率顺序推理选择图模型
原文标题: Graph model selection by edge probability sequential inference
地址: http://arxiv.org/abs/2106.13579
作者: Louis Duvivier, Rémy Cazabet, Céline Robardet
摘要: 图广泛用于描述由许多交互组件组成的系统,并用于理解它们交互的结构。存在各种统计模型,将这种结构描述为约束和随机性组合的结果。 %模型选择技术需要自动识别最佳模型,以及给定图的最佳参数集。为此,大多数作者依赖于最小描述长度范式,并通过考虑图集合上定义的概率分布的熵将其应用于图。在本文中,我们介绍了边概率顺序推理,这是一种执行模型选择的新方法,它依赖于边集成的概率分布。从理论的角度来看,我们表明这种方法为相对于现有技术的统计推断提供了更一致的基础,因为它依赖于随机变量的多次实现。它还可以更好地保证防止过度拟合,因为它可以将模型的参数数量降低到低于观测值的数量。通过实验,我们在两种情况下说明了这种方法的好处:推断随机块模型的分区,并为随机块模型和配置模型之间的给定图识别最相关的模型。
图空间:同时使用几何和概率结构来评估统计图模型
原文标题: Graph space: using both geometric and probabilistic structure to evaluate statistical graph models
地址: http://arxiv.org/abs/2106.13587
作者: Louis Duvivier, Rémy Cazabet, Céline Robardet
摘要: 统计图模型旨在将图建模为一组可能图之间的随机实现。一个问题是评估一个图是否可能是由一个特定模型生成的。在本文中,我们介绍了编辑距离期望值(EDEV),并将其与其他方法如熵和到重心的距离进行了比较。我们表明,与它们相反,EDEV 能够区分对于模型具有典型结构的图和不具有典型结构的图。最后,我们引入了一种基于此距离的统计假设检验方法,以评估候选模型与观察图的相关性。
链接重叠影响多重网络上的意见动态:自旋模型方法
原文标题: Link overlap influences opinion dynamics on multiplex networks: spin model approach
地址: http://arxiv.org/abs/2106.13600
作者: Cook Hyun Kim, Minjae Jo, J. S. Lee, G. Bianconi, B. Kahng
摘要: 考虑一个由两层构成的表示社交互动的多重网络:第一层是友谊网络,第二层是业务关系网络。在这个双工网络中,每一对个体可以以不同的方式连接:他们可以通过友谊连接但不能通过业务关系连接,他们可以通过业务关系连接而不是朋友,或者他们可以同时是朋友和在业务关系。在后一种情况下,我们说不同层中的链接重叠。这三种类型的连接称为多链路,多度表示与给定节点相关的给定类型的多链路总和。以前在多层网络上形成意见的模型大多忽略了链接重叠的影响。在这里,我们表明链接重叠可以对意见形成产生重要影响。事实上,新出现的意见形成模式会受到多链接的统计特性的显著影响,特别是多度分布。为了定量解决这个问题,我们研究了一个简单的自旋模型,称为 Ashkin-Teller 模型,包括不同层节点之间的 2 体和 4 体相互作用。在这里,我们充分研究了该模型的丰富相图,其中包括多种相变 (PT)。实际上,相位图或模型显示连续、不连续、连续不连续和混合 PT。
通过网络拓扑暴露个体差异
原文标题: Exposing individual differences through network topology
地址: http://arxiv.org/abs/2106.13672
作者: Yuval Samoilov-Katz, Yoram Louzoun, Lev Muchnik, Adam Zaidel
摘要: 包括人类在内的社会动物具有广泛的人格特征,可用于预测个体的行为反应和决策。目前量化人类个体个性特征的方法依赖于自我报告问卷,这需要时间和精力来收集并依赖于积极合作。然而,个性差异自然地体现在社交互动中,例如在线社会网络。在这里,我们证明了在线社会网络的拓扑结构可用于表征其成员的个性特征。我们分析了 LiveJournal (LJ) 博客平台用户形成的有向社交图谱。从他们自我报告的兴趣领域 (DOI) 推断出的个人用户个性特征与他们的网络测量相关。通过拓扑相似性对 DOI 进行的经验聚类揭示了两个主要的自出现 DOI 组,它们与人格元特征的可塑性和稳定性一致。紧密度是网络中心性的全局拓扑度量,对于与可塑性(相对于稳定性)相关的博主而言,紧密度要高得多。与亲密度相关的本地网络母题(由 3 个连接的博主组成的三合会)也分离了人格元特征。最后,基于拓扑的 DOI 分类(不分析博客内容)达到了 > 70% 的准确率(测试集的平均 AUC)。这些结果表明,个性特征在网络拓扑中是明显且可检测的。这对用户隐私有严重影响。但是,如果负责任地使用,个性特征的网络识别可以帮助在人群层面及早识别与健康相关的风险。
世界线和社会网络
原文标题: Worldlines and social networks
地址: http://arxiv.org/abs/2106.13708
作者: Laszlo Jenkovszky
摘要: 熟悉的物理定律被应用于研究人际关系,由他们的世界线(worldlines,WLs)结合社会网络建模。我们专注于任何社会中最简单、最基本的元素:已婚夫妇,由于吸引力和排斥之间的动态平衡而稳定。通过构建世界线/世界表,我们得到了一个两级坐标系:一个描述了一个类似字符串的二进制系统(这里是一对已婚夫妇)的行为,另一个是外部的,对应于这对夫妇在介质,其中嵌入了世界线,在那里扫过一条线状的薄片或膜。该方法通过世界线/表格的简单示例(半定量玩具模型)进行说明,对进一步扩展、完善和概括开放。世界线 (WL) 与社会网络 (SN) 相结合。我们的创新在于将基本物理定律、吸引力和排斥力应用于人类行为。附有来自直觉和/或观察的经验输入的简单说明性示例。这是初步尝试,对无限应用开放。
为什么事后同行评审鼓励高风险研究,而事前评审则不鼓励高风险研究
原文标题: Why ex post peer review encourages high-risk research while ex ante review discourages it
地址: http://arxiv.org/abs/2106.13282
作者: Kevin Gross, Carl T. Bergstrom
摘要: 同行评议是当代科学不可或缺的组成部分。虽然同行评审将注意力集中在有前途和有趣的科学上,但它也鼓励科学家以牺牲其他人为代价来追求一些问题。在这里,我们使用来自预测评估的想法来研究两种同行评审模式——对未来工作提案的事前评审和对已完成科学的事后评审——如何激励科学家支持某些问题而不是其他问题。我们的主要结果是事前和事后同行评审将调查人员推向不同的科学问题集。之所以会出现这种紧张关系,是因为事后审查允许研究人员利用自己的科学信念来产生其他人会发现令人惊讶的结果,而事前审查则不然。此外,事前审查将有利于不同的研究问题,这取决于审查者是根据自己的个人信念还是同行的信念的变化对提案进行排名。事前审查和事后审查之间的紧张关系使研究人员陷入困境,因为大多数研究人员需要找到能够同时存在的项目。通过解开这两种审查模式之间的紧张关系,我们可以理解它们如何塑造科学的格局以及同行审查的变化如何将科学活动转向不可预见的方向。
科学影响的随机建模
原文标题: Stochastic modeling of scientific impact
地址: http://arxiv.org/abs/2106.13295
作者: M.V. Simkin
摘要: 最近的研究发现,精选科学家在高被引论文中所占的比例不成比例。研究人员推断,如果科学上的成功是随机的,并且引入了一个隐藏参数 Q 或才能来解释这一发现,那么这种情况就不会发生。因此,才华横溢的高 Q 科学家发表了许多高影响力的论文。在这里,我展示了旧的随机引用复制模型的升级也可以解释这一发现。在新模型中,所有论文的引用复制概率并不相同,而是与其作者所有论文的引用总数的对数成正比。模型的数值模拟给出的结果与 Q-factor 文章的实证结果相似。
用于选择集生成和选择建模中备选方案的隐式感知的变分自编码器方法
原文标题: A variational autoencoder approach for choice set generation and implicit perception of alternatives in choice modeling
地址: http://arxiv.org/abs/2106.13319
作者: Rui Yao, Shlomo Bekhor
摘要: 本文推导了具有替代方案的隐式可用性/感知(IAP)的广义极值(GEV)模型,并提出了一种用于选择集生成和替代方案的隐式感知的变分自编码器(VAE)方法。具体来说,带有 IAP 的交叉嵌套 logit (CNL) 模型是作为 IAP-GEV 模型的一个例子推导出来的。 VAE 方法适用于对选择集生成过程进行建模,在该过程中,感知选择集中的备选方案的可能性最大化。使用真实数据集举例说明了用于路线选择集生成的 VAE 方法。与多项 logit 模型和传统的选择集生成方法相比,IAP-CNL 模型估计在拟合优度和预测性能方面具有最佳性能。
寻找星际文明对人类生存和旅行速度的先前估计的影响
原文标题: Implications of a search for intergalactic civilizations on prior estimates of human survival and travel speed
地址: http://arxiv.org/abs/2106.13348
作者: S. Jay Olson, Toby Ord
摘要: 我们提出了一个模型,其中一定比例的外星文明随时间均匀扩展以达到宇宙学规模。然后我们问,如果天空调查发现零个、一个或多个这样的文明,人类可以推断出什么。我们展示了这项调查的结果,结合一种称为自我指示假设 (SIA) 的人类学方法,将如何改变任何先前对两个数量的估计:1) 像我们这样的技术文明幸存下来并开始这种扩张的机会, 和 2) 它可以扩展的最大可行速度。 SIA 对两者都给出了悲观的估计,但调查结果(甚至是无效结果)可以扭转一些影响。
趋势、政治、情绪和错误信息:理解人们在 COVID-19 早期的反应
原文标题: Trends, Politics, Sentiments, and Misinformation: Understanding People’s Reactions to COVID-19 During its Early Stages
地址: http://arxiv.org/abs/2106.13385
作者: Omar Abdel Wahab, Ali Mustafa, André Bertrand Abisseck Bamatakina
摘要: COVID-19 的突然爆发导致在不同的社交媒体平台上共享了大量数据。对这些数据进行分析和可视化无疑对于深入理解大流行对人们生活的影响及其反应至关重要。在这项工作中,我们进行了大规模的时空数据分析研究,以理解人们在 COVID-19 大流行早期的反应。特别是,我们分析了一个基于 JSON 的数据集,该数据集是在 4 个月内从关于 COVID-19 的英文新闻/消息/板/博客中收集的,总共有 520 万个帖子。这些数据是从 2019 年 12 月至 2020 年 3 月从 Facebook、LinkedIn、Pinterest、StumbleUpon 和 VK 等多个社交媒体平台收集的。我们的研究主要旨在理解 COVID-19 的哪些影响最引起社交媒体用户的兴趣,以及它们随时间的变化、错误信息的时空分布以及大流行期间公众对公众人物的看法。我们的结果可以被多方(例如,政府、心理学家等)用来做出更有用的决策,同时考虑到人们的实际利益和意见。
人机协作推文的细粒度地理位置预测
原文标题: Fine-grained Geolocation Prediction of Tweets with Human Machine Collaboration
地址: http://arxiv.org/abs/2106.13411
作者: Florina Dutt, Subhajit Das
摘要: Twitter 是一种有用的资源,可用于分析人们对各种主题的看法。通常,这些主题与发布这些推文的位置相关或相关联。例如,餐馆老板可能需要根据与食品相关的帖子的情绪理解他们的目标客户在哪里吃饭,政策规划者可能需要分析公民对相关问题(例如犯罪、安全、拥堵等)的看法。关于城市、县或州的特定部分。尽管很有希望,但被抓取的推文帖子中只有不到 1% 带有地理位置标签。这使得准确预测非地理标记推文的推文帖子对于分析各个领域的数据非常关键。在这项研究中,我们利用数以百万计的 Twitter 帖子和最终用户领域的专业知识,使用自然语言处理 (NLP) 技术构建了一组深度神经网络模型,以预测不同粒度级别的非地理标记推文帖子的地理位置例如邻里、邮政编码和经度与纬度。通过多个神经架构实验和协作人机工作流程设计,我们正在进行的地理定位检测工作显示出有希望的结果,使最终用户能够将选择变量与位置信息之间的关系关联起来。
带有缺失邻居生成的子图联合学习
原文标题: Subgraph Federated Learning with Missing Neighbor Generation
地址: http://arxiv.org/abs/2106.13430
作者: Ke Zhang, Carl Yang, Xiaoxiao Li, Lichao Sun, Siu Ming Yiu
摘要: 图因其对现实世界对象及其交互的独特表示而被广泛用于数据挖掘和机器学习。随着现在图变得越来越大,经常会看到它们的子图被单独收集并存储在多个本地系统中。因此,很自然地考虑子图联邦学习设置,其中每个本地系统持有一个小子图,该子图可能与整个图的分布有偏差。因此,子图联邦学习旨在协作训练强大且可推广的图挖掘模型,而无需直接共享其图数据。在这项工作中,针对子图联邦学习的新颖而现实的设置,我们提出了两种主要技术:(1)FedSage,它训练基于 FedAvg 的 GraphSage 模型以在多个局部子图上集成节点特征、链接结构和任务标签; (2) FedSage+,它沿着 FedSage 训练一个缺失的邻居生成器来处理跨本地子图的缺失链接。具有合成子图联合学习设置的四个真实世界图数据集的实证结果证明了我们提出的技术的有效性和效率。同时,对它们在全局图上的泛化能力产生了一致的理论意义。
通过蒙特卡罗马尔可夫链算法统一建模流行病耦合动力学
原文标题: Unified modelling of epidemics by coupled dynamics via Monte-Carlo Markov Chain algorithms
地址: http://arxiv.org/abs/2106.13463
作者: Frédéric Protin (IMT), Martel Jules, Duc Thang Nguyen, Hang T.T. Nguyen, Charles Piffault, Willy Rodríguez, Susely Figueroa Iglesias, Tat Dat Tô, Wilderich Tuschmann, Hông Vân Lê, Tenan Yeo, Tien Zung Nguyen
摘要: 为了预测流行病的时间动态,我们提出了一个离散随机模型,该模型统一和概括了以前对该主题的方法。将具有给定健康状态属性的给定个体或群体视为生活在图的节点中并在其之间移动,我们使用蒙特卡洛马尔可夫链技术根据给定概率模拟个体的运动和健康状态变化已预先分配给每个节点的停留时间。我们利用这个模型来及时捕捉和预测流行病的未来地理演变,或者在被划分为同质亚群的异质人群中流行病的演变,或者更一般地说,它在组合或叠加中的演变前两个上下文。我们还证明,当人口规模增加并满足自然假设时,与我们的模型相关的随机过程会收敛到确定性过程。实际上,当离散模型中使用的时间步长收敛到零时,在极限情况下,该确定性过程由微分方程驱动,该微分方程产生作为时间函数的感染人数期望值的演变。在论文的第二部分,我们应用我们的模型来研究 Covid-19 流行病的演变。我们将产生感染个体数量的函数推导出为“小波”,这允许及时跟踪每个亚群内感染数量的期望值。在这个框架内,我们还讨论了多个流行病波发生的可能原因。
具有环路的配水网络的增长模型
原文标题: A growth model for water distribution networks with loops
地址: http://arxiv.org/abs/2106.13519
作者: Kashin Sugishita, Noha Abdel-Mottaleb, Qiong Zhang, Naoki Masuda
摘要: 随着时间的推移,供水网络 (WDN) 扩大了其服务区域。人们对这些增长动态知之甚少。 WDN 的一个方面是它们通常具有循环,闭合循环可能是增强其稳健性和效率的重要功能过程。我们为 WDN 提出了一种增长模型,该模型生成具有循环的网络,适用于具有多个水源的网络。我们将所提出的模型应用于四个经验 WDN,以表明它产生的网络结构与经验 WDN 的结构相似。经验 WDN 和建模 WDN 之间的比较表明,经验 WDN 实现了成本、效率和稳健性之间的合理平衡。我们还研究了基于生物正反馈机制的管径设计。具体来说,我们应用了一个受 Physarum polycephalum 启发的模型来发现经验和模型管道直径之间的适度正相关。这一结果表明,经验 WDN 中的管道直径分布比均匀随机分布更接近最佳分布。然而,经验管道直径和模型管道直径之间的差异表明,我们可以通过遵循生物流网络的组织原则来提高 WDN 的性能。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20210628/