Arxiv网络科学论文摘要7篇(2021-11-10)

  • 用于识别高特征向量中心节点的无监督学习:一种图神经网络方法;
  • 用于多级链路预测的高阶联合嵌入;
  • 使用低维网络嵌入算法的社区检测;
  • 使用吸收随机游走的惰性编码的元数据进行社区检测;
  • 一组从手机数据中估计人口数量的R包;
  • 学术超文本的多模态可理解性:文献记录者的贡献。科学编辑过程中串行文件化所需的协作;
  • Twitter 中的事件检测:基于内容和时间的分析;

用于识别高特征向量中心节点的无监督学习:一种图神经网络方法

原文标题: Unsupervised Learning for Identifying High Eigenvector Centrality Nodes: A Graph Neural Network Approach

地址: http://arxiv.org/abs/2111.05264

作者: Appan Rakaraddi, Mahardhika Pratama

摘要: 现有的计算特征向量中心性 (EC) 的方法往往不够健壮,无法在低时间复杂度下确定 EC,或者对于大型网络不能很好地扩展,因此使它们实际上不可靠/计算成本高。因此,开发一种在低计算时间下可扩展的方法至关重要。因此,我们提出了一种深度学习模型来识别具有高特征向量中心性的节点。之前已经有一些使用监督学习方法识别高排名节点的工作,但在现实世界的情况下,图没有标记,因此监督学习方法的部署成为一种危险,其使用变得不切实际。因此,我们设计了 CUL(无监督学习的中心性)方法来以无监督的方式学习网络中的相对 EC 分数。为了实现这一点,我们开发了一个基于编码器-解码器的框架,将节点映射到它们各自估计的 EC 分数。在不同的合成和现实世界网络上进行了广泛的实验。我们将 CUL 与类似于过去的一些工作的 EC 估计基线监督方法进行了比较。据观察,即使在极少量的训练数据集上进行训练,CUL 在识别排名较高的节点时也比其监督节点提供了相对更好的准确度分数。我们还表明,与传统的 EC 计算基线方法相比,CUL 速度更快,运行时间更短。代码可在 https://github.com/codexhammer/CUL 获得。

用于多级链路预测的高阶联合嵌入

原文标题: High-order joint embedding for multi-level link prediction

地址: http://arxiv.org/abs/2111.05265

作者: Yubai Yuan, Annie Qu

摘要: 链路预测从观察到的网络中推断出潜在的链接,是网络分析中的基本问题之一。与仅预测双向成对关系的传统图表示建模相比,我们提出了一种新的基于张量的联合网络嵌入方法,将成对链接和超链接同时编码到潜在空间上,该方法刻画了成对和多向链接之间的依赖关系推断潜在的未观察到的超链接。所提出的嵌入程序的主要优点是它结合了节点之间的成对关系和子组结构以刻画更丰富的网络信息。此外,所提出的方法在链接之间引入了层次依赖性以推断潜在的超链接,并导致更好的链路预测。理论上,我们为所提出的嵌入方法建立了估计一致性,并且与仅使用成对链接或超链接的链路预测相比,提供了更快的收敛速度。对模拟设置和 Facebook 自我网络的数值研究表明,与现有的链路预测算法相比,所提出的方法提高了超链接和成对链路预测的准确性。

使用低维网络嵌入算法的社区检测

原文标题: Community detection using low-dimensional network embedding algorithms

地址: http://arxiv.org/abs/2111.05267

作者: Aman Barot, Shankar Bhamidi, Souvik Dhara

摘要: 随着大型网络在重要领域的相关性越来越大,例如研究疾病传播的接触网络,或研究社会网络对地缘政治的影响,有必要研究可扩展到超大型网络的机器学习工具,通常包含数百万个节点。此类可扩展算法的一大类被称为网络表示学习或网络嵌入。这些算法尝试通过首先运行多个随机游走,然后使用观察到的随机游走段中每对节点的共现次数来学习网络功能(例如~节点)的表示,以获得某些节点上的低维表示。欧几里得空间。本文的目的是严格理解两种主要算法 DeepWalk 和 node2vec 在为具有真实社区的规范网络模型恢复社区方面的性能。根据图的稀疏性,我们找到了所需的随机游走段的长度,以便相应的观察到的共现窗口能够执行基本社区分配的几乎精确恢复。我们证明,给定一些固定的共现窗口,与使用简单随机游走的 DeepWalk 相比,使用具有低非回溯概率的随机游走的 node2vec 可以成功用于更稀疏的网络。此外,如果稀疏参数很低,我们提供的证据表明这些算法可能无法在几乎精确的恢复中取得成功。该分析需要开发通用工具,用于对具有潜在低秩结构的随机网络进行路径计数,这些网络具有独立的兴趣。

使用吸收随机游走的惰性编码的元数据进行社区检测

原文标题: Metadata-informed community detection with lazy encoding using absorbing random walks

地址: http://arxiv.org/abs/2111.05158

作者: Aleix Bassolas, Anton Eriksson, Antoine Marot, Martin Rosvall, Vincenzo Nicosia

摘要: 整合结构信息和元数据,如性别、社会地位或兴趣,丰富了网络,并能够更好地理解复杂系统的大规模结构。然而,现有的元数据集成方法只考虑直接相邻的节点,因此无法识别和利用元数据与网络结构之间的长期相关性,这是许多空间和社会系统的典型特征。在这里,我们展示了基于流的社区检测方法如何整合网络信息和远程元数据,提供更细致入微的网络结构和相关性图片。我们使用地图方程框架分析社会和空间网络,发现我们的方法可以检测到不同现实世界系统中的各种有用的元数据通知分区。该框架为系统地将元数据纳入网络分析铺平了道路。

一组从手机数据中估计人口数量的R包

原文标题: A set of R packages to estimate population counts from mobile phone data

地址: http://arxiv.org/abs/2111.05269

作者: Bogdan Oancea, David Salgado, Luis Sanguiao Sande, Sandra Barragan

摘要: 在本文中,我们描述了在 ESSnet 大数据 II 项目期间旨在将手机数据纳入当前官方统计数据生产链的方法框架的软件实现。我们概述了软件堆栈的架构、其组件、它们之间的接口,并展示了如何使用它们。我们的软件实现由四个 R 包组成:用于估计移动设备空间分布的 destim、用于将设备分类为与其所有者 1:1 或 2:1 对应的重复数据删除、用于估计个体数量的聚合由网络从地理定位概率和重复概率和推理开始,该推理将先前软件包提供的个人数量与其他信息(如来自官方登记册的人口计数和移动运营商渗透率)相结合,以提供对目标的估计人口数。

学术超文本的多模态可理解性:文献记录者的贡献。科学编辑过程中串行文件化所需的协作

原文标题: Multimodal intelligibility of scholarly hypertext: the documentalist’s contribution. A required collaboration for serial documentisation in the scientific editorial process

地址: http://arxiv.org/abs/2111.05039

作者: Gérald Kembellec (DHIP = IHA, DICEN-IDF)

摘要: 这篇文章表明,编辑和在线出版行业之间的界限正在失去力量。在这种情况下,只有更新超文本的记录方式才有意义,尤其是面对 Web 的发展。我们特别考虑了棘手的学者超文本记录过程——特别是非科学或文化背景。本文的目的是证明,考虑到 Web 的众多分支,质量文档的超文本增强只能通过作者、编辑和广播公司之间的适当对话来完成。这将使读者满意,因为他们可以获得适当的信息。还将表明,在这个编辑-编辑过程中的每个参与者都是赢家。事实上,定性的正规化工作将与强大的广播范围相结合。最后,我们将指出,这种中介工作必须由信息交流的参与者领导,以使人和机器都能理解文本。这种冥想行为在这里被指定为系列纪录片。

Twitter 中的事件检测:基于内容和时间的分析

原文标题: Event Detection in Twitter: A Content and Time-Based Analysis

地址: http://arxiv.org/abs/2111.05274

作者: Izzat Alsmadi, Michael O’Brien

摘要: 从在线社会网络中检测事件是一个最近不断发展的领域,它吸引了来自不同学科和领域的研究人员。在这里,我们报告了用于预测事件的时间序列分析。特别是,我们评估了词项的前 n-gram 随时间的频率分布,重点关注两个指标:短期和长期内的高频 n-gram。这两个指标都可以指事件发展的某些方面。为了评估模型检测事件的准确性,我们构建并使用了 Twitter 数据集,其中包含最流行的标签,这些标签围绕着 2015 年底密苏里大学 (Mizzou) 发生的有据可查的抗议活动。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20211110/