- Residual2Vec:使用随机图的去偏图嵌入;
- 具有异质性的随机时间网络模型中的有向渗流;
- 跨平台关注被撤稿的动态:普遍性、观众怀疑和撤稿时间;
- 异构网络上的个人与社会利益;
- 基于生成根森林的角色相似度度量;
- ACE-HGNN:自适应曲率探索双曲图神经网络;
- 带噪声信息的网络级联的最快推理;
- 高等教育对社会分层影响的多主体描述;
- 古典音乐和声码字频率分布中的对数正态、幂律和双幂律;
Residual2Vec:使用随机图的去偏图嵌入
原文标题: Residual2Vec: Debiasing graph embedding with random graphs
地址: http://arxiv.org/abs/2110.07654
作者: Sadamori Kojaku, Jisung Yoon, Isabel Constantino, Yong-Yeol Ahn
摘要: 图嵌入将图映射到方便的向量空间表示,用于图分析和机器学习应用。许多图嵌入方法取决于基于随机游走的上下文节点的采样。然而,由于图的结构特性,随机游走可能是一个有偏差的采样器。最值得注意的是,随机游走会受到每个节点的度数的影响,其中一个节点的采样与其度数成正比。这种偏见的含义尚不清楚,特别是在图表示学习的背景下。在这里,我们研究了随机游走偏差对图嵌入的影响,并提出了残差 嵌入,这是一种通用的图嵌入方法,可以通过使用随机图消除图中的各种结构偏差。我们证明了这种去偏不仅提高了链路预测和聚类性能,而且还允许我们在图嵌入中明确地对显著的结构特性进行建模。
具有异质性的随机时间网络模型中的有向渗流
原文标题: Directed Percolation in Random Temporal Network Models with Heterogeneities
地址: http://arxiv.org/abs/2110.07698
作者: Arash Badie-Modiri, Abbas K. Rizi, Márton Karsai, Mikko Kivelä
摘要: 时间网络的事件图表示表明时间结构的连通性可以映射到有向渗透问题。然而,类似于静态网络上的渗透理论,这种映射在时间网络的结构和相互作用动力学由其局部特性决定的近似下是有效的,否则,它是最大随机的。我们挑战了这些条件,并证明了这种映射在更复杂系统的情况下的稳健性。我们使用数值模拟和有限尺寸尺度方法系统地分析随机和规则网络拓扑以及由突发更新或自激过程驱动的异构链路激活过程。我们发现表征时间网络的临界渗流指数对许多结构和动态网络异质性不敏感,而它们恢复了表征低维晶格上有向渗流的已知标度指数。虽然不可能证明这种映射对所有时间网络模型的有效性,但我们的结果建立了第一批支持时间网络有限时间可达性中尺度关系鲁棒性的证据。
跨平台关注被撤稿的动态:普遍性、观众怀疑和撤稿时间
原文标题: Dynamics of Cross-Platform Attention to Retracted Papers: Pervasiveness, Audience Skepticism, and Timing of Retractions
地址: http://arxiv.org/abs/2110.07798
作者: Hao Peng, Daniel M. Romero, Emőke-Ágnes Horvát
摘要: 被撤回的论文在正式撤回之前通常会在社交媒体、在线新闻媒体和其他网站上广泛传播。撤回论文中潜在的不准确或误导性结果的传播可能会损害科学界和公众。在这里,我们量化了不同在线平台(从社交媒体到知识库)随时间推移收到的 3,985 篇撤稿论文的关注量和类型。与一组未撤回的控制论文相比,我们表明撤回的论文在发表后受到更多关注。这种趋势似乎在新闻媒体和知识库中更为明显。这一发现表明,不可信的研究甚至渗透到精心策划的平台上,并且经常不加批判地分享,放大了对公众的负面影响。与此同时,我们发现 Twitter 上的帖子倾向于表达更多关于撤回的不确定性,而不是控制论文,这表明这些帖子可以帮助识别潜在的有缺陷的科学发现。我们还发现,在论文被撤稿前后,论文产生的讨论主要是关于撤稿事件而不是论文结果,这表明此时论文已经完全关注他们的发现,并突出了撤稿的有限影响减少不加批判的谈话。我们的研究结果揭示了在不同在线平台上讨论撤回论文的程度,并大规模确定受众对它们的怀疑态度。他们还表明,撤回来得太晚了,这对更好地安排撤回通知的时间有影响。
异构网络上的个人与社会利益
原文标题: Individual versus Social Benefit on the Heterogeneous Networks
地址: http://arxiv.org/abs/2110.07848
作者: Zahra Babaee, Mahsa Bagherikalhor, Leila Elyasizad, Mohammad Dehghan Niry, G. Reza Jafari
摘要: 结构平衡理论的重点是社会效益,而在真实的网络中,个人效益有时也很重要。在施特劳斯的模型中,局部最小值是通过考虑除社会术语之外的单个术语来建模的,并且假设基于个体利益的同等强度。结果表明,两个术语之间的竞争导致个人利益和社会利益之间的相变,并且存在一个临界点 CP,代表网络中的一阶相变。关于真正的关系网络,个人根据他们从中获得的利益来调整他们关系的强度。因此,为理解决个体相互作用中的异质性,我们研究了 Strauss 模型的修改版本,其中第一项代表异质个体利益的 theta_ij,第二项的系数 alpha 度量社会效益的力量。我们的研究表明,存在一个三角形处于皱缩状态而不是分散在网络中的区域,并且增加了个人利益的异质性导致皱缩状态区域更窄。在这个区域之外,网络是链接和三角形的混合体,alpha 的值决定了个人收益还是社会收益。对于 alpha 的小值,个人利益占主导地位,而在 alpha 的大值中,社会利益被克服。
基于生成根森林的角色相似度度量
原文标题: Role Similarity Metric Based on Spanning Rooted Forest
地址: http://arxiv.org/abs/2110.07872
作者: Qi Bao, Zhongzhi Zhang
摘要: 作为网络分析中的一个基本问题,结构节点相似性在学术界备受关注并被广泛应用。在这些提出的结构节点相似性度量中,角色相似性因其满足包括自同构构象在内的几个公理性质而脱颖而出。由于时间和空间成本高,现有的角色相似性指标无法处理大型现实世界网络上的 top-k 查询。在本文中,我们提出了一个新的角色相似度度量,即 textsfForestSim。我们证明了textsfForestSim 是一个可接受的角色相似度度量,并设计了相应的top-k 相似度搜索算法,即textsfForestSimSearch,它能够在O(k) 时间内处理一个top-k 查询一旦预计算完成。此外,我们通过使用快速近似算法来计算森林矩阵的对角线项来加速预计算,这将预计算的时间和空间复杂度降低到 O(epsilon^-2mlog^5 nlogfrac1epsilon) 和 O(mlog^3n) 分别。最后,我们对 26 个真实世界的网络进行了广泛的实验。结果表明 textsfForestSim 在百万级网络上有效工作,并达到与最先进方法相当的性能。
ACE-HGNN:自适应曲率探索双曲图神经网络
原文标题: ACE-HGNN: Adaptive Curvature Exploration Hyperbolic Graph Neural Network
地址: http://arxiv.org/abs/2110.07888
作者: Xingcheng Fu, Jianxin Li, Jia Wu, Qingyun Sun, Cheng Ji, Senzhang Wang, Jiajun Tan, Hao Peng, Philip S. Yu
摘要: 图神经网络 (GNN) 已在各种图数据挖掘任务中得到广泛研究。大多数现有的 GNN 将图数据嵌入到欧几里得空间中,因此在捕捉现实世界网络中无处不在的层次结构方面效率较低。双曲图神经网络(HGNN)将 GNN 扩展到双曲空间,因此在节点表示学习中更有效地刻画图的层次结构。在双曲几何中,图的层次结构可以通过双曲空间的曲率来反映,不同的曲率可以对图的不同层次结构进行建模。然而,大多数现有的 HGNN 为简单起见手动将曲率设置为固定值,由于图的复杂和多样的层次结构,这实现了图学习的次优性能。为理解决这个问题,我们提出了一种名为 ACE-HGNN 的自适应曲率探索双曲图神经网络,以根据输入图和下游任务自适应地学习最佳曲率。具体来说,ACE-HGNN 利用多智能体强化学习框架,包含两个智能体,ACE-Agent 和 HGNN-Agent,分别用于学习曲率和节点表示。这两个主体通过 NashQ 学习算法协同更新,寻找由曲率索引的最佳双曲空间。对多个真实世界图数据集的大量实验表明,模型质量具有显著且一致的性能改进,具有竞争力的性能和良好的泛化能力。
带噪声信息的网络级联的最快推理
原文标题: Quickest Inference of Network Cascades with Noisy Information
地址: http://arxiv.org/abs/2110.08115
作者: Anirudh Sridhar, H. Vincent Poor
摘要: 我们研究了在给定关于传播的噪声信息的时间序列的情况下估计网络级联源的问题。最初,有一个受级联(源)影响的顶点,级联在整个网络中以离散的时间步长传播。级联演化是隐藏的,但可以观察到来自每个顶点的噪声信号的时间序列。一个顶点的时间序列被假定为一个 i.i.d 的序列。在级联影响顶点之前来自变化前分布 Q_0 的样本,时间序列是 i.i.d.一旦级联影响了顶点,来自变化后分布 Q_1 的样本。鉴于噪声信号的时间序列,可以将其视为级联演化的噪声测量,我们的目标是设计一种程序来尽可能快地可靠地估计级联源。我们研究了源估计问题的贝叶斯和极小极大公式,并为简单的级联动力学和网络拓扑推导出接近最优的估计量。在贝叶斯设置中,观察样本直到贝叶斯最优估计器的误差低于阈值的估计器实现最佳性能。在极小极大设置中,通过设计一种新颖的多假设序列概率比检验 (MSPRT) 来实现最佳性能。我们发现,当网络拓扑是 k-正则树时,这些最优估计器需要 log log n / log (k - 1) 观察噪声时间序列,并且 (log n)^ ell 维晶格需要 frac1ell + 1 观察。最后,我们讨论如何将我们的方法扩展到任意图上的级联。
高等教育对社会分层影响的多主体描述
原文标题: A multi-agent description of the influence of higher education on social stratification
地址: http://arxiv.org/abs/2110.08153
作者: Giacomo Dimarco, Giuseppe Toscani, Mattia Zanella
摘要: 我们介绍并讨论了一个描述高等教育对多主体社会社会分层影响的一维动力学方程系统。该系统是通过将知识形成模型与社会攀登的动力学描述相结合而获得的,其中假设表征导致社会精英形成的基本相互作用的参数取决于主体人的知识/教育程度。此外,我们讨论了个人的教育水平是社会排名中所占据位置的函数的情况。根据最后一个假设,我们获得了一个完全耦合的模型,其中知识和社会地位相互影响。在最后一部分,我们提供了几个数值实验,强调了教育在减少社会不平等和促进社会流动方面的作用。
古典音乐和声码字频率分布中的对数正态、幂律和双幂律
原文标题: Lognormals, Power Laws and Double Power Laws in the Distribution of Frequencies of Harmonic Codewords from Classical Music
地址: http://arxiv.org/abs/2110.08200
作者: Marc Serra-Peralta, Joan Serrà, Álvaro Corral
摘要: Zipf 定律是一种范式,描述了通信系统中不同元素的重要性,尤其是在语言学中。尽管语言的层次结构很复杂,但音乐由于其多维特征(旋律、和声、节奏、音色……),在某种意义上具有更复杂的结构。因此,Zipf 定律在音乐中的相关性仍然是一个悬而未决的问题。使用从古典作曲家的大规模分析中获得的代表和声内容的离散代码字,我们表明几乎通用的 Zipf 类定律在定性水平上成立。然而,在深入的定量分析中,我们在 Zipf(幂)定律的优越性与对数正态分布的优越性之间的经典辩论中引入双幂律分布作为新参与者,我们得出的结论不仅是普遍性不成立,但没有一个唯一的概率分布最能描述每个作曲家对不同代码字的使用。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20211018/