- 使用弱监督图嵌入的 Twitter 用户表示;
- 可微深度量化半监督网络嵌入;
- 网络的无监督域自适应哈希;
- 意义动力学;
- 数学生物学的两种种群驱动模型的主体模型化;
- GUDIE:一种灵活的、用户定义的方法,用于从大图中提取感兴趣的子图;
- 基于熵的、依赖于尺度的中心性;
- 获取社会知识进行信用评估;
- 从手机网络的角度分析球迷的行为:2016 年欧洲杯,案例研究;
- 使用自动收费数据估计全网链路旅行时间和车站等待时间:一种计算图方法;
使用弱监督图嵌入的 Twitter 用户表示
原文标题: Twitter User Representation using Weakly Supervised Graph Embedding
地址: http://arxiv.org/abs/2108.08988
作者: Tunazzina Islam, Dan Goldwasser
摘要: 社交媒体平台为用户参与各种内容的多种在线活动提供了便捷的方式,并创造了快速、广泛的互动。然而,这种快速增长的访问也增加了多样化的信息,并且表征用户类型以理解人们在社交媒体中共享的生活方式决定具有挑战性。在本文中,我们提出了一种基于弱监督图嵌入的框架来理解用户类型。我们评估使用弱监督学习的用户嵌入来自 Twitter 的与幸福相关的推文,重点是“瑜伽”、“生酮饮食”。在真实世界数据集上的实验表明,所提出的框架优于检测用户类型的基线。最后,我们从我们的数据集中说明了对不同类型用户(例如,从业者与促销者)的数据分析。虽然我们专注于与生活方式相关的推文(即瑜伽、酮),但我们构建用户表示的方法很容易推广到其他领域。
可微深度量化半监督网络嵌入
原文标题: Semi-supervised Network Embedding with Differentiable Deep Quantisation
地址: http://arxiv.org/abs/2108.09128
作者: Tao He, Lianli Gao, Jingkuan Song, Yuan-Fang Li
摘要: 为网络学习准确的低维嵌入是一项至关重要的任务,因为它有助于许多下游网络分析任务。对于大型网络,经过训练的嵌入通常需要大量空间来存储,这使得存储和处理成为一项挑战。在我们之前关于半监督网络嵌入的工作的基础上,我们开发了 d-SNEQ,一种基于可微 DNN 的网络嵌入量化方法。 d-SNEQ 结合了秩损失,为学习到的量化代码配备了丰富的高阶信息,并且能够大幅压缩训练嵌入的大小,从而减少存储空间并加快检索速度。我们还提出了一种新的评估指标,即路径预测,以公平、更直接地评估模型在高阶信息保留方面的性能。我们对具有不同特征的四个真实世界网络的评估表明,d-SNEQ 在链路预测、路径预测、节点分类和节点推荐方面优于许多最先进的嵌入方法,同时具有更多的空间和时间- 高效。
网络的无监督域自适应哈希
原文标题: Unsupervised Domain-adaptive Hash for Networks
地址: http://arxiv.org/abs/2108.09136
作者: Tao He, Lianli Gao, Jingkuan Song, Yuan-Fang Li
摘要: 大量的现实世界数据可以自然地由大规模网络表示,这需要高效和有效的学习算法。同时,标签可能只适用于某些网络,这就要求这些算法能够适应无标签网络。由于其在检索时间和存储空间方面的成本较低,领域自适应哈希学习在计算机视觉社区的许多实际任务中取得了相当大的成功。但是,它还没有应用于多域网络。在这项工作中,我们通过为网络开发一种无监督的域自适应哈希学习方法来弥合这一差距,称为 UDAH。具体来说,我们开发了四个特定于任务但相关的组件:(1)通过硬分组对比损失保存网络结构,(2)无松弛监督散列,(3)跨域相交鉴别器,以及(4)语义中心对齐。我们进行了广泛的实验来评估我们的方法在一系列任务上的有效性和效率,包括链路预测、节点分类和邻居推荐。我们的评估结果表明,我们的模型在所有任务中都比最先进的传统离散嵌入方法获得了更好的性能。
意义动力学
原文标题: Dynamics of Meaning
地址: http://arxiv.org/abs/2108.09179
作者: Gary Gindler
摘要: 提出了作为乘法混沌的意义(知识积累过程)的形式理论。认识论过程被理解为从传入的信息中主观提取某些知识的过程。废话的概念被引入作为具有等于1的最小值的意义和作为累积意义的几何平均值的智力水平。意义的可乘性的论点,其多态性得到证实,并提供了世界历史上的众多例子。通过与经典热力学类比,假设了三个意义热力学定律。当对信息的理解(乘法级联)是具有给定统计特征的随机过程时,对累积意义进行估计。
数学生物学的两种种群驱动模型的主体模型化
原文标题: Agentization of Two Population-Driven Models of Mathematical Biology
地址: http://arxiv.org/abs/2108.08916
作者: John C. Stevenson
摘要: 单一物种种群模型和离散随机基因频率模型是两个对种群演化很重要的数学生物学标准。提出了一个基于主体的模型,该模型再现了这些模型,然后探索了这些模型在宽松的规范下同意和不同意的地方。对于种群模型,均匀混合的要求阻止了由于当地资源枯竭而导致的灭绝预测。这些模型还表明基于达到恒定人口水平的均衡,尽管潜在的人口特征可能远不及均衡。离散随机基因频率模型假设在恒定水平下混合良好的种群。模型对强烈振荡和混沌状态中的非常量种群的预测出奇地好,仅在最混沌的水平上与 ABM 不同。
GUDIE:一种灵活的、用户定义的方法,用于从大图中提取感兴趣的子图
原文标题: GUDIE: a flexible, user-defined method to extract subgraphs of interest from large graphs
地址: http://arxiv.org/abs/2108.09200
作者: Maria Inês Silva, David Aparício, Beatriz Malveiro, João Tiago Ascensão, Pedro Bizarro
摘要: 大型、密集、小世界的网络通常来自社会现象,包括金融网络、社交媒体或流行病学。随着网络重要性的增加,通常需要将它们划分为有意义的分析单元。在这项工作中,我们提出了 GUDIE,这是一种消息传递算法,可根据用户定义的标准提取种子节点周围的相关上下文。我们为丰富的标记图设计了 GUDIE,并且扩展考虑了节点和边属性。初步结果表明,GUDIE 扩展到有见地的领域,同时避免了不重要的联系。生成的子图包含种子节点的相关上下文,可以加速和扩展金融和其他关键网络的分析能力。
基于熵的、依赖于尺度的中心性
原文标题: An entropy-based, scale-dependent centrality
地址: http://arxiv.org/abs/2108.09248
作者: L. R. Schwengber, S. D. Prado, S. R. Dahmen
摘要: 在本文中,我们介绍了一个基于熵的、与尺度相关的中心性,它被评估为连续时间随机游走在时间 t 的分布的香农熵。它根据时间 t 对节点进行排名,时间 t 作为参数并定义网络的规模。它能够根据 t 的范围刻画众所周知的中心性,例如度、特征向量和接近度。我们将其与总 f-可传播中心性的广泛类别进行比较,其中 Katz 中心性和总可传播性都是特殊情况。
获取社会知识进行信用评估
原文标题: Eliciting Social Knowledge for Creditworthiness Assessment
地址: http://arxiv.org/abs/2108.09289
作者: Mark York, Munther Dahleh, David Parkes
摘要: 获得资本是发展中国家经济增长的主要制约因素。然而,那些试图在这个领域放贷的人由于无法区分信誉良好的借款人而面临高违约率。在本文中,我们提出了两种新颖的评分机制,以激励社区成员如实报告他们对社区中其他人信誉的信号。我们首先为贷方没有流动性限制的环境设计了一个截断的非对称评分规则。然后,我们为流动性受限的设置推导出一种新颖的、严格正确的 VCG 评分机制。而陈等人。 [2011] 给出了在决策市场的背景下进行连续报告的类似环境的不可能结果,我们通过在同时报告的环境中诉诸关于他人报告的临时信念来获得积极的结果。此外,使用VCG 方法允许集成线性置信聚合方法。
从手机网络的角度分析球迷的行为:2016 年欧洲杯,案例研究
原文标题: Analyzing the Behavior of Soccer Fans from a Mobile Phone Network Perspective: Euro 2016, a Case Study
地址: http://arxiv.org/abs/2108.09291
作者: Gergő Pintér, Imre Felde
摘要: 在这项研究中,我们分析了 2016 年 6 月覆盖布达佩斯的一个月的通话记录。在此观察期间,2016 年欧洲足球锦标赛举行,匈牙利国家足球队表现出色,超出预期。本案例研究从手机网络数据的角度,关注布达佩斯球迷在匈牙利比赛期间和之后的行为。紧张的扎根,进球的喜悦,因为赢得小组而忘记自我的庆祝活动。所有这些都会对数据产生影响,可以简单地揭示出来。我们使用描述性统计方法来分析可用的数据集,并设法证明这种数据在社会感知方面的潜力。我们发现手机网络活动反映了球迷的行为,即使比赛是在另一个国家进行的。
使用自动收费数据估计全网链路旅行时间和车站等待时间:一种计算图方法
原文标题: Network-wide link travel time and station waiting time estimation using automatic fare collection data: A computational graph approach
地址: http://arxiv.org/abs/2108.09292
作者: Jinlei Zhang, Feng Chen, Lixing Yang, Wei Ma, Guangyin Jin, Ziyou Gao
摘要: 城市轨道交通(URT)系统在北京和香港等许多特大城市中发挥着主导作用。由于其重要作用和复杂性,公共机构始终非常需要更好地理解 URT 系统的性能。本文重点研究了利用URT系统中的自动售票机(AFC)数据估计全网链路旅行时间和车站等待时间的一个本质和难题,这有利于更好地理解全系统实时运行状态。新兴的数据驱动技术,如机器学习领域的计算图(CG)模型,为解决这一问题提供了新的解决方案。在这项研究中,我们首先制定了一个数据驱动的估计优化框架来估计链路旅行时间和车站等待时间。然后,我们将估计优化模型转换为 CG 框架来解决优化问题并获得估计结果。该方法在合成 URT 网络上得到验证,并分别使用合成和真实世界的 AFC 数据应用于真实世界的 URT 网络。结果显示了基于 CG 的框架的稳健性和有效性。据我们所知,这是第一次将 CG 应用于 URT。这项研究可以提供重要的见解,以更好地理解 URT 的运行状态。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20210823/