- PERFECT:用于联合用户和社区对齐的双曲嵌入;
- 社交媒体参与度和加密货币表现;
- Twitter 上一年的 COVID-19 疫苗错误信息;
- 黑手党网络破坏的人力和社会资本战略;
- Covid-19 的基于主体的模拟器:使用较小的模型模拟较大的模型;
- 一种基于随机主体的模型,用于评估受人类流动性影响的 COVID-19 传播;
- 从印度人的名字中解码人口不公平;
- 社交媒体平台中的一种新的异构图表示:Steemit;
- MultiViz:用于多层网络可扩展可视化的 Gephi 插件;
- 使用稳健的多通道图神经网络进行远程工作优化;
- 基于机器学习的 COVID-19 假新闻自动注释和检测;
- 犯罪网络中的机器学习合作伙伴;
- 具有高效近似的复合社区感知多元化影响力最大化;
- 从交互数据重建符号关系;
PERFECT:用于联合用户和社区对齐的双曲嵌入
原文标题: PERFECT: A Hyperbolic Embedding for Joint User and Community Alignment
地址: http://arxiv.org/abs/2209.02908
作者: Li Sun, Zhongbao Zhang, Jiawei Zhang, Feiyang Wang, Yang Du, Sen Su, Philip S. Yu
摘要: 社会网络对齐在广泛的应用中显示出根本的重要性。据我们所知,现有研究主要集中在个人用户层面的网络对齐上,需要共享个人用户之间的丰富公共信息。对于不能满足这些要求的网络,社交社区结构实际上提供了稍微粗粒度的补充和关键信息,其对齐将为用户对齐提供额外的信息。反过来,用户对齐也揭示了更多社区对齐的线索。因此,在本文中,我们介绍了联合社会网络对齐的问题,旨在同时对齐社会网络中的用户和社区。关键挑战在于 1)如何学习用户和社区的表示,以及 2)如何使用户对齐和社区对齐相互受益。为了应对这些挑战,我们首先用 delta-hyperbolicity 的概念详细阐述了现实世界网络的特征,并展示了双曲空间在表示社会网络方面的优越性。然后,我们提出了一种新的双曲线嵌入方法,用于联合社会网络对齐,称为 PERFECT,在统一优化中。对真实世界数据集的大量实验表明,PERFECT 在用户对齐和社区对齐方面的优越性。
社交媒体参与度和加密货币表现
原文标题: Social Media Engagement and Cryptocurrency Performance
地址: http://arxiv.org/abs/2209.02911
作者: Khizar Qureshi, Tauhid Zaman
摘要: 我们研究使用社交媒体数据预测加密货币未来表现的问题。我们提出了一种新模型,以根据与社交媒体帖子的互动来衡量用户对社交媒体上讨论的主题的参与度。该模型克服了以前基于数量和情绪的方法的局限性。我们使用该模型来估计 2019 年至 2021 年间创建的 48 种加密货币的参与系数,使用加密货币存在第一个月的 Twitter 数据。我们发现加密货币的未来回报取决于参与系数。参与系数太低或太高的加密货币回报率较低。低参与系数表示缺乏兴趣,而高参与系数表示可能来自称为机器人的自动帐户的人为活动。我们测量了加密货币的机器人帖子数量,发现通常具有更多机器人帖子的加密货币具有较低的未来回报。虽然未来回报取决于机器人活动和参与系数,但参与系数的依赖性最强,尤其是短期回报。我们表明,选择参与系数超过固定阈值的加密货币的简单投资策略在几个月的持有时间内表现良好。
Twitter 上一年的 COVID-19 疫苗错误信息
原文标题: One year of COVID-19 vaccine misinformation on Twitter
地址: http://arxiv.org/abs/2209.01675
作者: Francesco Pierri, Matthew R. DeVerna, Kai-Cheng Yang, David Axelrod, John Bryden, Filippo Menczer
摘要: 我们在 12 个月内使用包含 80 多个相关关键字的列表收集了近 3 亿条与 COVID-19 疫苗相关的英语推文。然后,我们根据低可信度和主流新闻来源的第三方列表,在来源层面提取和标记新闻文章,并测量不同类型信息的流行程度。我们还考虑了在 Twitter 上分享的可疑 YouTube 视频。为了识别疫苗错误信息的传播者,我们专注于经过验证的 Twitter 账户,并采用机器人检测算法来识别可能是自动化的账户。我们的研究结果表明,与主流新闻相比,低可信度信息的流行率较低。然而,大多数流行的低可信度来源的转发量与许多主流来源相当,并且比美国疾病控制与预防中心和世界卫生组织等权威来源的转发量更大。在这一年中,我们观察到与疫苗相关的主流新闻相比,低可信度新闻的流行率呈上升趋势。我们还观察到 Twitter 上分享了大量可疑的 YouTube 视频。我们发现,由 Twitter 验证的大约 800 名超级传播者的推文占平均每天所有错误信息转发的 35% 左右,其中顶级超级传播者 (RobertKennedyJr) 负责超过 13% 的转发。我们还发现,低可信度的新闻和可疑的 YouTube 视频更有可能被自动帐户分享。
黑手党网络破坏的人力和社会资本战略
原文标题: Human and social capital strategies for Mafia network disruption
地址: http://arxiv.org/abs/2209.02012
作者: Annamaria Ficara, Francesco Curreri, Giacomo Fiumara, Pasquale De Meo
摘要: 社会网络分析 (SNA) 是一门跨学科科学,专注于发现个人互动的模式。特别是,从业人员使用 SNA 来描述和分析犯罪网络,以突出亚组、关键行为者、优势和劣势,以产生破坏干预和犯罪预防系统。在本文中,采用 SNA 工具研究了针对两个真实黑手党网络的总共七种破坏策略的有效性。针对具有高水平社会资本的参与者的三项干预措施和针对具有高人力资本的参与者的三项干预措施进行了测试,并相互比较并随机删除节点。人力和社会资本方法也被应用于更能代表犯罪网络的 Barab’asi-Albert 模型。模拟表明,基于社会资本的行为者移除被证明是最有效的策略,因为它可以以最少的步骤彻底破坏犯罪网络。移除黑手党家族的特定人物,例如 Caporegime,似乎在网络中断方面也很有希望。
Covid-19 的基于主体的模拟器:使用较小的模型模拟较大的模型
原文标题: Agent based simulators for Covid-19: Simulating larger models using smaller ones
地址: http://arxiv.org/abs/2209.02887
作者: Daksh Mittal, Sandeep Juneja, Shubhada Agrawal
摘要: 基于主体的模拟器 (ABS) 是一种流行的流行病学建模工具,用于研究各种非药物干预对管理城市流行病的影响。它们提供了对具有不同时间和地点的、特定于个人的交互的异质人口进行准确建模的灵活性。政府政策,如局部封锁、病例隔离、家庭隔离等,以及重要的流行病发展,包括变异体和疫苗的存在,很容易被纳入 ABS。通常,为了准确起见,每个人都是单独建模的。然而,当城市人口和模拟时间很大时,这可能会使计算时间变得过高。在本文中,我们主要关注 COVID-19 大流行,并深入挖掘通用 ABS 的潜在概率结构,以进行修改,以允许较小的模型为较大的模型提供准确的统计数据。我们观察到,简单地考虑一个较小的聚合模型并扩大输出会导致不准确。我们利用以下观察结果:在最初的 Covid 传播阶段,初始感染会创建一个或多或少独立于其他树的受感染个体的家谱,并且可以很好地建模为多类型的超临界分支过程。此外,人口类型之间的相对比例迅速稳定下来。不久之后,对于大城市人口,一旦有足够多的人被感染,大流行的未来演变将非常接近其平均场限制和随机起始状态。我们在这些见解的基础上开发了一种基于移位、尺度和重新启动的算法,该算法使用更小的模型准确评估 ABS 的性能,同时小心地减少可能出现的偏差。我们通过渐近分析理论上支持所提出的算法,其中人口规模增加到无穷大。
一种基于随机主体的模型,用于评估受人类流动性影响的 COVID-19 传播
原文标题: A stochastic agent-based model to evaluate COVID-19 transmission influenced by human mobility
地址: http://arxiv.org/abs/2209.02913
作者: Kejie Chen, Yanqing Li, Rongxin Zhou, Xiaomo Jiang
摘要: COVID-19 大流行迫切需要能够预测流行趋势并评估缓解策略有效性的数学模型。为了预测 COVID-19 的传播,一个主要挑战是准确评估多尺度的人类流动性以及它们如何通过密切接触影响感染。通过结合基于随机主体的建模策略和与地理中的地点概念相对应的空间容器的层次结构,本研究提出了一种新的模型 Mob-Cov 来研究人类旅行行为和个体健康状况对疾病的影响爆发和人群中 COVID 的概率为零。具体来说,个人在容器内执行幂律类型的局部移动以及不同级别容器之间的全局传输。小型集装箱(如道路或县城)内频繁的短途移动和大量人口,影响当地人流密集度,加速感染和区域传播。大型集装箱(例如城市和国家)之间的旅行促进了全球传播和爆发。此外,根据流动模式、人口数量和健康状况,人口的动态感染和恢复能够将系统的分叉驱动到“零 COVID”状态或“与 COVID 一起生活”状态。减少总人口和当地人的聚集以及限制全球旅行有助于实现零新冠病毒。综上所述,Mob-Cov 模型在广泛的空间尺度上考虑了更现实的人类移动性,并在设计上同时强调了性能、低模拟成本、准确性、易用性和灵活性。它是研究人员和政治家调查大流行动态和计划针对该疾病的行动的有用工具。
从印度人的名字中解码人口不公平
原文标题: Decoding Demographic un-fairness from Indian Names
地址: http://arxiv.org/abs/2209.03089
作者: Medidoddi Vahini, Jalend Bantupalli, Souvic Chakraborty, Animesh Mukherjee
摘要: 人口统计分类对于推荐系统的公平性评估或测量在线网络和投票系统中的意外偏差至关重要。教育和政治等重要领域通常为社会平等的未来奠定基础,需要仔细审查以设计能够更好地促进资源分配平等的政策,这些政策受到该国人口分布不平衡的限制。我们收集了三个公开可用的数据集来训练性别和种姓分类领域中最先进的分类器。我们在印度语境中训练模型,其中相同的名称可以有不同的样式约定(一个州的 Jolly Abraham/Kumar Abhishikta 在另一个州可能写成 Abraham Jolly/Abishikta Kumar)。最后,我们还进行了交叉测试(在不同数据集上进行训练和测试)以理解上述模型的功效。我们还对预测模型进行了误差分析。最后,我们试图评估现有印度制度中的偏见作为案例研究,并发现一些有趣的模式体现在次大陆跨性别和种姓维度的复杂人口布局中。
社交媒体平台中的一种新的异构图表示:Steemit
原文标题: A New Heterogeneous Graph Representation in a Social Media Platform: Steemit
地址: http://arxiv.org/abs/2209.03144
作者: Negar Maleki, Balaji Padamanabhan, Kaushik Dutta
摘要: 最近,含时图已经取代了动态图,因为许多现实世界的问题是在连续时间而不是在离散时间中发展的,而且除了时间之外,几乎所有问题都是以异构格式而不是同质格式设计的。但是,大多数现有的图表示在其组件中都没有考虑时间。为此,在本文中,我们提出了一种新的异构图表示,包括图的每个组件(即节点和边)中的时间。我们还引入了四个与时间相关的查询来解决机器学习或深度学习问题。我们的研究结果表明,考虑到巨大图的大小,我们的时间相关查询可以有效地执行。为了展示时间在图表示中的表达能力,我们为新的社交媒体平台 (Steemit) 构建了一个图,并使用图神经网络 (GNN) 解决了深度学习预测任务。预测新发布的帖子的支出是 Steemit 设置中最引人入胜的分类问题之一,我们用两种方法解决了这个问题,然后是 GNN 模型。
MultiViz:用于多层网络可扩展可视化的 Gephi 插件
原文标题: MultiViz: A Gephi Plugin for Scalable Visualization of Multi-Layer Networks
地址: http://arxiv.org/abs/2209.03149
作者: Jayamohan Pillai C.S., Ayan Chatterjee, Geetha M., Amitava Mukherjee
摘要: 可视化呈现网络的过程是理解网络内实体关系的有效方法,因为它揭示了网络的整体结构和拓扑。真实网络由于其巨大的复杂性而极难可视化,其中包括大量数据、多种类型的交互、各种子系统和多个连接级别以及随时间的变化。本文介绍了“MultiViz Plugin”,一个用于图可视化和修改的开源软件工具 gephi 的插件,以便以多层方式可视化复杂的网络。通过该插件可以使用一组设置将现有网络转换为多层网络。该插件支持多种布局算法,并允许用户选择要用作层的网络属性。该研究的目标是让用户完全控制网络如何以多层方式可视化。我们展示了插件使用现实生活中复杂的多层数据集可视化多层数据的能力。
使用稳健的多通道图神经网络进行远程工作优化
原文标题: Remote Work Optimization with Robust Multi-channel Graph Neural Networks
地址: http://arxiv.org/abs/2209.03150
作者: Qinyi Zhu, Liang Wu, Qi Guo, Liangjie Hong
摘要: COVID-19 的传播导致全球许多公司办公室关闭,并鼓励公司开辟更多机会,允许员工在远程位置工作。随着工作场所类型从现场办公室扩展到偏远地区,在线招聘市场面临的一个新挑战是如何在没有事先信息的情况下对这些远程机会和用户远程工作意图进行建模和匹配。尽管在 COVID-19 期间发布了空前数量的远程工作,但没有可以直接应用的现有方法。引入全新的工作场所类型自然会导致冷启动问题,这对于不太活跃的求职者来说尤其常见。如果现有信息源几乎不能提供与新工作类别相关的信息,包括来自简历和工作描述的数据,那么为任何预测模型加入新的工作场所类型即使不是不可能,也是具有挑战性的。因此,在这项工作中,我们的目标是提出一种原则性方法,该方法可以在信息有限的情况下联合模拟求职者的偏远和工作机会,这也足以满足网络规模应用程序的需求。现有对新兴类型远程工作场所的研究主要集中在定性研究,考虑到冷启动和信息稀缺问题,经典的预测建模方法已不适用。我们试图用一种新颖的图神经架构来缩小这一差距。已经对来自实际应用的大规模数据进行了广泛的实验,以验证所提出的方法相对于竞争基线的优越性。这种改进可能会转化为新工作场所类型的更快入职,这可以使对远程工作感兴趣的求职者受益。
基于机器学习的 COVID-19 假新闻自动注释和检测
原文标题: Machine Learning-based Automatic Annotation and Detection of COVID-19 Fake News
地址: http://arxiv.org/abs/2209.03162
作者: Mohammad Majid Akhtar, Bibhas Sharma, Ishan Karunanayake, Rahat Masood, Muhammad Ikram, Salil S. Kanhere
摘要: 尽管有关疫情的错误信息传播得比病毒快,但 COVID-19 影响了世界各地。通过在线社会网络 (OSN) 传播的错误信息经常误导人们遵循正确的医疗实践。特别是,OSN 机器人一直是传播虚假信息和发起网络宣传的主要来源。现有的工作忽略了作为传播催化剂的机器人的存在,并专注于在“帖子中共享的文章”而不是帖子(文本)内容中检测假新闻。大多数错误信息检测工作使用手动标记的数据集,这些数据集难以扩展以构建其预测模型。在这项研究中,我们通过提出一种使用 Twitter 数据集上经过验证的事实检查语句来标记数据的自动化方法来克服数据稀缺的挑战。此外,我们将文本特征与用户级特征(如关注者数量和朋友数量)和推文级特征(如推文中的提及次数、主题标签和网址)结合起来,作为检测错误信息的附加指标。此外,我们分析了推文中机器人的存在,并表明机器人会随着时间的推移改变它们的行为,并且在错误信息活动中最为活跃。我们收集了 1022 万条与 COVID-19 相关的推文,并使用我们的注释模型构建了一个广泛且原始的地面实况数据集以用于分类目的。我们利用各种机器学习模型来准确检测错误信息,我们最好的分类模型达到了准确率 (82%)、召回率 (96%) 和误报率 (3.58%)。此外,我们的机器人分析表明,机器人生成了大约 10% 的错误信息推文。我们的方法导致大量虚假信息的曝光,从而提高了通过社交媒体平台传播的信息的可信度。
犯罪网络中的机器学习合作伙伴
原文标题: Machine Learning Partners in Criminal Networks
地址: http://arxiv.org/abs/2209.03171
作者: Diego D. Lopes, Bruno R. da Cunha, Alvaro F. Martins, Sebastian Goncalves, Ervin K.Lenzi, Quentin S. Hanley, Matjaz Perc, Haroldo V. Ribeiro
摘要: 最近的研究表明,犯罪网络具有复杂的组织结构,但是这是否可以用来预测犯罪网络的静态和动态属性仍然很少有人探索。在这里,通过结合图表示学习和机器学习方法,我们表明政治腐败、警察情报和洗钱网络的结构特性可用于恢复丢失的犯罪伙伴关系,区分不同类型的犯罪和法律协会,以及预测犯罪人员之间交换的总金额,所有这些都非常准确。我们还表明,我们的方法可以在腐败网络的动态增长过程中非常准确地预测未来的犯罪关联。因此,类似于在犯罪现场发现的证据,我们得出结论,犯罪网络的结构模式携带有关非法活动的关键信息,这使得机器学习方法能够预测丢失的信息,甚至预测未来的犯罪行为。
具有高效近似的复合社区感知多元化影响力最大化
原文标题: Composite Community-Aware Diversified Influence Maximization with Efficient Approximation
地址: http://arxiv.org/abs/2209.03176
作者: Jianxiong Guo, Weili Wu, Ding-Zhu Du
摘要: 影响力最大化(IM)是移动网络和社交计算中的一个著名话题,旨在寻找一小部分用户,通过在线信息级联最大化影响力。最近,一些细心的研究人员关注信息传播的多样性,特别是社区意识的多样性,并提出了多样化的 IM 问题。多样性在许多现实世界的应用程序中无处不在,但它们都基于给定的社区结构。在社会网络中,我们可以根据不同的指标为同一组用户形成异构的社区结构。因此,如何量化基于多个社区结构的多样性是一个有趣的问题。在本文中,我们提出了复合社区感知多元化 IM (CC-DIM) 问题,该问题旨在选择一个种子集,以最大限度地扩大所有可能的社区结构的影响传播和复合多样性。为理解决CC-DIM问题的NP难问题,我们采用反向影响采样技术,设计了一个随机广义反向可达(G-RR)集来估计目标函数。随机 G-RR 集的组成比用于 IM 问题的 RR 集复杂得多,这将导致传统的基于采样的逼近算法效率低下。正因为如此,我们进一步提出了一种两阶段算法,广义 HIST (G-HIST)。它不仅可以返回至少(1-delta)概率的(1-1/e-varepsilon)近似解,而且通过显著降低G-RR 集的平均大小。最后,我们针对现有算法在真实数据集上评估我们的 G-HIST。实验结果表明我们提出的算法的有效性及其优于其他基线算法的优越性。
从交互数据重建符号关系
原文标题: Reconstructing signed relations from interaction data
地址: http://arxiv.org/abs/2209.03219
作者: Georges Andres, Giona Casiraghi, Giacomo Vaccario, Frank Schweitzer
摘要: 积极和消极的关系在人类行为和塑造我们生活的社区中发挥着至关重要的作用。尽管它们很重要,但有关已签署关系的数据很少见,通常通过调查收集。交互数据更加丰富,例如接近度或通信数据的形式。但是,到目前为止,它还不能用于检测符号关系。在本文中,我们展示了如何使用这些数据提取底层的符号关系。采用统计网络方法,我们在四个社区中构建符号关系网络。然后,我们表明这些关系对应于调查中报告的关系。此外,推断的关系使我们能够研究个人在性别、宗教信仰和经济背景方面的同质性。我们评估符号网络中三元组对研究组凝聚力的重要性。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20220908/