Arxiv网络科学论文摘要13篇(2022-01-11)

  • Wiki-CS:基于维基百科的图神经网络基准;
  • 欺诈者群体检测的时空图表示学习;
  • Neighbor2vec:一种高效且有效的图嵌入方法;
  • AnomMAN:在多视图属性网络上检测异常;
  • HFUL:跨位置感知社会网络的用户帐户链接的混合框架;
  • 跳槽到男性主导的职业:减少中国女性性别工资差距的新方法;
  • 感染死亡率和社会接触矩阵对疫苗优先策略的影响;
  • 非线性随机游走优化流行病锁定措施中成本和预防之间的权衡:ESIR模型;
  • 在澳大利亚 2019-2020 年丛林大火期间宣传和打击错误信息:极化案例研究;
  • 社交媒体网络攻击及其预防机制综述;
  • 基于具有2-2和3-1主体交互的 Sznajd 模型的涉及逆向和独立行为的意见动态;
  • 自动检测已开发自行车网络中的缺失链接;
  • 用于评估未记录感染的分区流行病模型:在巴西 SARS-CoV-2 流行病中的应用;

Wiki-CS:基于维基百科的图神经网络基准

原文标题: Wiki-CS: A Wikipedia-Based Benchmark for Graph Neural Networks

地址: http://arxiv.org/abs/2007.02901

作者: Péter Mernyei, Cătălina Cangea

摘要: 我们展示了 Wiki-CS,这是一个源自 Wikipedia 的新数据集,用于对图神经网络进行基准测试。该数据集由与计算机科学文章对应的节点组成,边基于超链接和代表该领域不同分支的 10 个类。我们使用该数据集来评估半监督节点分类和单关系链路预测模型。我们的实验表明,这些方法在新领域表现良好,其结构特性不同于早期的基准。该数据集与数据管道的实施和基准实验一起在 https://github.com/pmernyei/wiki-cs-dataset 上公开可用。

欺诈者群体检测的时空图表示学习

原文标题: Spatio-Temporal Graph Representation Learning for Fraudster Group Detection

地址: http://arxiv.org/abs/2201.02621

作者: Saeedreza Shehnepoor, Roberto Togneri, Wei Liu, Mohammed Bennamoun

摘要: 受潜在经济利益的驱使,公司可能会聘请欺诈团体撰写虚假评论,以降级竞争对手或宣传自己的业务。此类群体在误导客户方面更为成功,因为人们更容易受到大群体意见的影响。为了检测这些群体,一个常见的模型是表示欺诈者群体的静态网络,从而忽略评论者的纵向行为,从而忽略一个群体中评论者之间共同评论关系的动态。因此,这些方法无法排除异常评论者,这些评论者是欺诈者故意在一个群体中伪装自己,而真正的评论者恰好在欺诈者群体中共同评论。为理解决这个问题,在这项工作中,我们建议首先利用 HIN-RNN 在两个审稿人的表示学习中的有效性,同时捕捉审稿人之间的协作,我们首先利用 HIN-RNN 对共同审阅关系进行建模审阅者在 28 天的固定时间窗口内。我们将此称为空间关系学习表示,以表明这项工作对其他网络场景的普遍性。然后我们在空间关系上使用 RNN 来预测组中评论者的时空关系。在第三步中,图卷积网络 (GCN) 使用这些预测关系细化审阅者的向量表示。然后使用这些细化的表示来删除异常评论者。然后将剩余评论者表示的平均值馈送到一个简单的全连接层,以预测该组是否是欺诈者组。所提出方法的详尽实验表明,在 Yelp(亚马逊) 数据集,分别。

Neighbor2vec:一种高效且有效的图嵌入方法

原文标题: Neighbor2vec: an efficient and effective method for Graph Embedding

地址: http://arxiv.org/abs/2201.02626

作者: Zhiming Lin

摘要: 近年来,图嵌入技术取得了重大进展。然而,目前的技术不足以有效地捕捉网络的模式。本文提出了neighbor2vec,一种用于学习节点邻域表示的基于邻域的采样策略,一种通过节点与其邻域之间的特征传播来收集结构信息的框架。我们声称,neighbor2vec 是一种简单有效的方法来增强图嵌入的可扩展性和相等性,它打破了现有最先进的无监督技术的限制。我们对 ogbn-arxiv、ogbn-products、ogbn-proteins、ogbl-ppa、ogbl-collab 和 ogbl-citation2 等网络的多个节点分类和链路预测任务进行了实验。结果表明,Neighbor2vec 的表示在节点分类任务中提供的平均准确度得分比竞争方法高出 6.8%,在链路预测任务中高出 3.0%。在所有六个实验中,neighbor2vec 的表示能够胜过所有基线方法和两个经典 GNN 模型。

AnomMAN:在多视图属性网络上检测异常

原文标题: AnomMAN: Detect Anomaly on Multi-view Attributed Networks

地址: http://arxiv.org/abs/2201.02822

作者: Ling-Hao Chen, He Li, Wenhao Yang

摘要: 属性网络异常检测广泛应用于网络购物、金融交易、通信网络等领域。然而,大多数工作试图仅考虑单个交互动作来检测属性网络上的异常,而不能考虑多视图属性网络中丰富的交互动作。事实上,在多视图属性网络中统一考虑所有不同类型的交互动作并检测异常实例仍然是一项具有挑战性的任务。在本文中,我们提出了一种基于图卷积的框架 AnomMAN,用于在 textbfMulti-view textbfA 属性 textbfN 网络上检测 textbfAnomaly。为了共同考虑属性和所有交互动作,我们使用注意机制来定义网络中所有视图的重要性。此外,由于其低通特性,图卷积操作不能简单地应用于异常检测任务。因此,AnomMAN 使用图自动编码器模块来克服这个缺点并将其转化为我们的强项。根据对真实世界数据集的实验,AnomMAN 优于最先进的模型和我们提出的模型的两个变体。此外,AnomMAN 的 Accuracy@50 指标在数据集上达到了 1.000,这表明 AnomMAN 检测到的前 50 个异常实例都是异常实例。

HFUL:跨位置感知社会网络的用户帐户链接的混合框架

原文标题: HFUL: A Hybrid Framework for User Account Linkage across Location-Aware Social Networks

地址: http://arxiv.org/abs/2201.02830

作者: Wei Chen, Weiqing Wang, Hongzhi Yin, Lei Zhao, Xiaofang Zhou

摘要: 当我们在不同平台或设备上链接属于同一用户的用户帐户时,互补信息的来源就会相互关联。扩展的信息促进了跨平台预测、跨平台推荐和广告等广泛应用的发展。由于用户账户关联的重要性和支持 GPS 的移动设备的广泛普及,越来越多的研究将用户账户与跨位置感知社会网络的时空数据关联起来。与该领域中大多数只关注有效性的现有研究不同,我们提出了一个名为 HFUL(跨位置感知社会网络的用户帐户链接的混合框架)的新框架,其中效率、有效性、可扩展性、稳健性和应用的用户帐户链接被考虑。具体来说,为了提高效率,我们从时空角度开发了一个综合索引结构,并设计了新颖的剪枝策略来减少搜索空间。为了提高有效性,提出了一种基于核密度估计的方法来缓解测量用户相似度时的数据稀疏问题。此外,我们研究了 HFUL 在用户预测、时间预测和位置预测方面的应用。在三个真实世界数据集上进行的广泛实验证明了 HFUL 在有效性、效率、可扩展性、鲁棒性和应用方面与最先进的方法相比具有优势。

跳槽到男性主导的职业:减少中国女性性别工资差距的新方法

原文标题: Jumping to male-dominated occupations: A novel way to reduce gender wage gap for Chinese women

地址: http://arxiv.org/abs/2201.02835

作者: Wei Bai, Zhongtao Yue, Tao Zhou

摘要: 职业隔离被广泛认为是导致劳动力市场性别歧视的主要原因之一。使用中国在线求职者的大规模简历数据,我们发现了一个有趣的现象,即男性比例较高的职业性别工资差距较小,以女性与男性的工资比率衡量。我们进一步表明,中国职业隔离的严重程度在整体和区域上都较低,并且职业间歧视远小于职业内歧视。也就是说,中国女性在改变职业时不会面临很大的障碍。因此,我们建议中国女性采用一种新的方式来缩小性别工资差距:加入男性主导的职业。同时,值得注意的是,虽然男性主导职业的性别工资差距较小,但这并不意味着那里的性别歧视较小。

感染死亡率和社会接触矩阵对疫苗优先策略的影响

原文标题: Effects of infection fatality ratio and social contact matrices on vaccine prioritization strategies

地址: http://arxiv.org/abs/2201.02869

作者: Arthur Schulenburg, Wesley Cota, Guilherme S. Costa, Silvio C. Ferreira

摘要: 疫苗优先排序的有效策略对于减轻严重传染病的影响至关重要。我们使用由不同疾病(COVID-19 和流感)和国家(巴西、德国和乌干达)的真实世界数据推动的分区流行病模型,调查感染死亡率 (IFR) 和社会接触矩阵对疫苗接种优先顺序的作用。我们的研究证实,如果传染病得到缓解,大规模和早期接种疫苗对于降低疾病死亡率非常有效,但随着疫苗接种在不受控制的流行病学情况下开始延迟,有效性会越来越低。最佳和最不有效的优先排序策略非线性地取决于流行病学变量。与流感相比,COVID-19 的 IFR 在流行病学参数空间的区域中,优先考虑最脆弱的人群比最具传染性的个体更有效。人口统计和社会联系矩阵使相图变形,但不会改变它们的定性形状。

非线性随机游走优化流行病锁定措施中成本和预防之间的权衡:ESIR模型

原文标题: Nonlinear random walks optimize the trade-off between cost and prevention in epidemics lockdown measures : the ESIR model

地址: http://arxiv.org/abs/2201.02878

作者: Bram A. Siebert, James P. Gleeson, M. Asllani

摘要: 传染病可以在人群中迅速传播,要么通过空气传播,要么通过其他一些传播媒介大量传播。如果对个人健康的影响对住院人数甚至死亡人数造成严重后果,则它们可能尤其具有破坏性。遏制流行病传播的常见对策包括限制人与人之间的互动或一般的流动性,这通常会带来经济和社会成本。在本文中,我们提出了一个在元种群网络上优化社会距离的目标模型,称为 ESIR 模型,该模型可以有效地减少疾病传播,同时最大限度地减少对人类流动性和相关成本的影响。所提出的模型基于非线性随机游走过程,该过程考虑了网络元节点的有限承载能力,即个体在移动网络中交互的物理补丁。这个后来的约束被建模为经典 SIR 模型的松弛隔间 E,并量化空置空间的密度以适应扩散个体。将问题表述为多目标优化问题表明,当步行者避开拥挤的节点时,系统可以快速接近帕累托最优,从而大大减少传播,同时最大限度地减少对人类流动性的影响,这在经验交通网络中也得到了验证。这些结果设想了可能增强大流行控制政策制定的临时流动性协议。

在澳大利亚 2019-2020 年丛林大火期间宣传和打击错误信息:极化案例研究

原文标题: Promoting and countering misinformation during Australia’s 2019-2020 bushfires: A case study of polarisation

地址: http://arxiv.org/abs/2201.03153

作者: Derek Weber, Lucia Falzon, Lewis Mitchell, Mehwish Nasim

摘要: 在 2019-2020 年澳大利亚史无前例的丛林大火期间,使用#ArsonEmergency 在推特上重新出现指责纵火的错误信息。机器人在多大程度上负责传播和放大这种错误信息已经受到媒体和学术研究的审查。在这里,我们研究了 Twitter 社区在人群层面的事件中传播这种错误信息,并调查了在线社区和机器人的作用。我们对讨论动态的深入调查采用了分阶段的方法——在主流媒体报道机器人宣传主题标签之前和之后。虽然我们没有找到很多机器人,但最像机器人的帐户是社交机器人,它们表现为真正的人类。此外,我们在 Twitter 讨论中提炼出两个两极分化社区之间有意义的定量差异,从而得出以下见解。首先,纵火叙述的支持者通过使用标签和外部资源链接直接让他人回复和提及来宣传错误信息。作为回应,反对者转发了基于事实的文章和官方信息。其次,支持者嵌入在他们的交互网络中,但反对者尽管处于边位置,但更有效地获得了高中心性。到最后阶段,反对者和非附属账户似乎开始协调,可能会接触到更广泛的受众。最后,非附属帐户在最后阶段以 9:1 的比例共享与反对者与支持者相同的 URL,在第一阶段主要共享支持者 URL。这挫败了支持者的努力,凸显了揭露错误信息活动的价值。我们推测,这里观察到的沟通策略可以在其他与错误信息相关的讨论中发现,并可以为反策略提供信息。

社交媒体网络攻击及其预防机制综述

原文标题: Social Media Networks Attacks and their Preventive Mechanisms: A Review

地址: http://arxiv.org/abs/2201.03330

作者: Emmanuel Etuh, Francis S. Bakpo, Eneh Agozie H

摘要: 我们生活在一个虚拟世界中,真实的生活方式被复制。世界范围内对使用社交媒体网络的日益依赖导致了对信息安全的极大关注。社交媒体平台普及的因素之一是它们如何将世界各地的人们联系起来进行互动、共享内容,以及参与跨越地理界限的共同利益的相互互动。在所有这些令人难以置信的成就背后,是威胁到物理社会化的数字犯罪等价物。犯罪分子和黑客正在利用社交媒体平台 (SMP) 进行许多恶意活动来伤害他人。随着检测工具被开发来控制这些犯罪,黑客的策略和技术也在不断发展。黑客不断开发新的攻击工具和黑客策略,以恶意访问系统并攻击社交媒体网络,从而使安全管理员和组织难以制定和实施防止黑客攻击所需的适当策略和程序。社交媒体平台上网络攻击的增加要求采取紧急和更智能的安全措施,以提高社交媒体平台的有效性。本文探讨了黑客攻击社交媒体的模式和策略,以及防止他们针对用户的活动的方法,以确保社会网络空间的安全,增强虚拟社交。对社交媒体平台进行了简要分类,并强调了各种类型的攻击,并采用当前最先进的预防机制来克服研究工作中提出的攻击,最后,社交媒体入侵检测机制被建议作为第二道防线防御社交媒体网络上的网络犯罪

基于具有2-2和3-1主体交互的 Sznajd 模型的涉及逆向和独立行为的意见动态

原文标题: Opinion dynamics involving contrarian and independence behaviors based on the Sznajd model with two-two and three-one agent interactions

地址: http://arxiv.org/abs/2201.03351

作者: Roni Muslim, M Jauhar Kholili, Ahmad R. T. Nugraha

摘要: 我们基于 Sznajd 模型在涉及逆向和独立行为的完整图上研究流出动态的意见演变。我们考虑一组四个自旋,代表具有以下场景的社会主体:(1)具有反向主体或独立主体的场景 2-2 和(2)具有反向或独立主体的场景 3-1。根据我们的模拟,它们都经历了二阶相变。临界点随着lambda 和f 的增加呈指数下降,其中lambda 和f 分别是逆向因子和灵活性因子。此外,我们发现情景三一的临界点小于情景二二的临界点。对于相同水平的lambda 和f,涉及独立性的场景的临界点小于具有反向主体的场景。从社会物理学的角度来看,我们观察到情景 3-1 可能会陷入僵局,而不是情景 2-2。令人惊讶的是,涉及逆向投资者的情景比涉及独立的情景更有可能达成共识。我们对关键指数的估计表明,该模型仍与平均场 Ising 模型属于同一普遍性类别。

自动检测已开发自行车网络中的缺失链接

原文标题: Automated Detection of Missing Links in Developed Bicycle Networks

地址: http://arxiv.org/abs/2201.03402

作者: Anastassia Vybornova, Tiago Cunha, Astrid Gühnemann, Michael Szell

摘要: 骑自行车是使城市交通更具可持续性的有效解决方案。然而,自行车网络通常是在一个缓慢的、分段的过程中发展起来的,这会留下大量的空白,即使在像哥本哈根这样发达的自行车城市也是如此。在这里,我们通过分析来自 OpenStreetMap 的街道网络,开发了 IPCC 程序(识别、优先排序、聚类、分类),以找到发达城市自行车网络中最重要的缺失链接。我们将 IPCC 程序应用于哥本哈根,并报告了 105 个最重要的差距。为了评估,我们将这些差距与该市最新的自行车道优先计划进行比较,并发现相当大的重叠。我们的结果显示了具有最低数据要求的网络分析如何可以作为自行车网络规划的经济高效的支持工具。 IPCC 程序考虑了整个城市网络以巩固城市自行车网络,因此可以很好地补充本地化的手动规划流程,为更有效的全市决策提供数据驱动的框架。

用于评估未记录感染的分区流行病模型:在巴西 SARS-CoV-2 流行病中的应用

原文标题: Compartmental epidemic model to assess undocumented infections: applications to SARS-CoV-2 epidemics in Brazil

地址: http://arxiv.org/abs/2201.03476

作者: Guilherme S. Costa, Wesley Cota, Silvio C. Ferreira

摘要: 流行病传播的临近预报和预测,为决策者的决策提供基本支持,依靠报告病例的发病率系列得出基本的流行病学参数。预测的两个相关缺点是未记录病例的未知部分和跨越不同地方高度异质的非药物干预水平。我们描述了一种简单的方法,使用包括无症状和无症状前传染病的分区模型,该方法允许根据流行病学参数估计未记录感染的水平和报告病例系列的 R_t 值。该方法应用于巴西不同城市的 COVID-19 流行病系列,从而可以量化不同地方漏报的异质性水平。在当前框架内得出的生殖数对无症状状态期间的诊断和感染率都不太敏感,而对病例数系列的变化非常敏感。这里描述的方法是通用的,我们希望它们可以扩展到其他流行病学方法和监测数据。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20220111/