Arxiv网络科学论文摘要11篇(2022-07-01)

  • 拓扑特征在链路预测中的最大能力;
  • 通过序列表征对网络拓扑和动态进行分类;
  • 无人机包裹递送系统的隐私路由;
  • 用于在线自适应影响最大化的可证明有效的强化学习;
  • SoK:社交媒体中的内容审核,从指南到执行,从研究到实践;
  • 打破多智能体、多选项动态中的优柔寡断;
  • 应对时间紧迫的网络安全威胁的有效集体行动;
  • 比较正向和反向接触者追踪的效率;
  • 符号自我网络模型及其在 Twitter 上的应用;
  • 通过社会认知和基于群体的过程遵守社交媒体上的错误信息;
  • 使用 BERT 进行 COVID-19 错误信息检测的两阶段分类器:对印度尼西亚推文的研究;

拓扑特征在链路预测中的最大能力

原文标题: The maximum capability of a topological feature in link prediction

地址: http://arxiv.org/abs/2206.15101

作者: Ran Yijun, Xu Xiao-Ke, Jia Tao

摘要: 链路预测旨在预测网络中不直接可见的链接,在生物和社会系统中具有深远的应用。尽管在此任务中大量使用了拓扑特征,但尚不清楚可以在多大程度上利用特定特征来推断缺失的链接。在这里,我们展示了拓扑特征的最大能力遵循一个简单的数学表达式,这与索引如何衡量特征无关。因此,与一个拓扑特征相关的一系列索引具有相同的性能限制。在监督预测中提升了特征的能力,与无监督预测相比,这通常会产生更好的结果。所发现的模式的普遍性通过 550 个结构多样的网络进行了经验验证,可应用于特征选择和与链路预测中的拓扑特征相关的网络特征分析。

通过序列表征对网络拓扑和动态进行分类

原文标题: Classification of network topology and dynamics via sequence characterization

地址: http://arxiv.org/abs/2206.15190

作者: Lucas Guerreiro, Filipi N. Silva, Diego R. Amancio

摘要: 序列出现在许多现实世界的场景中。因此,识别符号生成背后的机制对于理解许多复杂系统至关重要。本文分析了主体在网络拓扑上行走所生成的序列。鉴于在许多实际场景中,生成序列的底层过程是隐藏的,我们研究通过共现方法重建网络是否有助于恢复网络拓扑和主体动态生成序列。我们发现重建网络的表征提供了有关用于创建序列的过程和拓扑的有价值的信息。在将网络拓扑和主体动态的 16 种组合视为类的机器学习方法中,我们获得了 87% 的准确率,其中生成的序列访问的节点不到 40%。结果证明,更大的序列可以生成改进的机器学习模型。我们的研究结果表明,所提出的方法可以扩展到对序列进行分类并理解序列生成背后的机制。

无人机包裹递送系统的隐私路由

原文标题: Routing with Privacy for Drone Package Delivery Systems

地址: http://arxiv.org/abs/2203.04406

作者: Geoffrey Ding, Alex Berke, Karthik Gopalakrishnan, Kwassi H. Degue, Hamsa Balakrishnan, Max Z. Li

摘要: 无人驾驶飞行器 (UAV) 或无人机越来越多地用于将货物从供应商交付给客户。为了安全地大规模进行这些操作,无人机需要按照远程识别(远程 ID)法规的规定广播位置信息。然而,包裹递送无人机的位置广播给使用这些递送服务的客户带来了隐私风险:第三方观察者可能会利用广播无人机轨迹将客户与他们的购买联系起来,这可能会导致广泛的隐私风险。我们根据给定包裹递送路线将客户与供应商相关联的可能性提出了隐私风险的概率定义。接下来,我们量化这些风险,使无人机操作员能够在规划交付路线时评估隐私风险。然后,我们评估各种因素(例如无人机容量)对隐私的影响,并考虑隐私和交付等待时间之间的权衡。最后,我们提出了用于生成具有隐私保证的路由的启发式方法,以避免对所有可能的路由进行详尽的枚举,并在几个现实的交付场景中评估它们的性能。

用于在线自适应影响最大化的可证明有效的强化学习

原文标题: Provably Efficient Reinforcement Learning for Online Adaptive Influence Maximization

地址: http://arxiv.org/abs/2206.14846

作者: Kaixuan Huang, Yu Wu, Xuezhou Zhang, Shenyinying Tu, Qingyun Wu, Mengdi Wang, Huazheng Wang

摘要: 在线影响力最大化旨在通过选择几个种子节点来最大化内容在网络模型未知的社会网络中的影响力传播。最近的研究遵循非自适应设置,在扩散过程开始之前选择种子节点,并在扩散停止时更新网络参数。我们考虑了一个自适应版本的内容相关在线影响最大化问题,其中种子节点根据实时反馈顺序激活。在本文中,我们将问题表述为线性扩散过程下的无限范围折扣 MDP,并提出了一种基于模型的强化学习解决方案。我们的算法维护一个网络模型估计并自适应地选择种子用户,在探索社会网络的同时乐观地改进最优策略。我们为我们的算法建立了 widetilde O(sqrtT) 遗憾界。合成网络的实证评估证明了我们算法的效率。

SoK:社交媒体中的内容审核,从指南到执行,从研究到实践

原文标题: SoK: Content Moderation in Social Media, from Guidelines to Enforcement, and Research to Practice

地址: http://arxiv.org/abs/2206.14855

作者: Mohit Singhal, Chen Ling, Nihal Kumarswamy, Gianluca Stringhini, Shirin Nilizadeh

摘要: 为了应对在线滥用和错误信息,社交媒体平台一直在制定内容审核指南并采用各种审核政策。本文的目的是研究这些社区指南和审核实践,以及相关的研究出版物,以确定研究差距、审核技术的差异以及社交媒体平台和整个研究社区应解决的挑战.在这方面,我们研究和分析了美国司法管辖区 14 条最流行的社交媒体内容审核指南和做法,并加以整合。然后,我们介绍了从该分析中得出的三种分类法,并涵盖了一百多篇关于适度策略的跨学科研究论文。我们确定了主流社交媒体平台与边平台所采用的内容审核之间的差异。我们还强调了第 230 条的含义、内容审核中对透明度和不透明性的需求,为什么平台应该从一刀切模型转变为更具包容性的模型,最后,我们强调了为什么需要一个协作的人机人工智能系统。

打破多智能体、多选项动态中的优柔寡断

原文标题: Breaking indecision in multi-agent, multi-option dynamics

地址: http://arxiv.org/abs/2206.14893

作者: Alessio Franci, Martin Golubitsky, Ian Stewart, Anastasia Bizyaeva, Naomi Ehrich Leonard

摘要: 在决定质量难以区分的选项时,一组主体如何打破优柔寡断?生物和人工多智能体系统,从蜜蜂和鸟群到细菌、机器人和人类,在群体的表现甚至生存受到威胁的情况下,在选择选项时通常需要克服优柔寡断。打破优柔寡断也很重要,因为在完全优柔寡断的状态下,智能体不会偏向任何特定的选项,因此智能体组具有最大的敏感性,并且易于适应环境中的输入和变化。在这里,我们发展了一种数学理论来研究决策是如何从打破优柔寡断中产生的。我们的方法基于等变和网络分岔理论。我们将优柔寡断的决策建模为影响网络中的同步中断,其中每个节点都是主体分配给选项的值。首先,我们证明了三种普遍的决策行为,即僵局、共识和分歧,是影响网络中完全同步的犹豫不决状态的同步破坏分叉的一般结果。其次,我们证明了所有僵局和共识价值模式以及一些分歧价值模式都是通过影响网络的对称性来预测的。第三,我们表明也有许多“异国情调”的不同意见价值模式。这些模式是由网络架构预测的,而不是由网络对称性通过一个新的同步中断分支引理预测的。这是应用程序中奇异解决方案的第一个示例。新型影响网络模型的数值模拟说明了我们的理论结果。

应对时间紧迫的网络安全威胁的有效集体行动

原文标题: Efficient Collective Action for Tackling Time-Critical Cybersecurity Threats

地址: http://arxiv.org/abs/2206.15055

作者: Sébastien Gillard, Dimitri Percia David, Alain Mermoud, Thomas Maillart

摘要: 发现漏洞、建立和传播网络攻击之间的延迟减少给网络安全专业人员带来了巨大压力。为此,安全研究人员越来越多地采取集体行动,以减少表征和驯服突出威胁所需的时间。在这里,我们研究了开源威胁情报共享平台 MISP 上的加入和贡献动态如何影响集体完成威胁描述所需的时间。我们发现,性能,定义为快速描述威胁事件的能力,受以下因素的影响:(i)其自身的复杂性(负面),(ii)集体行动(正面),以及(iii)学习、信息集成和模块化(积极)。我们的研究结果表明,如何以模块化的方式大规模组织集体行动,以克服大量时间紧迫的任务,例如网络安全威胁。

比较正向和反向接触者追踪的效率

原文标题: Comparing the efficiency of forward and backward contact tracing

地址: http://arxiv.org/abs/2206.15080

作者: Jonas L. Juul, Steven H. Strogatz

摘要: 在与许多传染病的爆发作斗争时,追踪确诊病例的潜在感染接触者非常重要。 COVID-19 大流行促使研究人员研究不同的接触者追踪策略在有效性(减轻感染的能力)和成本效率(每次隔离预防感染的数量)方面的比较。两个重要的策略是所谓的前向接触者追踪(追踪疾病传播的对象)和反向接触者追踪(追踪疾病的传播者)。最近,Kojaku 及其同事报告说,反向接触者追踪比向前接触者追踪“更有效”,接触者追踪的有效性“取决于到达感染的‘源’”,并且接触者追踪在方面优于病例隔离的成本效率。在这里,我们表明这些结论通常不正确。它们部分基于大大高估了接触者追踪的有效性和效率的模拟。我们的结果表明,接触者追踪策略的效率是高度上下文相关的;面对疾病爆发,疾病动态决定了追踪感染源还是追踪新病例更有影响力。我们的结果还证明了并行而不是顺序模拟疾病传播和缓解措施的重要性。

符号自我网络模型及其在 Twitter 上的应用

原文标题: Signed ego network model and its application to Twitter

地址: http://arxiv.org/abs/2206.15228

作者: Jack Tacchi, Chiara Boldrini, Andrea Passarella, Marco Conti

摘要: 自我网络模型 (ENM) 描述了个人如何在亲密度递减的同心圆(通常为五个)中组织他们的社会关系,并且在社会网络中几乎无处不在,无论是离线还是在线。 ENM 根据交互频率来衡量同伴之间的联系强度,这很容易衡量,并为培养关系所花费的时间提供了一个很好的主体。然而,有符号网络分析的进展表明,正负关系在网络动态中扮演着非常不同的角色。出于这个原因,这项工作着手调查包含已签署关系的 ENM。本文的主要贡献是双重的:首先,一种使用情感分析来签署个人之间关系的新方法,其次,对 Signed Ego Networks(具有符号连接的 Ego Networks)属性的调查。然后为由专业用户(例如记者)和普通用户组成的八个不同 Twitter 数据集的用户提取符号的自我网络。我们发现负面链接在所有类型用户的 Ego 网络的活跃部分中都出现过多,这表明 Twitter 用户倾向于定期与负面联系互动。此外,我们观察到负面关系在专业用户的 Ego Network 圈子中占绝对优势,暗示此类用户的在线互动非常两极分化。此外,对于记者来说,在 ENM 更亲密的层面上,负面关系的比例更高,而在其他 Twitter 用户的圈子中,它们的百分比是稳定的

通过社会认知和基于群体的过程遵守社交媒体上的错误信息

原文标题: Adherence to Misinformation on Social Media Through Socio-Cognitive and Group-Based Processes

地址: http://arxiv.org/abs/2206.15237

作者: Alexandros Efstratiou, Emiliano De Cristofaro

摘要: 以前的工作表明,人们对不同类型信息的偏好不仅仅取决于准确性。这可能会发生,因为包含在不同信息片段中的消息可能很受欢迎或令人反感。尽管事实信息必须经常传达令人不安的事实,但错误信息可能很少考虑真实性并利用心理过程来增加其在社交媒体上的吸引力和扩散。在这篇综述中,我们认为,当错误信息激增时,这是因为社交媒体环境通过减少而不是增加这样做的心理成本来使人们坚持错误信息。我们涵盖了注意力如何经常从准确性转移到其他目标,社会和个人认知如何受到错误信息的影响以及揭穿它最有效的情况,以及在线群体的形成如何影响信息消费模式,通常会导致导致更多的两极分化和激演化。自始至终,我们都认为两极分化和错误信息的依从性密切相关。我们确定了在设计反错误信息干预措施或有弹性的负担能力时可以增加坚持错误信息的心理成本的方式,并且我们概述了 CSCW 社区在进一步理解这一成本时可以采取的开放研究问题。

使用 BERT 进行 COVID-19 错误信息检测的两阶段分类器:对印度尼西亚推文的研究

原文标题: Two-Stage Classifier for COVID-19 Misinformation Detection Using BERT: a Study on Indonesian Tweets

地址: http://arxiv.org/abs/2206.15359

作者: Douglas Raevan Faisal, Rahmad Mahendra

摘要: 自 2020 年初以来,COVID-19 大流行在全球范围内造成了重大影响。这给社会带来了很多混乱,尤其是由于错误信息通过社交媒体传播。尽管已经有几项研究与检测社交媒体数据中的错误信息有关,但大多数研究都集中在英语数据集上。印度尼西亚对 COVID-19 错误信息检测的研究仍然很少。因此,通过这项研究,我们收集和注释印度尼西亚的数据集,并通过考虑推文的相关性来构建用于检测 COVID-19 错误信息的预测模型。数据集的构建由一组注释者执行,他们标记了推文数据的相关性和错误信息。在这项研究中,我们提出了使用 IndoBERT 预训练语言模型的两阶段分类器模型,用于 Tweet 错误信息检测任务。我们还尝试了其他几个用于文本分类的基线模型。实验结果表明,用于相关性预测的 BERT 序列分类器和用于错误信息检测的 Bi-LSTM 的组合以 87.02% 的准确率优于其他机器学习模型。总体而言,BERT 的使用有助于大多数预测模型的更高性能。我们以印度尼西亚语发布了高质量的 COVID-19 错误信息推文语料库,由高度的注释者间协议表明。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20220701/