Arxiv网络科学论文摘要9篇(2022-01-17)

  • 广告活动的上下文bandit:一种独立于扩散模型的方法(扩展版);
  • 这一定是地方:在大规模分布式活动中预测在线社区的参与;
  • 评估巴西常规航空业疲劳的根本原因和相关风险因素;
  • 使用特征向量中心性的PageRank算法——新方法;
  • 全球阈值和骨干高分辨率天气雷达网络在分水岭中具有显著互补性;
  • “禁止中国间谍软件!”:Reddit 上对中国科技公司的舆论细粒度分析;
  • 微博客中多主题社交垃圾邮件检测的智能系统;
  • 美国极限飞盘最小二乘评级的实证研究;
  • 使用基于位置的数据指定短期灾难恢复期间的疏散返回和返航稳定性;

广告活动的上下文bandit:一种独立于扩散模型的方法(扩展版)

原文标题: Contextual Bandits for Advertising Campaigns: A Diffusion-Model Independent Approach (Extended Version)

地址: http://arxiv.org/abs/2201.05231

作者: Alexandra Iacob, Bogdan Cautis, Silviu Maniu

摘要: 受社交媒体中信息传播和广告场景的启发,我们研究了一个影响最大化问题,其中假设对传播网络或决定信息如何传播的模型知之甚少。在这样一个高度不确定的环境中,人们可以专注于多轮传播活动,目标是从已知的少数有影响力节点的基础开始,最大限度地增加受到影响或激活的不同用户的数量。在竞选期间,在连续的回合中依次选择传播种子,并在每回合以激活节点的形式收集反馈。然后将一轮的影响(奖励)量化为新激活节点的数量。总体而言,必须最大化活动的总传播,作为回合奖励的总和。在这种情况下,可以使用探索-利用方法来学习关键的潜在扩散参数,同时运行活动。我们描述并比较了上下文多臂老虎机的两种方法,对影响者的剩余潜力具有置信上限,一种使用广义线性模型和剩余潜力的 Good-Turing 估计器 (GLM-GT-UCB),另一种一种直接使 LinUCB 算法适应我们的设置(LogNorm-LinUCB)的算法。我们表明,它们在合成和真实世界数据上使用最先进的想法优于基线方法,同时根据部署它们的场景表现出不同和互补的行为。

这一定是地方:在大规模分布式活动中预测在线社区的参与

原文标题: This Must Be the Place: Predicting Engagement of Online Communities in a Large-scale Distributed Campaign

地址: http://arxiv.org/abs/2201.05334

作者: Abraham Israeli, Alexander Kremiansky, Oren Tsur

摘要: 理解大规模的集体决策,并阐明社区组织和社区动态如何塑造集体行为是社会科学研究的核心。在这项工作中,我们研究了拥有数百万活跃成员的数千个社区的行为。我们定义了一项新任务:预测哪个社区将进行意想不到的、大规模的分布式活动。为此,我们开发了一个混合模型,结合了文本线索、社区元数据和结构属性。我们展示了这种多方面的模型如何准确预测分布式环境中的大规模集体决策。我们通过 Reddit 的 r/place 大规模在线实验展示了我们模型的适用性,在该实验中,数以百万计的用户在数千个社区中自组织,为了实现他们的议程而发生冲突和协作。我们的混合模型实现了 0.826 的高 F1 预测分数。我们发现粗略的元特征对于预测准确性与细粒度的文本线索一样重要,而显式结构特征的作用较小。在解释我们的模型时,我们提供并支持关于参与 r/place 实验的社区的独特特征的各种社会见解。我们的结果和分析揭示了推动集体行为的复杂社会动态,以及推动用户协调的因素。 r/place 实验的规模和独特条件表明,我们的研究结果可能适用于更广泛的背景,例如在线激进主义、(反击)仇恨言论的传播和减少政治两极分化。通过对 WallStreetBets 社区、他们在 r/place 中的作用和 2021 年 GameStop 短挤活动的广泛分析,证明了该模型更广泛的适用性。

评估巴西常规航空业疲劳的根本原因和相关风险因素

原文标题: Evaluating the root causes of fatigue and associated risk factors in the Brazilian regular aviation industry

地址: http://arxiv.org/abs/2201.05438

作者: Tulio E. Rodrigues, Frida M. Fischer, Otaviano Helene, Eduardo Antunes, Eduardo Furlan, Eduardo Morteo, Alfredo Menquini, João Lisboa, Arnaldo Frank, Alexandre Simões, Karla Papazian, André F. Helene

摘要: 这项工作使用生物数学模型和来自巴西常规航空的机组人员名单的强大样本来评估疲劳的潜在根本原因。疲劳结果来自软件睡眠、活动、疲劳和任务有效性疲劳避免计划工具 (SAFTE-FAST)。飞行关键阶段的平均最低 SAFTE-FAST 有效性随 30 天内午夜至早上 6 点之间全部或部分经过的班次数量呈立方下降 (N_NS)。因此,当 N_NS 从 1 增加到 13 时,相对疲劳风险增加了 23.3%(95% CI,20.4-26.2%)。关键阶段的平均最大等效清醒度也随着N_NS 高于 10 的值班人员上夜班并超过 24 小时。飞行关键阶段的平均疲劳危险区域随凌晨 2 点和 6 点内的起飞和降落次数呈二次方变化 (N_Wocl) .这些发现表明,N_NS 和 N_Wocl 都应被视为关键绩效指标,并在建立机组人员名单时保持在合理可行的最低水平。 30 分钟时间间隔的有效性得分允许对作为一天中的时间函数的相对疲劳风险进行模型估计,其平均值与先前的飞行员误差测量值显示出合理的定性一致性。对夜班前午睡、从家到车站上下班以及早班前就寝时间的 SAFTE-FAST 输入的定制分析显示了相关组效应(p < 0.001),比较了有和没有下午的组小睡,一到两个小时的通勤时间,以及有或没有 SAFTE-FAST 软件的高级就寝时间功能,这表明在对疲劳风险因素进行建模时需要更好、更准确地理解这些参数。

使用特征向量中心性的PageRank算法——新方法

原文标题: PageRank Algorithm using Eigenvector Centrality – New Approach

地址: http://arxiv.org/abs/2201.05469

作者: Suvarna Saumya Chandrashekhar, Mashrin M Srivastava, B. Jaganathan, Pankaj Shukla

摘要: 研究的目的是找到一个可以用来代替 PageRank 的中心性度量,并找出我们可以使用它来代替 PageRank 的条件。使用 Spearman 的秩系数相关对具有大量节点的图进行分析和比较后,得出的结论是,在有向网络中可以安全地使用特征向量代替 PageRank 来提高时间复杂度方面的性能。

全球阈值和骨干高分辨率天气雷达网络在分水岭中具有显著互补性

原文标题: Global-threshold and backbone high-resolution weather radar networks are significantly complementary in a watershed

地址: http://arxiv.org/abs/2201.05503

作者: Aurelienne A. S. Jorge, Iuri da Silva Diniz, Vander L. S. Freitas, Izabelly C. Costa, Leonardo B. L. Santos

摘要: 从与地理空间中不同点相关的时间序列建立网络有几个标准。最常用的标准是全局阈值 (GT)。使用天气雷达数据集,本文表明骨干网 (BB) - 一种局部阈值标准 - 生成地理配置与 GT 网络互补的网络。我们比较了两个众所周知的相似性度量的结果:皮尔逊相关 (PC) 系数和互信息 (MI)。提取的骨干网络(miBB)的链接数与全局MI(miGT)相同,平均最短路径最低,呈现小世界效应。关于全局 PC(pcGT)及其对应的 BB 网络(pcBB),存在显著的线性关系:R2=0.77,pcGT 网络的斜率为 1.15(p 值 <E-7),对于 pcBB 网络,R2=0.68,斜率为 0.76(p 值 <E-7)。相对于 MI 而言,只有 miGT 呈现出较高的 R2(0.79,斜率 = 1.95),而 miBB 的 R2 只有 0.20(textslope =0.24) .一方面,GT 网络在靠近主要河流的中心区域呈现出相当大的连通分量。另一方面,BB 网络在分水岭周围和出口附近的主导单元中呈现出一些有意义的连通分量,在测高分布中具有显著的统计差异。

“禁止中国间谍软件!”:Reddit 上对中国科技公司的舆论细粒度分析

原文标题: “Ban the Chinese spyware!”: A Fine-Grained Analysis of Public Opinion toward Chinese Technology Companies on Reddit

地址: http://arxiv.org/abs/2201.05538

作者: Enting Zhou, Yurong Liu, Hanjia Lyu, Jiebo Luo

摘要: 面对日益增长的全球影响力和中国科技公司的盛行,世界各国政府都对这些公司表示了担忧和不信任。很少有研究关注公众对这种现象的大规模反应。本研究旨在填补使用 Reddit 数据(一个流行的以新闻为导向的社交媒体平台)理解公众对中国科技公司的看法的空白。我们采用最先进的 Transformer 模型来构建可靠的情感分类器。然后,我们使用 LDA 对与正面和负面评论相关的主题进行建模。我们还通过研究公司名称语义随时间的变化来进行内容分析。我们的主要调查结果如下: 1)对中国科技公司的负面评价比正面评价多 68%; 2) 正面评价主要与公司的消费产品有关,例如智能手机、笔记本电脑和可穿戴电子产品。负面评论的话题分布更加多样化(值得注意的话题包括对平台的批评、对公司智能手机产品的不满、公司与中国政府的关系、数据安全问题、5G 建设和一般政治讨论); 3) 每家科技公司的特征通常围绕与公司相关的特定主题,而现实世界的政治事件可能会引发用户特征的剧烈变化。

微博客中多主题社交垃圾邮件检测的智能系统

原文标题: An Intelligent System for Multi-topic Social Spam Detection in Microblogging

地址: http://arxiv.org/abs/2201.05203

作者: Bilal Abu-Salih, Dana Al Qudah, Malak Al-Hassan, Seyed Mohssen Ghafari, Tomayess Issa, Ibrahim Aljarah, Amin Beheshti, Sulaiman Alqahtan

摘要: 通信革命不断地改变了人们发送和接收信息的方式。社交媒体是这场革命的重要支柱,给我们生活的方方面面带来了深刻的变化。然而,这些平台的开放环境和普及开启了各种网络威胁的机会之窗,因此社会网络已成为垃圾邮件发送者和其他非法用户执行恶意活动的沃土。这些活动包括网络钓鱼热门和时尚话题以及在许多话题中发布广泛的内容。因此,不断引入新技术和方法来检测和阻止此类用户至关重要。本文提出了一种新颖而有效的方法来检测社交垃圾邮件发送者。对几个属性进行了调查,以衡量 Twitter 上依赖主题和独立于主题的用户行为。本研究的实验是在各种机器学习分类器上进行的。比较这些分类器的性能,并通过许多稳健的评估措施来衡量它们的有效性。此外,所提出的方法以最先进的社交垃圾邮件和异常检测技术为基准。这些实验报告了所提出的方法和嵌入式模块的有效性和实用性。

美国极限飞盘最小二乘评级的实证研究

原文标题: An Empirical Study of Least Squares Ratings for USA Ultimate Frisbee

地址: http://arxiv.org/abs/2201.05249

作者: Alexander N. Sietsema

摘要: 极限飞盘是世界上发展最快的运动之一。在美国,管理机构 USA Ultimate 使用自定义功率评级系统来确定各种竞争性锦标赛的投标分配。然而,这个评级系统有很大的缺陷,还有改进的余地。在本文中,我们应用了最小二乘评级系统,并在定性和相对于一些定量指标方面展示了它对当前系统的改进。

使用基于位置的数据指定短期灾难恢复期间的疏散返回和返航稳定性

原文标题: Specifying Evacuation Return and Home-switch Stability During Short-term Disaster Recovery Using Location-based Data

地址: http://arxiv.org/abs/2201.05253

作者: Cheng-Chun Lee, Charles Chou, Ali Mostafavi

摘要: 本研究的目标是:(1) 将疏散返回和返航稳定性确定为灾害期间和灾后短期恢复的两个关键里程碑; (2) 理解亚群在这些关键恢复里程碑的持续时间内的差异。使用保护隐私的高分辨率基于位置的数据,我们在 2017 年哈维飓风的背景下检查了德克萨斯州哈里斯县的疏散返回和家庭搬迁率。对于两个关键恢复里程碑中的每一个,结果都揭示了返回持续时间长短的区域,并能够评估撤离返回和归位开关稳定性模式的差异。事实上,洪水地区关键恢复里程碑指标的持续时间较短并不一定是一个积极的迹象。疏散返回时间较短可能是由于疏散障碍所致,而低收入居民的搬出率返回时间较短与居住在出租房屋中有关。此外,在所有亚群组中都观察到疏散返回和归位开关稳定性的偏斜和不均匀恢复模式。所有返回模式均显示两阶段返回进度模式。调查结果可以告知灾害管理人员和公职人员以更主动、数据驱动和公平的方式进行恢复监测和资源分配。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20220117/