Arxiv网络科学论文摘要11篇(2022-04-25)

  • 平衡推荐系统的消费者和商业价值:基于模拟的分析;
  • PubMed 摘要中基因/蛋白质相互作用的全局映射:P53 相互作用的框架和实验;
  • 使用“注意力”框架对欺诈检测中的图动态建模;
  • 测量沙拉碗:推特上的超级多样性;
  • 独立动态社会网络数据的贝叶斯混合效应模型;
  • Tweets2Stance:利用推文上的零样本学习算法进行用户立场检测;
  • 通过阴谋的途径:通过参与在线阴谋讨论的阴谋激演化的演变;
  • 艺术的折叠:在有限的空间里回避过去;
  • 初始暴发地点对市区内传染病传播风险的影响;
  • 预测高速公路变道操作:机器和集成学习算法的基准分析;
  • S2AMP:从出版物中推断出的学术指导的高覆盖率数据集;

平衡推荐系统的消费者和商业价值:基于模拟的分析

原文标题: Balancing Consumer and Business Value of Recommender Systems: A Simulation-based Analysis

地址: http://arxiv.org/abs/2203.05952

作者: Nada Ghanem, Stephan Leitner, Dietmar Jannach

摘要: 现在可以在许多在线平台上找到自动推荐,这些推荐可以为消费者和提供者创造可观的价值。然而,通常并非所有可推荐的项目都具有相同的利润率,因此供应商可能会倾向于推广最大化其利润的项目。在短期内,消费者可能会接受非最佳推荐,但从长远来看,他们可能会失去信任。最终,这导致了设计平衡推荐策略的问题,该策略考虑了消费者和提供者的价值,并导致了持续的商业成功。这项工作提出了一个基于基于主体的建模的模拟框架,旨在帮助提供商探索不同推荐策略的纵向动态。在我们的模型中,消费者主体从提供者那里接收推荐,并且推荐的感知质量会随着时间的推移影响消费者的信任。此外,我们考虑了在社交媒体上与他人分享积极和消极体验的网络效应。使用我们的框架进行的模拟表明,考虑到利益相关者的平衡策略确实会带来稳定的消费者信任和持续的盈利能力。我们还发现,社交媒体可以强化负面体验时失去信任等现象。为了确保可重复性并促进未来的研究,我们公开分享我们灵活的模拟框架。

PubMed 摘要中基因/蛋白质相互作用的全局映射:P53 相互作用的框架和实验

原文标题: Global Mapping of Gene/Protein Interactions in PubMed Abstracts: A Framework and an Experiment with P53 Interactions

地址: http://arxiv.org/abs/2204.10476

作者: Xin Li, Hsinchun Chen, Zan Huang, Hua Su, Jesse D. Martinez

摘要: 基因/蛋白质相互作用为全面理解细胞过程提供了关键信息。最近,相当大的兴趣和努力集中在全基因组基因网络的构建和分析上。大量的生物医学文献是基因/蛋白质相互作用信息的重要来源。文本挖掘工具的最新进展使得从自由文本文献中自动提取此类记录的交互成为可能。在本文中,我们提出了一个综合框架,用于构建和分析基于使用文本挖掘工具从生物医学文献库中提取的基因/蛋白质相互作用的大规模基因功能网络。我们提出的框架包括对网络拓扑、网络拓扑-基因功能关系和时间网络演化的分析,以提炼文献中嵌入基因功能相互作用的有价值信息。我们使用 P53 相关 PubMed 摘要的测试平台演示了所提出框架的应用,这表明基于文献的 P53 网络表现出小世界和无标度的特性。我们还发现,基于文献的网络中的高度基因很可能出现在手动策划的数据库中,并且同一途径中的基因倾向于在我们的基于文献的网络中形成局部集群。时间分析表明,与许多其他基因相互作用的基因倾向于参与大量新发现的相互作用。

使用“注意力”框架对欺诈检测中的图动态建模

原文标题: Modelling graph dynamics in fraud detection with “Attention”

地址: http://arxiv.org/abs/2204.10614

作者: Susie Xi Rao, Clémence Lanfranchi, Shuai Zhang, Zhichao Han, Zitao Zhang, Wei Min, Mo Cheng, Yinan Shan, Yang Zhao, Ce Zhang

摘要: 在在线零售平台,检测欺诈账户和交易对于改善客户体验、减少损失和避免未经授权的交易至关重要。尽管有多种不同的模型用于图的深度学习,但很少有方法被提出来处理异构和动态的图。在本文中,我们提出了 DyHGN(动态异构图神经网络)及其变体来刻画时间和异构信息。我们首先从 eBay 的注册和交易数据构建动态异构图。然后,我们使用历时实体嵌入和异构图转换器构建模型。我们还使用模型可解释性技术来理解 DyHGN-模型的行为。我们的研究结果表明,需要根据数据结构、分布和计算成本对具有异构输入的图动态建模进行“注意”。

测量沙拉碗:推特上的超级多样性

原文标题: Measuring the Salad Bowl: Superdiversity on Twitter

地址: http://arxiv.org/abs/2204.10646

作者: Laura Pollacci, Alina Sirbu, Fosca Giannotti, Dino Pedreschi

摘要: 超级多样性是指由于移民而导致的人口中的巨大文化多样性。在本文中,我们介绍了一个基于多元文化社区使用的单词的情感内容与标准语言相比的变化的超多样性指数。为了计算我们的索引,我们使用 Twitter 数据,并开发了一种算法来扩展字典以进行基于词典的情感分析。我们通过 D4I 数据挑战将其与欧盟委员会联合研究中心提供的官方移民统计数据进行比较来验证我们的指数。我们表明,总的来说,我们的衡量标准与各种地理分辨率下的移民率相关。我们的方法在各种语言中产生了非常好的结果,并在英语和意大利语推文上进行了测试。我们认为,我们的指数在无法获得确切移民数据的地区具有预测能力,为移民率的临近预报模型铺平了道路。

独立动态社会网络数据的贝叶斯混合效应模型

原文标题: Bayesian mixed-effect models for independent dynamic social network data

地址: http://arxiv.org/abs/2204.10676

作者: Fabio Vieira, Roger Leenders, Daniel McFarland, Joris Mulder

摘要: 多年来,关系事件或带时间戳的社会网络数据变得越来越可用。因此,这些数据的统计方法也浮出水面。这些技术基于社会网络中交互率的对数线性模型,通过参与者协变量和网络统计。特别是,生存分析概念的使用在过去十年中刺激了强大方法的发展。这些模型主要集中在单个网络的分析上。迄今为止,很少有模型可以联合处理多个关系事件网络。在本文中,我们为多个关系事件序列提出了一种新的贝叶斯层次模型。这种方法允许在行为者层面进行推断,这有助于理解哪些影响会引导行为者在社交互动中的偏好。我们还提出了在此类模型中进行假设检验的贝叶斯因子。此外,还开发了一种新的贝叶斯因子来测试随机效应结构。在这个测试中,我们让先验由数据决定,减轻在贝叶斯因子中使用不正确的先验的问题,从而防止在没有先验信息的情况下使用临时选择。我们使用高中生课堂互动的数据来说明所提出的方法。

Tweets2Stance:利用推文上的零样本学习算法进行用户立场检测

原文标题: Tweets2Stance: Users stance detection exploiting Zero-Shot Learning Algorithms on Tweets

地址: http://arxiv.org/abs/2204.10710

作者: Margherita Gambini, Tiziano Fagni, Caterina Senette, Maurizio Tesconi

摘要: 在过去的几年里,人们越来越关注预测活跃社交媒体用户的政治取向,这对研究政治预测、意见动态建模和用户两极分化有很大帮助。现有的方法,主要针对 Twitter 用户,依赖于基于内容的分析或基于内容、网络和通信分析的混合。最近的研究观点利用用户的政治亲和力主要取决于他/她在重大政治和社会问题上的立场这一事实,从而将重点转移到通过在社会网络上共享的用户生成内容来检测用户的立场。本文描述的工作侧重于完全无监督的立场检测框架,该框架通过利用其 Twitter 时间线的基于内容的分析来预测用户对特定社会政治陈述的立场。真实用户的立场可能来自投票建议应用程序,这是一种在线工具,可通过将公民的政治偏好与政党政治立场进行比较来帮助公民识别其政治倾向。从 6 方对 20 种不同声明的协议水平的理解开始,该研究的目的是预测 P 方对于每条声明利用 Twitter 党帐户在 Twitter 上所写内容的立场。为此,我们提出了 Tweets2Stance (T2S),这是一种新颖且完全无监督的姿态检测器框架,它依赖于零样本学习技术来快速准确地对未标记的数据进行操作。有趣的是,T2S 可以应用于任何社交媒体用户的任何感兴趣的上下文,而不仅限于政治上下文。多次实验结果表明,虽然一般最大 F1 值为 0.4,但 T2S 可以正确预测姿态,一般最小 MAE 为 1.13,考虑到任务复杂性,这是一个了不起的成就。

通过阴谋的途径:通过参与在线阴谋讨论的阴谋激演化的演变

原文标题: Pathways through Conspiracy: The Evolution of Conspiracy Radicalization through Engagement in Online Conspiracy Discussions

地址: http://arxiv.org/abs/2204.10729

作者: Shruti Phadke, Mattia Samory, Tanushree Mitra

摘要: 在线阴谋论 (CT) 讨论中参与者的破坏性离线动员凸显了理解在线用户如何形成激进的阴谋信念的重要性。虽然之前的工作研究了导致加入在线 CT 讨论的因素并提供了关于阴谋信念如何形成的理论,但我们对用户加入 CT 讨论社区后阴谋激演化如何演变知之甚少。在本文中,我们提供了在线 CT 讨论参与者中各种激演化阶段的经验模型。为了揭示阴谋参与与激演化的关系,我们首先通过阴谋参与途径描述用户通过 CT 讨论的旅程。具体来说,通过研究 36K Reddit 用户的 1.69 亿贡献,我们发现了四种不同的阴谋参与途径:稳定高、增加、减少和稳定低。我们进一步模拟了由先前理论工作指导的三个连续的激演化阶段。用户的特定子群,即那些处于稳定高和增加的阴谋参与路径的用户,依次通过各个激演化阶段。相比之下,参与度下降的用户表现出不同的行为:他们将 CT 讨论限制在专业主题,参与不同的讨论组,并且对阴谋子版块的一致性降低。通过检查脱离在线 CT 讨论的用户,本文提供了有关阴谋恢复过程的有希望的见解。

艺术的折叠:在有限的空间里回避过去

原文标题: The folding of art: avoiding one’s past in finite space

地址: http://arxiv.org/abs/2204.10735

作者: Anders Levermann

摘要: 纵观人类历史,新一代都在努力创造自己的艺术风格,同时努力避免重复前几代人的音乐。如果我们假设这种搜索发生在多维但受限的创​​造力空间中,则会产生高度复杂的动态。我们提出了一个非常简单的数学模型,它有两个参数,可以作为有限空间中过去回避的通用表示,并且在质量上与早期的动力系统不同。在所呈现的径向受限形式中,轨迹保持其复杂性,同时在更高维度考虑时回缩到恒定半径的超曲面附近。

初始暴发地点对市区内传染病传播风险的影响

原文标题: Impact of initial outbreak locations on transmission risk of infectious diseases in an intra-urban area

地址: http://arxiv.org/abs/2204.10752

作者: Kang Liu, Ling Yin, Jianzhang Xue

摘要: 传染病通常起源于城市内的特定位置。由于人口和公共设施分布的异质性,以及嵌入空间的人员流动网络的结构异质性,传染病在不同地点爆发会导致不同的传播风险和控制难度。本研究旨在调查初始爆发地点对时空传播风险的影响,并揭示高风险爆发地点背后的驱动力。首先,整合手机位置数据,我们建立了一个基于 SLIR(susceptible-latent-infectious-removed)的元种群模型来模拟传染病(即 COVID-19)在细粒度的城内传播过程地区(即中国深圳市的 649 个社区)。基于仿真模型,我们通过提出感染病例数(CaseNum)、受影响区域数(RegionNum)和空间扩散范围(SpatialRange)三个指标来评估不同初始爆发地点造成的传播风险。最后,我们通过机器学习模型研究了不同影响因素对传播风险的贡献。结果表明,不同的初始爆发位置会导致相似的 CaseNum 但不同的 RegionNum 和 SpatialRange。为避免疫情迅速向更多地区蔓延,必须防止疫情在人口流动密度大的地区爆发。而为避免疫情蔓延到更大的空间范围,需要注意居民日常出行距离较长的偏远地区。这些发现有助于理解城市内最初爆发地点的传播风险和驱动力,并提前制定精准的防控策略。

预测高速公路变道操作:机器和集成学习算法的基准分析

原文标题: Predicting highway lane-changing maneuvers: A benchmark analysis of machine and ensemble learning algorithms

地址: http://arxiv.org/abs/2204.10807

作者: Basma Khelfa, Ibrahima Ba, Antoine Tordeux

摘要: 理解和预测高速公路上的变道操作对于驾驶建模及其自动化至关重要。如今,基于数据的换道决策算法的开发正在全面展开。我们在本文中经验性地比较了不同的机器和集成学习分类技术与使用欧洲双车道高速公路轨迹数据的基于规则的 MOBIL 模型。该分析依赖于对多达 24 个时空变量的瞬时测量,其中四个相邻车辆在当前和相邻车道上。通过主成分和逻辑分析进行的初步描述性调查允许识别打算驾驶员改变车道的主要变量。我们预测两种类型的自主变道操作:超车(从慢车道到快车道)和折叠(从快车道到慢车道)。使用总的、变道和保持车道误差以及相关的接收器操作特性曲线来量化预测精度。基准分析包括逻辑模型、线性判别、决策树、朴素贝叶斯分类器、支持向量机、神经网络机器学习算法,以及多达十个 bagging 和 stacking 集成学习元启发式。如果基于规则的模型提供有限的预测准确性,特别是在折叠的情况下,基于数据的算法,没有建模偏差,允许显著的预测改进。交叉验证表明,选定的神经网络和堆叠算法允许从单个观察预测折叠和超车提前四秒以高精度进行机动。

S2AMP:从出版物中推断出的学术指导的高覆盖率数据集

原文标题: S2AMP: A High-Coverage Dataset of Scholarly Mentorship Inferred from Publications

地址: http://arxiv.org/abs/2204.10838

作者: Shaurya Rohatgi, Douglas Downey, Daniel King, Sergey Feldman

摘要: 指导是学术界的重要组成部分,但不如出版物、引文、赠款和奖励那么明显。尽管研究指导的质量和影响很重要,但很少有大型的具有代表性的指导数据集可用。我们为指导研究提供了两个数据集。第一个有 300,000 对从多个不同的、手动策划的来源获得的真实学术导师-受训者对,并链接到语义学者 (S2) 知识图谱。我们使用这个数据集来训练一个准确的分类器,用于根据书目特征预测师徒关系,在 ROC 曲线下实现 0.96 的保留区域。我们的第二个数据集是通过将分类器应用于 S2 的完整合着图成的。结果是一个推断图,在 2400 万个节点中具有 1.37 亿个加权指导边。我们向社区发布了这个首创的数据集,以帮助加速学术指导的研究:urlhttps://github.com/allenai/S2AMP-data

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20220425/