- 从历史地图自动大规模重建过去的道路网络;
- 社交互动影响发现过程;
- 对称网络主成分分析的耦合CP分解;
- 利用MIC协调杂音:平台调节的负担能力感知框架;
- 多智能体交流博弈中语言与感知的相互影响;
- 用于高效跨视图视频检索的混合对比量化;
- 部署疫苗分发站点以提高可及性和公平性以支持大流行应对;
- “这是假的!误传”:评估假新闻传播者的意图;
- 网络和身份驱动语言创新扩散的地理特性;
- 理解大流行期间 Twitter 的行为:假新闻和恐惧;
- 表征、检测和预测在线禁令规避;
从历史地图自动大规模重建过去的道路网络
原文标题: Towards the automated large-scale reconstruction of past road networks from historical maps
地址: http://arxiv.org/abs/2202.04883
作者: Johannes H. Uhl, Stefan Leyk, Yao-Yi Chiang, Craig A. Knoblock
摘要: 交通基础设施,例如公路或铁路网络,是我们文明的基本组成部分。对于可持续规划和知情决策,全面理解道路网络等交通基础设施的长期演变至关重要。然而,在 2000 年代之前,覆盖大空间范围的空间明确、多时相的道路网络数据稀缺且很少可用。在这里,我们提出了一个框架,该框架采用越来越多的可用扫描和地理参考历史地图系列来重建过去的道路网络,通过整合丰富的当代道路网络数据和从历史地图中提取的颜色信息。具体来说,我们的方法使用当代路段作为分析单元,并通过基于图像处理和聚类技术推断它们在历史地图系列中的存在来提取历史道路。我们在代表美国超过 50,000 公里道路网络的 300,000 多条路段上测试了我们的方法,这些路段跨越三个研究区域,涵盖 1890 年至 1950 年间的 53 张历史地形图。我们通过与其他历史地形图的比较来评估我们的方法数据集和手动创建的参考数据,F-1 得分高达 0.95,并表明提取的道路网络统计数据随着时间的推移是高度可信的,即遵循一般增长模式。我们证明,当代地理空间数据与从历史地图系列中提取的信息相结合,为长期城市化进程和景观变化的定量分析开辟了新的途径,远远超出了业务遥感和数字制图的时代。
社交互动影响发现过程
原文标题: Social interactions affect discovery processes
地址: http://arxiv.org/abs/2202.05099
作者: Gabriele Di Bona, Enrico Ubaldi, Iacopo Iacopini, Bernardo Monechi, Vito Latora, Vittorio Loreto
摘要: 我们的熟人网络决定了我们如何接触想法、产品或文化艺术品(书籍、音乐、电影等)。尽管这一原则是我们常识的一部分,但对于我们的同龄人影响我们的发现过程和我们对新事物的体验的具体途径知之甚少。在这里,我们通过调查一个数据集来填补这一空白,该数据集包含来自在线音乐平台 emphLast.fm 的大量具有社交联系的用户样本的完整收听历史。我们证明了用户对新歌曲和艺术家的发现率表现出高度异质性,并且他们的社交社区显著影响了他们的行为。更具探索性的用户倾向于与更倾向于探索新内容的同行互动。我们在建模方案中捕捉到这种现象学,其中用户由随机游走者代表,探索歌曲或艺术家的图表,并通过他们的社交链接相互交互。即使从统一的主体群体(个体之间没有自然差异)开始,我们的模型也预测了强烈的异质探索模式的出现,用户根据他们的音乐品味和探索倾向进行聚类。我们认为我们的方法可以为集体发现过程的定量方法铺平道路。
对称网络主成分分析的耦合CP分解
原文标题: A Coupled CP Decomposition for Principal Components Analysis of Symmetric Networks
地址: http://arxiv.org/abs/2202.04719
作者: Michael Weylandt, George Michailidis
摘要: 在许多应用领域中,人们观察到一系列网络数据;例如,用户在社交媒体平台、金融相关网络中随时间推移或跨学科的交互之间的重复测量,如大脑连通性的多学科研究。分析此类数据的一种方法是将网络堆叠成三阶数组或张量。我们基于半对称张量的新分解,提出了序列网络数据的主成分分析 (PCA) 框架。我们推导出计算我们提出的“耦合 CP”分解的有效算法,并在尖峰协方差模型的模拟下建立我们方法的估计一致性,其速率与矩阵情况相同,直至对数项。我们的框架继承了经典 PCA 的许多优点,适用于广泛的无监督学习任务,包括识别主要网络、隔离观察中有意义的变化点或异常值,以及表征最变化边的“可变性网络”。最后,我们证明了我们的提议在模拟数据以及政治学和金融经济学示例上的有效性。用于建立我们的主要一致性结果的证明技术令人惊讶地直截了当,并且可能会在各种其他矩阵和张量分解问题中找到用途。
利用MIC协调杂音:平台调节的负担能力感知框架
原文标题: Harmonizing the Cacophony with MIC: An Affordance-aware Framework for Platform Moderation
地址: http://arxiv.org/abs/2107.09008
作者: Tanvi Bajpai, Drshika Asher, Anwesa Goswami, Eshwar Chandrasekharan
摘要: 社交平台正在快速发展。随着实时音频等新功能的增加,在线社区的景观和这些社区的审核工作正在被平台开发所超越。在本文中,我们提出了一个新颖的框架,它允许我们使用 12 个平台级可供性的基础集以及可供性间的关系来表示社交平台的动态调节生态系统。这些可供性分为三类——成员、基础设施和内容。我们将此称为 MIC 框架,并在两个案例研究中应用 MIC 分析多个社交平台。首先,我们使用 MIC 分析各个平台,并演示如何使用 MIC 来检查平台更改对审核生态系统的影响,并确定审核中潜在的新挑战。接下来,我们系统地比较了三个使用 MIC 的平台,并提出了平台可以相互适应的潜在调节机制。审核研究人员和平台设计人员可以使用此类比较来发现平台可以在哪些方面模仿已建立、成功和研究得更充分的平台,并从其他平台遇到的陷阱中学习。
多智能体交流博弈中语言与感知的相互影响
原文标题: Mutual influence between language and perception in multi-agent communication games
地址: http://arxiv.org/abs/2112.14518
作者: Xenia Ohmer, Michael Marino, Michael Franke, Peter König
摘要: 语言与许多其他认知领域的接口。本文探讨了如何使用深度学习方法研究这些界面的交互,重点关注语言出现和视觉感知之间的关系。为了模拟语言的出现,发送者和接收者主体在参考博弈上进行训练。主体被实现为具有专用视觉和语言模块的深度神经网络。受认知中语言和感知之间的相互影响的启发,我们对主体的(i)视觉表征进行系统操作,以分析对紧急交流的影响,以及(ii)通信协议,以分析对视觉表征的影响。我们的分析表明,感知偏差塑造了语义分类和交流内容。相反,如果通信协议沿某些属性划分对象空间,主体会学习更准确地表示有关这些属性的视觉信息,并且通信伙伴的表示会对齐。最后,一项演化分析表明,视觉表征的演化可能部分是为了促进与环境相关的区别的交流。除了考虑语言和感知之间的共同适应效应外,我们的结果还指出了调节和改善人工主体中视觉表征学习和紧急交流的方法。
用于高效跨视图视频检索的混合对比量化
原文标题: Hybrid Contrastive Quantization for Efficient Cross-View Video Retrieval
地址: http://arxiv.org/abs/2202.03384
作者: Jinpeng Wang, Bin Chen, Dongliang Liao, Ziyun Zeng, Gongfu Li, Shu-Tao Xia, Jin Xu
摘要: 随着最近基于视频的社交平台(例如 YouTube 和 TikTok)的蓬勃发展,使用句子查询的视频检索已成为一项重要需求,并引起了越来越多的研究关注。尽管性能不错,但视觉和语言社区中现有的文本视频检索模型对于大规模 Web 搜索是不切实际的,因为它们采用基于高维嵌入的蛮力搜索。为了提高效率,Web 搜索引擎广泛应用向量压缩库(例如 FAISS)来对学习的嵌入进行后处理。不幸的是,将压缩与特征编码分开会降低表示的鲁棒性并导致性能下降。为了在性能和效率之间寻求更好的平衡,我们提出了第一个用于跨视图视频检索的量化表示学习方法,即混合对比量化(HCQ)。具体来说,HCQ 通过转换器学习粗粒度和细粒度量化,为文本和视频提供互补的理解,并保留全面的语义信息。通过跨视图执行非对称量化对比学习 (AQ-CL),HCQ 在粗粒度和多个细粒度级别对齐文本和视频。这种混合粒度的学习策略对跨视图视频量化模型起到了强有力的监督作用,不同层次的对比学习可以相互促进。在三个 Web 视频基准数据集上进行的大量实验表明,HCQ 使用最先进的非压缩检索方法实现了具有竞争力的性能,同时在存储和计算方面表现出高效率。代码和配置可在 https://github.com/gimpong/WWW22-HCQ 获得。
部署疫苗分发站点以提高可及性和公平性以支持大流行应对
原文标题: Deploying Vaccine Distribution Sites for Improved Accessibility and Equity to Support Pandemic Response
地址: http://arxiv.org/abs/2202.04705
作者: George Li, Ann Li, Madhav Marathe, Aravind Srinivasan, Leonidas Tsepenekas, Anil Vullikanti
摘要: 为了应对 COVID-19,许多国家已强制要求保持社交距离并禁止大型团体聚会,以减缓 SARS-CoV-2 的传播。这些社会干预措施以及疫苗仍然是减少 SARS CoV-2 传播的最佳途径。为了增加疫苗的可及性,弗吉尼亚等州已经部署了移动疫苗接种中心,在全州分发疫苗。在选择放置这些站点的位置时,需要考虑两个重要因素:可访问性和公平性。我们制定了一个捕捉这些因素的组合问题,然后在这两个方面开发具有理论保证的有效算法。此外,我们研究了问题的内在难度,并证明了强烈的不可能性结果。最后,我们对真实世界的数据进行计算实验,以展示我们方法的有效性。
“这是假的!误传”:评估假新闻传播者的意图
原文标题: “This is Fake! Shared it by Mistake”: Assessing the Intent of Fake News Spreaders
地址: http://arxiv.org/abs/2202.04752
作者: Xinyi Zhou, Kai Shu, Vir V. Phoha, Huan Liu, Reza Zafarani
摘要: 个人可能会被假新闻误导并在不知情的情况下无意传播。这种现象经常被观察到,但还没有被研究过。我们在这项工作中的目的是评估假新闻传播者的意图。为了区分有意传播与无意传播,我们研究了无意传播的心理学解释。在此基础上,我们提出了一个影响图,我们使用它来评估假新闻传播者的意图。我们广泛的实验表明,评估的意图可以帮助显著区分有意和无意的假新闻传播者。此外,估计的意图可以显著改进当前检测假新闻的技术。据我们所知,这是第一个模拟个人在假新闻传播中的意图的工作。
网络和身份驱动语言创新扩散的地理特性
原文标题: Networks and Identity Drive Geographic Properties of the Diffusion of Linguistic Innovation
地址: http://arxiv.org/abs/2202.04842
作者: Aparna Ananthasubramaniam, David Jurgens, Daniel M. Romero
摘要: 文化创新(例如音乐、信仰、语言)的采用通常在地理上是相关的,采用者主要居住在相对较少的经过充分研究的、具有社会意义的领域的边界内。这些文化区域通常被假设为(i)身份表现推动文化创新的采用,或(ii)传播网络中的同质性的结果。在这项研究中,我们表明人口特征和网络拓扑都是模拟创新扩散所必需的,因为它们在产生其空间特性方面发挥着互补作用。我们开发了一个基于主体的文化采用模型,并根据我们从 10% 的 Twitter 样本中识别出的创新词的新数据集验证模型中的地理传播模式。使用我们的模型,我们能够直接将组合网络 + 身份扩散模型与模拟的仅网络和仅身份反事实进行比较——使我们能够测试网络和身份的单独和组合角色。虽然社会科学家经常将网络或身份视为文化变化建模的核心社会结构,但我们表明,扩散的关键地理特性实际上取决于这两个因素,因为每个因素都会影响不同的扩散机制。具体而言,网络主要通过弱联系扩散在城市县之间推动传播,而身份通过强联系扩散在农村县之间的传播中发挥了不成比例的作用。城乡之间的扩散是创新在全国扩散的关键组成部分,需要网络和身份。我们的工作表明,模型必须整合这两个因素才能理解和再现创新的采用。
理解大流行期间 Twitter 的行为:假新闻和恐惧
原文标题: Understanding Twitters behavior during the pandemic: Fake News and Fear
地址: http://arxiv.org/abs/2202.05134
作者: Guillermo Romera Rodriguez, Sanjana Gautam, Andrea Tapia
摘要: SARS-CoV-2 新型冠状病毒 (COVID-19) 的爆发伴随着大量关于该病毒的误导和虚假信息,尤其是在社交媒体上。在大流行期间,社交媒体获得了特别的关注,因为它继续成为重要的交流媒介。这使得在这些平台上传递的信息尤其重要。在我们的工作中,我们旨在探索假新闻在 Twitter 上传播的百分比,同时衡量公众的情绪。我们进一步研究了恐惧情绪是如何在公众中存在的。除此之外,我们还将病毒每天的传播速度与 Twitter 上假新闻的传播速度进行比较。我们的研究有助于确定 Twitter 和社交媒体在危机期间的作用,尤其是在危机管理期间。
表征、检测和预测在线禁令规避
原文标题: Characterizing, Detecting, and Predicting Online Ban Evasion
地址: http://arxiv.org/abs/2202.05257
作者: Manoj Niverthi, Gaurav Verma, Srijan Kumar
摘要: 版主和自动化方法对从事破坏性行为的恶意用户实施禁令。但是,恶意用户可以轻松创建新帐户来规避此类禁令。以前的研究集中在其他形式的在线欺骗上,例如同一实体同时操作多个帐户(sockpuppetry)、冒充其他人,以及研究去平台化个人和社区的影响。在这里,我们对规避禁令进行了第一个数据驱动的研究,即规避在线平台上的禁令的行为,导致同一用户对账户的操作暂时脱节。我们整理了一个包含 8,551 个在 Wikipedia 上识别的禁止规避对(父母、孩子)的新数据集,并将他们的行为与良性用户和非规避恶意用户进行对比。我们发现,逃避儿童账户在几个行为轴上表现出与其被禁止的父账户的相似性——从用户名和编辑页面的相似性到添加到平台的内容的相似性及其心理语言属性。我们揭示了可能逃避禁令的账户的关键行为属性。基于分析的见解,我们训练逻辑回归分类器以检测和预测禁令规避生命周期中三个不同点的禁令规避。结果证明了我们的方法在预测未来逃避者 (AUC = 0.78)、早期发现禁令逃避 (AUC = 0.85) 以及匹配子账户与父账户 (MRR = 0.97) 方面的有效性。与当前基于手动和启发式的方法相比,我们的工作可以通过减少他们的工作量和更快、更有效地识别逃避对来帮助版主。数据集可用 hrefhttps://github.com/srijankr/ban_evasiontexthere。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20220211/