- 度量和机制:测量科学中不可测量的部分;
- 具有网络嵌入结构特征的自适应相似函数用于缺失链路预测;
- 量化在线平台中专业化和声誉之间的关系;
- SocialBERT – 用于在线社会网络语言建模的转换器;
- 用于紧急救援的社交媒体:哈维飓风期间 Twitter 上的救援请求分析;
- 评估 Twitter 上的网络钓鱼报告的有效性;
- 导致逃税模型中一阶相变的简单机制;
- 群落中的核心-边缘结构:细胞外囊泡;
- 单向街道对最短通勤路线不对称性的影响;
- 用于社区检测的无分布模型;
- 无限制竞争下社会不平等的演化动力学和基尼系数和加尔各答指数的巧合;
- 相关性改进了组测试;
- 谱变换组成了可扩展Transformer;
- 从手机网络的角度分析足球迷的行为和财务状况:2016 年欧洲杯,案例研究;
- 无处不在的走得更远的效率:街道网络如何影响旅行速度;
- Nachhaltige Strategien gegen die COVID-19-Pandemie in Deutschland im Winter 2021⁄2022;
度量和机制:测量科学中不可测量的部分
原文标题: Metrics and Mechanisms: Measuring the Unmeasurable in the Science of Science
地址: http://arxiv.org/abs/2111.07250
作者: Lingfei Wu, Aniket Kittur, Hyejin Youn, Staša Milojević, Erin Leahey, Stephen M. Fiore, Yong Yeol Ahn
摘要: 什么是科学知识,它是如何创造、积累、转化和使用的?如果我们想知道这些问题的答案,除了易于收集和量化的指标之外,我们还需要能够揭示科学的结构和机制。在这篇评论文章中,我们将指标与机制联系起来,通过展示新兴指标如何不仅为现有指标提供补充,而且还阐明了与科学科学中的十个关键数量相关的潜在机制,包括发现意义,寻找可复制性、知识累积性等。我们将现有的理论和发现分为科学的三个基本属性:冷热科学、软科学和硬科学、快科学和慢科学。我们认为自 Derek J. de Solla Price、Eugene Garfield、Robert K. Merton 和许多其他人以来,对科学结构和机制的好奇心,与不理解潜在过程的情况下新的、复杂的指标是互补的。
具有网络嵌入结构特征的自适应相似函数用于缺失链路预测
原文标题: Adaptive Similarity Function with Structural Features of Network Embedding for Missing Link Prediction
地址: http://arxiv.org/abs/2111.07027
作者: Chuanting Zhang, Ke-ke Shang, Jingping Qiao
摘要: 链路预测是数据科学的一个基本问题,通常需要展开控制网络微观动态的机制。在这方面,使用从网络嵌入中获得的特征来预测链接已经引起了广泛的关注。尽管已经提出了基于边特征或基于节点相似性的方法来解决链路预测问题,但由于网络独特的结构特性,特别是当网络稀疏时,仍然存在许多技术挑战。从图挖掘的角度来看,我们首先给出启发式和学习边特征之间不一致的经验证据。然后,我们提出了一种新的链路预测框架 AdaSim,通过使用基于随机游走的网络嵌入获得的特征引入自适应相似性函数。节点特征表示是通过优化基于图的目标函数获得的。我们没有使用二元运算符生成边特征,而是仅利用网络的节点特征来执行链路预测。我们用一个可调参数定义了一个灵活的相似度函数,作为原始相似度度量的惩罚。最优值是通过监督学习学习的,因此适应数据分布。为了评估我们提出的算法的性能,我们对现实世界的 11 个不同的网络进行了广泛的实验。实验结果表明,AdaSim 实现了比最先进算法更好的性能,并且对网络的不同稀疏性具有鲁棒性。
量化在线平台中专业化和声誉之间的关系
原文标题: Quantifying the relationship between specialisation and reputation in an online platform
地址: http://arxiv.org/abs/2111.07144
作者: Giacomo Livan, Giuseppe Pappalardo, Rosario N. Mantegna
摘要: 在线平台在权力下放和引导用户行为的激励措施之间存在紧张关系,这通常通过数字声誉系统实施。我们提供了在 Stack Overflow(一个长期存在的知识共享平台)中这种竞争力量的相互作用中出现的用户行为的统计特征。在我们分析所涵盖的 11 年中,我们发现该平台的用户群始终如一地自组织为专家和通才,即分别将其活动集中在狭义和广义主题集的用户。我们通过一系列数据驱动模型将这些行为的出现与平台的声誉系统联系起来,并发现专业化与更高的发布问题最佳答案的能力在统计上相关。我们的发现与在自上而下的环境(例如公司和公司)中进行的观察形成鲜明对比,在这些环境中,通才技能始终被认为更成功。
SocialBERT – 用于在线社会网络语言建模的转换器
原文标题: SocialBERT – Transformers for Online SocialNetwork Language Modelling
地址: http://arxiv.org/abs/2111.07148
作者: Ilia Karpov, Nick Kartashev
摘要: 当代语言理解任务的普遍性与利用数据源提供的所有知识的通用但高效的模型的开发相关。在这项工作中,我们提出了 SocialBERT——第一个在文本分析过程中使用作者在网络中位置的知识的模型。我们研究了学习社会网络信息的可能模型,并成功地将其注入到基线 BERT 模型中。评估表明,嵌入此信息保持了良好的泛化性,给定作者的概率模型的质量提高了 7.5%。所提出的模型已经针对所选社会网络的大多数群体进行了训练,并且仍然能够与以前未知的群体一起工作。获得的模型以及我们的实验代码可供下载并在应用任务中使用。
用于紧急救援的社交媒体:哈维飓风期间 Twitter 上的救援请求分析
原文标题: Social Media for Emergency Rescue: An Analysis of Rescue Requests on Twitter during Hurricane Harvey
地址: http://arxiv.org/abs/2111.07187
作者: Lei Zou, Danqing Liao, Nina S.N. Lam, Michelle Meyer, Nasir G. Gharaibeh, Heng Cai, Bing Zhou, Dongying Li
摘要: 社交媒体在灾难响应中发挥着越来越重要的作用,但有效利用社交媒体进行救援具有挑战性。这项研究分析了 2017 年哈维飓风期间 Twitter 上的救援请求,当时许多居民通过社交媒体寻求帮助。目标包括(1)理解救援请求消息的特征; (2) 揭示救援请求的时空格局; (三)确定需要救助社区的社会地理条件; (4) 识别使用社交媒体进行救援的挑战并提出改进策略。大约一半的救援请求要么没有提供足够的信息,要么忽略了与救援相关的主题标签或账户。在 824 个经地理编码的独特救援请求中,41% 来自 FEMA 定义的最小洪水风险区。在 Twitter 上发送更多救援请求的社区在环境和社会经济方面更加脆弱。最后,我们得出了一个框架,总结了在救援行动中改进社交媒体使用所需的步骤和策略。
评估 Twitter 上的网络钓鱼报告的有效性
原文标题: Evaluating the effectiveness of Phishing Reports on Twitter
地址: http://arxiv.org/abs/2111.07201
作者: Sayak Saha Roy, Unique Karanjit, Shirin Nilizadeh
摘要: 网络钓鱼攻击是一种日益强大的基于 Web 的威胁,每月创建近 150 万个网站。在这项工作中,我们提出了第一个通过用户在 Twitter 上共享的网络钓鱼报告来识别此类攻击的研究。我们评估了 701 个 Twitter 帐户在 2021 年 6 月至 8 月期间发布的超过 1.64 万份此类报告,其中包含 1.11 万个唯一 URL,并使用各种定量和定性措施分析了它们的有效性。我们的调查结果表明,与两个流行的开源网站相比,这些用户不仅共享大量合法的网络钓鱼 URL,而且这些报告包含更多关于网络钓鱼网站的信息(这可以加快识别和消除这些威胁的过程)网络钓鱼源:PhishTank 和 OpenPhish。我们还注意到,报告的网站与其他提要中存在的 URL 几乎没有重叠,并且还保持活跃的时间更长。但是,尽管具有这些属性,我们发现这些报告与其他 Twitter 用户的交互非常低,尤其是来自报告 URL 所针对的域和组织的交互。此外,即使在报告了一周后,这些 URL 中有近 31% 仍然处于活动状态,其中 27% 被极少数反网络钓鱼工具检测到,这表明这些报告中的大部分仍未被发现,尽管大多数这些帐户的关注者群是注重安全的用户。因此,这项工作突出了报告的有效性,以及将它们用作识别新网络钓鱼网站的开源知识库的好处。
导致逃税模型中一阶相变的简单机制
原文标题: A simple mechanism leading to first-order phase transitions in a model of tax evasion
地址: http://arxiv.org/abs/2111.07400
作者: Nuno Crokidakis
摘要: 在这项工作中,我们研究逃税的动态。我们考虑了一个完全连接的人群,分为三个部分,即诚实的纳税人、逃税者和易感者,这一类由可能成为逃税者的诚实纳税人组成。我们考虑一个传染模型,其中隔间之间的转换由概率控制。这种概率代表了个人之间可能的相互作用,以及政府的财政化。我们通过分析和数值计算表明,人口中逃税者的出现与主动吸收非平衡一阶相变有关。在吸收阶段,只有诚实的纳税人才能在模型的稳态中生存,我们观察到活跃阶段的三个亚群并存。
群落中的核心-边缘结构:细胞外囊泡
原文标题: Center-Periphery Structure in Communities: Extracellular Vesicles
地址: http://arxiv.org/abs/2111.07410
作者: Eleanor Wedell, Minhyuk Park, Dmitriy Korobskiy, Tandy Warnbow, George Chacko
摘要: 网络中的聚类和社区检测引起了广泛的兴趣,并且已经成为跨越多个领域的广泛研究的主题。我们对检测通过引用链接的科学出版物社区这一相对狭隘的问题感兴趣。这些出版物社区可用于识别形成研究人员社区的具有共同兴趣的科学家。基于众所周知的 k-core 算法,我们开发了一个模块化管道来查找发布社区。我们将我们的方法与广泛使用的 Leiden 算法发现的社区进行比较,以进行社区发现。使用定量和定性方法,我们在由超过 1400 万篇与细胞外囊泡领域相关的出版物组成的引文网络上评估社区发现结果。
单向街道对最短通勤路线不对称性的影响
原文标题: The impact of one-way streets on the asymmetry of the shortest commuting routes
地址: http://arxiv.org/abs/2111.07434
作者: Hygor P. M. Melo, Diogo P. Mota, José S. Andrade Jr., Nuno A. M. Araújo
摘要: 在日常通勤中,从家到公司的最短路线很少与返回的最短路线完全重叠。我们分析了几个城市的这种不对称性,并表明即使没有交通,它也存在,因为单向街道的一小部分不可忽略。对于不同的起点-终点对 (rm OD),我们计算对数比 r=ln(ell_rm D/ellrm O),其中 ell rm O 和 ell_rm D 分别是从 rm O 到 rm D 和从 rm D 到 rm O 的最短路径的长度。虽然它的平均值为零,但波动的幅度作为 rm OD 最短路径长度 rsim ell_rm O^-beta 的幂律衰减。同样,最短路线中单向街道的比例也衰减为 ell_rm O^-alpha。基于半解析论证,我们证明 beta=(1+alpha)/2。因此,指数 beta 的值与底层街道网络结构的相关性有关。
用于社区检测的无分布模型
原文标题: Distribution-Free Models for Community Detection
地址: http://arxiv.org/abs/2111.07495
作者: Huan Qing
摘要: 未加权网络的社区检测已在网络分析中得到广泛研究,但加权网络的情况仍然是一个挑战。在本文中,针对节点被划分为不同社区的网络提出了一种无分布模型(DFM)。 DFM 是一种通用的、可解释的和可识别的模型,适用于未加权网络和加权网络。所提出的模型不需要关于邻接矩阵元素的特定分布的先验知识,而只需要期望值。 DFM 的无分布特性甚至允许邻接矩阵具有负元素。我们开发了一种有效的谱算法来拟合 DFM。通过引入噪声矩阵,我们建立了一个关于扰动分析的理论框架,以表明所提出的算法在 DFM 下稳定地产生一致的社区检测。在合成网络和来自文献的两个社会网络上的数值实验用于说明该算法。
无限制竞争下社会不平等的演化动力学和基尼系数和加尔各答指数的巧合
原文标题: Evolutionary Dynamics of Social Inequality and Coincidence of Gini and Kolkata indices under Unrestricted Competition
地址: http://arxiv.org/abs/2111.07516
作者: Suchismita Banerjee, Soumyajyoti Biswas, Bikas K. Chakrabarti, Asim Ghosh, Raju Maiti, Manipushpak Mitra, Dachepalli R. S. Ram
摘要: 社会不平等无处不在,在这里我们展示了两个通用不平等指数 Gini (g) 和加尔各答 (k) 指数的值相互接近(从 g = 0 和 k = 0.5 开始)平等)随着竞争在各种社会机构(如市场、大学、选举等)中的增长。进一步表明,在不受限制的竞争下,这两个指数变得相等并稳定在一个值(g = k simeq 0.87)。我们建议将这种不平等指数的巧合视为(超过一个)世纪之久的 80-20 年帕累托定律的概括版本。此外,通过分析来自不同社会部门的数据以及对不同洛伦兹曲线的分析考虑,这一命题得到了验证。
相关性改进了组测试
原文标题: Correlation Improves Group Testing
地址: http://arxiv.org/abs/2111.07517
作者: Jiayue Wan, Yujia Zhang, Peter I. Frazier
摘要: 用于识别和隔离传染性个体的全人群筛查是控制 COVID-19 和其他传染病的有力工具。然而,测试整个人群需要大量资源。群体测试可以通过用更少的资源测试更多的人来实现大规模筛查,但稀释会降低其敏感性,降低其作为感染控制措施的有效性。这种权衡的分析通常假设合并的样本是独立的。基于最近文献中的实证结果,我们认为这一假设大大低估了团体测试的真正好处。实际上,将来自社会群体或家庭的样本放入同一个池中会关联池中的样本。因此,阳性池可能包含多个阳性样本,从而提高了合并测试的敏感性,并且往往会减少需要后续测试的池数量。我们证明,在一般相关结构下,将相关样本汇集在一起(“相关汇集”)可实现更高的灵敏度,并且与使用相同池大小独立汇集样本(“朴素汇集”)相比,每个阳性识别需要的测试更少 -阶段 Dorfman 程序,最广泛使用的组测试方法。据我们所知,我们的工作是第一个从理论上表征相关性对灵敏度的影响,并且第一个在现实的测试误差模型下研究其对测试使用的影响。在 1% 的代表性起始流行率下,模拟结果估计相关汇集需要比朴素汇集少 12.9% 的测试来控制流行病。因此,我们认为相关性是决策者设计感染控制干预措施的一个重要考虑因素:它使筛查对感染控制更具吸引力,并且表明样本收集应最大化相关性。
谱变换组成了可扩展Transformer
原文标题: Spectral Transform Forms Scalable Transformer
地址: http://arxiv.org/abs/2111.07602
作者: Bingxin Zhou, Xinliang Liu, Yuehua Liu, Yunying Huang, Pietro Liò, YuGuang Wang
摘要: 许多现实世界的关系系统,例如社会网络和生物系统,都包含动态交互。在学习动态图表示时,必须使用顺序时间信息和几何结构。主流工作通过消息传递网络(例如 GCN、GAT)实现拓扑嵌入。另一方面,时间演化通常通过在门机制中具有方便信息过滤的记忆单元(例如,LSTM 或 GRU)来表达。但是,这种设计由于过于复杂的编码而阻止了大规模输入序列。这项工作从自我注意的哲学中学习,并提出了一种有效的基于谱的神经单元,该单元采用信息丰富的远程时间交互。开发的谱窗口单元 (SWINIT) 模型以有保证的效率预测可扩展的动态图。该架构由几个简单有效的计算块组装而成,这些块构成随机 SVD、MLP 和图 Framelet 卷积。 SVD plus MLP 模块对动态图事件的长短期特征演化进行编码。框架卷积中的快速框架图变换嵌入了结构动力学。这两种策略都增强了模型的可扩展分析能力。特别是,迭代SVD逼近将注意力集中到O(Ndlog(d))的计算复杂度缩小到具有N条边和d条边特征的动态图,并且framelet卷积的多尺度变换允许在网络训练中具有足够的可扩展性。我们的 SWINIT 在各种在线连续时间动态图学习任务上实现了最先进的性能,而与基线方法相比,其可学习参数的数量减少了多达 7 倍。
从手机网络的角度分析足球迷的行为和财务状况:2016 年欧洲杯,案例研究
原文标题: Analyzing the Behavior and Financial Status of Soccer Fans from a Mobile Phone Network Perspective: Euro 2016, a Case Study
地址: http://arxiv.org/abs/2111.07685
作者: Gergő Pintér, Imre Felde
摘要: 在这项研究中,我们分析了 2016 年 6 月覆盖布达佩斯的呼叫详细记录 (CDR)。在这段观察期间,2016年欧洲足球锦标赛举行,尽管城市没有一场比赛,但居民的生活习惯受到了很大的影响。我们评估了布达佩斯球迷在匈牙利比赛期间和之后的行为,发现手机网络活动反映了球迷的行为,展示了手机网络数据在社会感知系统中的潜力。呼叫详细记录丰富了移动电话属性以分析订户的设备。应用活动记录中的设备信息(类型分配代码),移动性分析中省略了不在手机中运行的用户身份模块,从而可以专注于人。手机价格作为社会经济指标被提出和评估,并发现了手机价格与出行习惯之间的相关性。我们还发现,除了手机价格外,用户年龄和订阅类型也对移动性有影响。另一方面,这些似乎并不影响人们对足球的兴趣。
无处不在的走得更远的效率:街道网络如何影响旅行速度
原文标题: The ubiquitous efficiency of going further: how street networks affect travel speed
地址: http://arxiv.org/abs/2111.07801
作者: Gabriel L. Maia, Caio Ponte, Carlos Caminha, Lara Furtado, Hygor P. M. Melo, Vasco Furtado
摘要: 随着城市努力适应更加“以人为本”的城市化,交通规划和工程必须创新以战略性地扩大街道网络,以确保效率并阻止蔓延。在这里,我们对全球 200 多个城市进行了研究,以理解交通标志导致的街道减速点模式对机动车辆行驶轨迹的影响。我们证明,在每个城市内的最佳轨迹中,时间和距离之间存在普遍存在的非线性关系。更准确地说,给定一段特定的时间 tau,在没有任何交通的情况下,一个人平均可以移动的距离为 left langle D right rangle simtau^beta。我们发现几乎所有 beta>1.0 的城市都存在超线性关系。这表明长途旅行时的规模效率,这意味着与短途旅行相比,长途旅行的平均速度会更高。我们证明了这种效率是没有减速点的大段街道空间分布的结果,有利于进入车辆可以不经停地穿越很远距离的路线。这些发现表明,城市必须考虑其街道形态如何影响出行速度。
Nachhaltige Strategien gegen die COVID-19-Pandemie in Deutschland im Winter 2021⁄2022
原文标题: Nachhaltige Strategien gegen die COVID-19-Pandemie in Deutschland im Winter 2021⁄2022
地址: http://arxiv.org/abs/2111.08000
作者: Viola Priesemann (1), Eberhard Bodenschatz (1), Sandra Ciesek (2), Eva Grill (3), Emil N. Iftekhar (1), Christian Karagiannidis (4), André Karch (5), Mirjam Kretzschmar (6), Berit Lange (7), Sebastian A. Müller (8), Kai Nagel (8), Armin Nassehi (9), Mathias W. Pletz (10), Barbara Prainsack (11), Ulrike Protzer (12), Leif Erik Sander (13), Andreas Schuppert (14), Anita Schöbel (15), Klaus Überla (16), Carsten Watzl (17), Hajo Zeeb (18) ((1) Max-Planck-Institut für Dynamik und Selbstorganisation, Göttingen, (2) Universitätsklinikum Frankfurt, Goethe-Universität, Frankfurt, (3) Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie, Ludwig-Maximilians-Universität München (LMU), München, (4) Lungenklinik Köln-Merheim, Universität Witten/ Herdecke, (5) Westfälische Wilhelms-Universität Münster, Münster, (6) University Medical Center Utrecht, Utrecht, Die Niederlande, (7) Epidemiologie, Helmholtz-Zentrum für Infektionsforschung, Braunschweig, (8) Fachgebiet Verkehrssystemplanung und Verkehrstelematik, Technische Universität (TU) Berlin, Berlin, (9) Institut für Soziologie, Ludwig-Maximilians-Universität München (LMU), München, (10) Institut für Infektionsmedizin und Krankenhaushygiene, Universitätsklinikum Jena, Jena, (11) Institut für Politikwissenschaft, Universität Wien, Wien, Österreich, (12) Institut für Virologie, Technische Universität München / Helmholtz Zentrum München, München, (13) Medizinische Klinik mit Schwerpunkt Infektiologie und Pneumologie, Charité - Universitätsmedizin Berlin, Berlin, (14) RWTH Aachen / Universitätsklinikum Aachen, Aachen, (15) Fraunhofer-Institut für Techno- und Wirtschaftsmathematik (ITWM), Kaiserslautern und Fachbereich Mathematik, TU Kaiserslautern, (16) Virologisches Institut, Universitätsklinikum Erlangen, Erlangen, (17) Leibniz Institut für Arbeitsforschung (IfADo), TU Dortmund, Dortmund, (18) Leibniz Institut für Präventionsforschung und Epidemiologe-BIPS, Bremen)
摘要: 在这份立场文件中,一大群跨学科专家概述了应对 2021⁄2022 年冬季德国 SARS-CoV-2 传播的应对策略。我们回顾了 COVID-19 大流行的现状,从发病率和疫苗接种效果到医院容量。在这种情况评估的基础上,我们说明了冬季的各种可能情况,并详细说明了非药物干预、疫苗接种和加强疫苗的机制和有效性。通过此评估,我们希望为决策者提供有关 COVID-19 的进展和缓解的方向。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20211116/