- 通过集成实现稳健的动态网络嵌入;
- p2pGNN:用于点对点网络中节点分类的去中心化图神经网络;
- 一种理解 Chafee 服务收据预测因素的计算社会科学方法;
- 城市街道的拓扑结构对其各自的优化有何影响?;
- 地铁系统累积损伤下的运输演变;
- 核心而非外围的在线社交关系是预防抑郁症的保护因素:来自具有全国代表性的年轻人样本的证据;
- 重构企业层面的互动:荷兰投入产出网络;
- COREATTACK:打破图的核心结构;
- 通用和自适应概率安全评估模型:前体分析和多目标利用;
- 一种基于草图的博弈论方法来检测大数据流中的异常密集子社区;
- 反思动机:发表的原因如何影响天文学的研究行为;
- Delta-Conformity:特征丰富的流图中的多尺度节点分类;
- 城市系统中可持续发展目标之间的权衡;
- 在动态社会网络中使用强化学习进行社区检测的模块化优化;
- DiPD:来自 Twitter 的破坏性事件预测数据集;
- 用于医学数据库中自动分组的文本网络的可扩展社区提取;
- 通过特征选择和插值提高随机游走排名;
通过集成实现稳健的动态网络嵌入
原文标题: Robust Dynamic Network Embedding via Ensembles
地址: http://arxiv.org/abs/2105.14557
作者: Chengbin Hou, Guoji Fu, Peng Yang, Zheng Hu, Shan He, Ke Tang
摘要: 由于网络嵌入在各个领域的优势以及许多现实世界网络的动态特性,动态网络嵌入(DNE)最近引起了相当大的关注。通常假设 DNE 的输入动态网络在快照上具有平滑的变化,但这并不适用于所有现实世界的场景。很自然地会问,现有的 DNE 方法是否可以在没有平滑变化的输入动态网络上表现良好。为了对其进行量化,建议使用称为变化程度 (DoC) 的索引,以便较小的 DoC 表示更平滑的变化。我们的比较研究表明,即使相应的输入动态网络来自相同的数据集,几种 DNE 方法对不同的 DoC 也不够稳健,这将使这些方法不可靠且难以用于未知的现实世界应用程序。为了提出一种有效且更健壮的 DNE 方法,我们遵循集成的概念,其中每个基础学习器采用增量 Skip-Gram 嵌入模型。为了进一步提高性能,设计了一种简单而有效的策略,通过刻画不同级别的局部全局拓扑来增强每个时间步长基础学习器之间的多样性。大量实验证明了所提出的方法与最先进的 DNE 方法相比具有优越的有效性和鲁棒性,以及所提出的方法中特殊设计的好处及其可扩展性。
p2pGNN:用于点对点网络中节点分类的去中心化图神经网络
原文标题: p2pGNN: A Decentralized Graph Neural Network for Node Classification in Peer-to-Peer Networks
地址: http://arxiv.org/abs/2111.14837
作者: Emmanouil Krasanakis, Symeon Papadopoulos, Ioannis Kompatsiaris
摘要: 在这项工作中,我们的目标是对具有通信不确定性的非结构化点对点网络的节点进行分类,例如去中心化社会网络的用户。众所周知,图神经网络 (GNN) 可以通过利用自然发生的网络链接来提高集中设置中更简单分类器的准确性,但是当节点邻居不是始终可用时,图卷积层在分散设置中难以实现。我们通过使用解耦 GNN 来解决这个问题,其中基本分类器的预测和错误在训练后通过图扩散。对于这些,我们部署了预训练和八卦训练的基础分类器,并在通信不确定性下实现点对点图扩散。特别是,我们开发了一个异步分散的扩散公式,它在相同的预测上相对于通信速率线性收敛。我们在三个具有节点特征和标签的真实世界图上进行实验,并模拟具有均匀随机通信频率的点对点网络;给定一部分已知标签,我们的去中心化图扩散实现了与中心化 GNN 相当的准确度。
一种理解 Chafee 服务收据预测因素的计算社会科学方法
原文标题: A Computational Social Science Approach to Understanding Predictors of Chafee Service Receipt
地址: http://arxiv.org/abs/2111.14901
作者: Jason Yan, Melanie Sage, Seventy F. Hall, Yuhao Du, Kenneth Joseph
摘要: 成功过渡到成年的 John H. Chafee 寄养计划 (CFCIP) 分配资金为可能不再寄养的年轻人提供服务。这些服务涵盖从指导到经济援助的方方面面,预计将以让青年为护理后的生活做好准备的方式提供。然而,令人惊讶的是,对于哪些青年接受哪些服务却知之甚少。目前的工作利用了全国青年转型数据库 (NYTD),这是一个大型行政数据集,用于跟踪分配给使用 CFCIP 资金的青年的服务。具体而言,我们对 NYTD 数据进行了法医社会科学分析。为此,我们首先使用计算方法来帮助我们发现与服务接收相关的最重要因素。这样做有助于我们确定三个主要因素——青年年龄、青年接受护理的时间和青年接受护理的状态——与接受的服务最密切相关。然后我们进行分析,将现有理论与这些因素联系起来,扩大我们对服务如何分配的理解,并为未来的工作铺平道路,以理解为什么会存在这种关联。
城市街道的拓扑结构对其各自的优化有何影响?
原文标题: How does the Topology of City Streets Impact on their Respective Optimization?
地址: http://arxiv.org/abs/2111.14935
作者: Eric K. Tokuda, Cesar H. Comin, Luciano da F. Costa
摘要: 一些自然和人工结构和系统以某种方式优化以执行特定功能。城市的结构和拓扑也不例外,因为确保有效访问多种资源以及整体流动性至关重要。目前的工作解决了通过整合大道和其他高速公路(如桥梁和隧道)来改善特定城市规划的重要主题。更具体地说,我们从真实城市的拓扑结构开始,并考虑在城市中的任意两个位置之间加入一条高速公路,保持一个位置固定并改变另一个位置的角度。整个城市区域都以这种方式覆盖,这使我们能够推导出相应的能量表面,指示在每种可能情况下获得的关于平均最短路径长度的增益。因此,这些表面提供了每个城市在最小距离方面可以改进多少的完整图景。已经为 18 个考虑的欧洲城市获得了相当不同的表面。然后根据局部极值的数量和各自的空间复杂性对这些表面进行表征,以粗糙度测量的形式表示。还分别获得了对所考虑城市的几何形状和拓扑结构的测量。结果表明,最短路径增益强烈依赖于一些考虑的测量,尤其是空隙度和传递性。有趣的是,能量表面的复杂性导致与拓扑和几何测量的相关性相对较小。
地铁系统累积损伤下的运输演变
原文标题: Evolution of transport under cumulative damage in metro systems
地址: http://arxiv.org/abs/2111.14979
作者: L. K. Eraso-Hernandez, A. P. Riascos, T.M. Michelitsch, J. Wang-Michelitsch
摘要: 城市的一个主要方面是交通和大规模的乘客动员,随着城市的发展,对公众的需求不断增加,这仍然是一个挑战。此外,公共交通基础设施受到交通拥堵和恶化的影响,降低了其效率。在本文中,我们研究了全球 33 个地铁系统在损坏累积情况下的运输能力。我们探索了这些系统中与随机发生的损坏相关的功能的逐渐减少。每个网络的全局传输被建模为马尔可夫随机游走者在网络上的扩散运动,考虑到每个链接的传输能力,其中这些链接容易受到损坏。地铁网络中这一过程的蒙特卡罗模拟显示了考虑到运输结构的所有复杂性,系统在损坏情况下的功能演变。这些信息使我们能够对地铁系统中的损坏影响进行比较和分类。我们的研究结果提供了一个通用框架,用于表征在网络描述的不同系统中保持传输失败的能力。
核心而非外围的在线社交关系是预防抑郁症的保护因素:来自具有全国代表性的年轻人样本的证据
原文标题: Core but not peripheral online social ties is a protective factor against depression: evidence from a nationally representative sample of young adults
地址: http://arxiv.org/abs/2111.15070
作者: Sofia Dokuka, Elizaveta Sivak, Ivan Smirnov
摘要: 随着社交互动在数字环境中越来越多地发生,在线友谊及其对从健康到幸福的各种生活结果的影响吸引了越来越多的研究关注。在大多数研究中,在线关系被视为代表单一类型的关系。然而,我们的在线友谊网络并不是同质的,可能包括密切的联系,例如合作伙伴,以及我们从未见过面的人。在本文中,我们调查了在线友谊关系对心理健康的潜在差异影响。使用来自俄罗斯小组研究(N = 4,400)的数据,我们发现 - 与之前的研究一致 - 在线朋友的数量与抑郁症状相关。然而,这仅适用于规模不超过邓巴数 (N <= 150) 的网络,并且仅适用于友谊网络的核心节点而非外围节点。研究结果表明,在线友谊可以编码不同类型的社会关系,在调查在线社会融合与生活结果(尤其是幸福或心理健康)之间的关联时,应分别对待这些关系。
重构企业层面的互动:荷兰投入产出网络
原文标题: Reconstructing firm-level interactions: the Dutch input-output network
地址: http://arxiv.org/abs/2111.15248
作者: Leonardo Niccolò Ialongo, Camille de Valk, Emiliano Marchese, Fabian Jansen, Hicham Zmarrou, Tiziano Squartini, Diego Garlaschelli
摘要: 最近的危机表明,从在供需冲击下重新连接企业的微观角度研究经济弹性时,企业层面的投入-产出网络结构的知识至关重要。不幸的是,经验性的公司间网络数据很少被访问并且受到机密性的保护。为金融风险而设计的从部分信息重建网络的可用方法不适用于公司间关系,因为它们将所有节点对视为潜在的相互作用,从而高估了系统的重连能力。在这里,我们使用荷兰的两个大交易数据集来代表荷兰公司间网络的很大一部分,并记录了为数不多的此类分析网络之一的属性。然后,我们引入了一种广义的最大熵重建方法,该方法保留了数据中每个公司的生产函数,即每个产品类型的每个节点的输入和输出流。我们确认,随着考虑更精细的产品分辨率,新方法变得越来越可靠,因此可以用作具有精细生产约束的公司间网络的生成模型。与熵相关的模型的似然性代表系统在固定输入-输出配置下的重连能力。
COREATTACK:打破图的核心结构
原文标题: COREATTACK: Breaking Up the Core Structure of Graphs
地址: http://arxiv.org/abs/2111.15276
作者: Bo Zhou, Yuqian Lv, Jinhuan Wang, Jian Zhang, Qi Xuan
摘要: 复杂网络中 k 核的概念在许多应用中起着关键作用,例如,理解网络的全局结构或识别中央/关键节点。具有干扰能力的恶意攻击者可以利用 k-core 结构的漏洞攻击网络,使网络分析方法失效,例如减少节点的 k-shell 值可以欺骗图算法,导致错误的决策。在本文中,我们首次通过删除边来研究 k 核结构在对抗性攻击下的鲁棒性。首先,我们给出了针对性k-core攻击的一般定义,将其映射到NP-hard的集合覆盖问题,并进一步引入了一系列评估指标来衡量攻击方法的性能。然后,我们从理论上提出Q指数作为边的终端节点不属于最内核的概率,进一步用于指导我们的启发式攻击方法的设计,即COREATTACK和GreedyCOREATTACK。在各种真实世界网络上的实验表明,我们的方法在更小的边变化率 (ECR) 和错误攻击率 (FAR) 方面比一系列基线表现得更好,实现了最先进的攻击性能。更令人印象深刻的是,对于某些现实世界的网络,仅从 k 核中删除一条边可能会导致最内层核的崩溃,即使该核包含数十个节点。这种现象表明 k 核结构在对抗性攻击下可能非常脆弱,因此应仔细解决其鲁棒性问题,以确保许多图算法的安全性。
通用和自适应概率安全评估模型:前体分析和多目标利用
原文标题: Generic and adaptive probabilistic safety assessment models: Precursor analysis and multi-purpose utilization
地址: http://arxiv.org/abs/2111.15391
作者: Ali Ayoub, Wolfgang Kröger, Didier Sornette
摘要: 通过从民用核操作中吸取经验和利用现有知识,我们开发了用于加压和沸水反应堆的内部通用 PSA 模型。这些模型在计算上轻巧、方便、透明、用户友好,并且易于适应以解决主要的植物特定差异。它们涵盖了常见的内部启动事件、前线和支持系统的可靠性和依赖性、人为因素、常见原因故障,并解释了许多已开发的 PSA 中通常会忽略的新因素。为了量化,这些模型使用通用的美国可靠性数据、前体分析报告和研究、ETHZ 策划的核事件数据库以及专家的意见。此外,解决了最具影响力的基本事件的不确定性。生成的结果与具有详细 PSA 的文献中可用的评估非常吻合。我们将这些模型设想为一个无偏见的框架,以使用相同的“标尺”来衡量核操作风险,因此支持由于特定工厂 PSA 假设和范围的差异而通常不可能进行的工厂间风险比较。这些模型可用于初始风险筛选、数量级前体分析以及其他研究和教学应用,尤其是在没有特定工厂的 PSA 可用时。最后,我们正在使用通用模型进行大规模前兆分析,这将产生宏观趋势、经验教训和见解。
一种基于草图的博弈论方法来检测大数据流中的异常密集子社区
原文标题: A Sketch Based Game Theoretic Approach to Detect Anomalous Dense Sub-Communities in Large Data Streams
地址: http://arxiv.org/abs/2111.15525
作者: Prateek Chanda, Aadirupa Saha
摘要: 以在线或流式方式检测动态图中的异常子图是工业环境中入侵检测或拒绝服务攻击的重要要求。虽然仅通过边频率检测系统中的异常是一种最佳方法,但在此过程中可能会忽略许多潜在信息,因为作为网络的特征,仅考虑边频率。我们提出了一种博弈论方法,即使用我们尝试在流图中估计的模块化函数emph在当前时间刻度中添加新边是否会导致密集子图的创建,从而表明可能的异常分数。我们的贡献如下:(a)我们提出了一种新颖的博弈论框架,用于检测在线流媒体环境中的密集子社区; (b) 我们使用恒定的内存存储来检测此类子社区。我们的结果得到了对真实数据集的实证评估的证实。
反思动机:发表的原因如何影响天文学的研究行为
原文标题: Reflecting on Motivations: How Reasons to Publish affect Research Behaviour in Astronomy
地址: http://arxiv.org/abs/2111.15532
作者: Julia Heuritsch
摘要: 反思性度量领域的最新研究已经研究了科学评估差距的出现和后果。评估差距的概念捕捉了研究人员对其研究的重视程度,特别是研究质量,与衡量指标之间的潜在差异。因此,科学家可能会遇到失范并采用创新方法来应对。这些通常重视数量而不是质量,甚至可能损害研究的完整性。因此,这种差距的后果可能是研究不端行为和研究质量下降。用理性选择理论的语言来说,如果行为者情境的内部成分产生的动机因素与外部成分产生的动机因素不一致,则评估差距会持续存在。因此,这项研究的目的是研究和比较成为天文学家、从事天文学研究和发表科学论文的自主和受控动机。此外,我们研究了这些不同的动机因素如何影响出版压力、组织公正的经验和对研究不端行为的观察。总而言之,我们发现了评估差距的证据,并且基于出版记录的评估程序产生的受控动机因素会增加出版压力,而这反过来又增加了感知不当行为频率的可能性。
Delta-Conformity:特征丰富的流图中的多尺度节点分类
原文标题: Delta-Conformity: Multi-scale Node Assortativity in Feature-rich Stream Graphs
地址: http://arxiv.org/abs/2111.15534
作者: Salvatore Citraro, Letizia Milli, Rémy Cazabet, Giulio Rossetti
摘要: 异质性是复杂网络的一个关键方面,通常通过查看节点属性的分布而出现,从对程度的里程碑观察到混合模式估计的最新发展。混合模式尤其是指节点相对于属性标签的连接偏好。社会网络的主要特征是分类/同质行为,其中节点更有可能与相似的节点连接。最近,分类混合越来越多地以多尺度方式衡量,以克服众所周知的经典分数的局限性。这种多尺度策略可以刻画节点同质性之间的异构行为,但它们忽略了现实世界系统中一个重要的、通常可用的附录:边出现的时间以及它们相应形成的时变路径。因此,在复杂网络中,时间同质性仍然知之甚少。在这项工作中,我们的目标是通过在特征丰富的流图的新框架内引入 Delta-Conformity 度量来弥补这一差距,这是一种多尺度、路径感知、节点同质性估计器。丰富的实验部分分析了 Delta-随时间推移的一致性趋势,涵盖了从现实生活中的社交互动网络到有关比特币交易网络的特定案例研究的分析。
城市系统中可持续发展目标之间的权衡
原文标题: Trade-offs between sustainable development goals in systems of cities
地址: http://arxiv.org/abs/2111.15540
作者: Juste Raimbault, Denise Pumain
摘要: 可持续发展目标本质上是相互竞争的,但由于空间复杂性、此类系统的非最佳性质以及其主体的多目标方面等原因,它们嵌入城市系统进一步强调了这种妥协。我们在本文中建议对城市系统使用程式化的模拟模型,重点是创新扩散和人口动态,以展示权衡如何在如此规模下运作。我们特别进行了排放和创新效用的双目标优化,并表明不存在单一的城市优化,而是在两个目标之间形成折衷的多种制度。
在动态社会网络中使用强化学习进行社区检测的模块化优化
原文标题: Towards Modularity Optimization Using Reinforcement Learning to Community Detection in Dynamic Social Networks
地址: http://arxiv.org/abs/2111.15623
作者: Aurélio Ribeiro Costa
摘要: 社会网络中社区结构的识别是网络分析文献中解决的一个重要问题。这个问题有很多使用静态场景的解决方案,当面对动态场景时,一些解决方案可能会适应,但其他解决方案根本不适合,此外,在考虑分析不断增长的网络的需求时。在这种情况下,我们提出了一种解决动态网络中社区检测问题的方法,该方法基于强化学习策略,使用对变化实体的模块化分数进行局部优化来处理大型网络的变化。使用合成和真实世界动态网络数据的实验显示了与静态场景相当的结果。
DiPD:来自 Twitter 的破坏性事件预测数据集
原文标题: DiPD: Disruptive event Prediction Dataset from Twitter
地址: http://arxiv.org/abs/2111.15629
作者: Sanskar Soni, Dev Mehta, Vinush Vishwanath, Aditi Seetha, Satyendra Singh Chouhan
摘要: 骚乱和抗议如果失控,可能会在一个国家造成严重破坏。我们已经看到了这方面的例子,例如 BLM 运动、气候罢工、CAA 运动等等,它们在很大程度上造成了破坏。我们创建这个数据集的动机是用它来开发机器学习系统,让用户深入理解正在发生的趋势事件,并提醒他们注意可能导致国家中断的事件。如果任何事件开始失控,可以通过在事件升级之前对其进行监控来处理和缓解。该数据集收集了已知造成中断的过去或正在进行的事件的推文,并将这些推文标记为 1。我们还收集被认为是非事件的推文并将其标记为 0,以便它们也可用于训练分类系统。该数据集包含 94855 条独特事件记录和 168706 条独特非事件记录,因此数据集总共有 263561 条记录。我们从推文中提取多个特征,例如用户的关注者数量和用户的位置,以理解推文的影响和范围。该数据集可能在各种与事件相关的机器学习问题中有用,例如事件分类、事件识别等。
用于医学数据库中自动分组的文本网络的可扩展社区提取
原文标题: Scalable Community Extraction of Text Networks for Automated Grouping in Medical Databases
地址: http://arxiv.org/abs/2111.15633
作者: Tomilayo Komolafe, Allan Fong, Srijan Sengupta
摘要: 网络在当今世界无处不在。社区结构是许多经验网络的众所周知的特征,并且已经开发了许多用于社区检测的统计方法。在本文中,我们考虑了文本网络中的社区结构问题,这与医疗差错和患者安全数据库密切相关。我们采用了一种众所周知的社区提取方法来开发一种可扩展的算法,用于在大型文本数据库中进行社区提取。我们的方法在真实世界患者安全报告数据库上的应用表明,从社区提取中生成的组比一线工作人员手动标记更准确。
通过特征选择和插值提高随机游走排名
原文标题: Improving random walk rankings with feature selection and imputation
地址: http://arxiv.org/abs/2111.15635
作者: Ngoc Mai Tran, Yangxinyu Xie
摘要: Science4cast 竞赛包括预测语义网络中的新链接,每个节点代表一个概念,每条边代表一个链接,该链接由与两个概念相关的论文提出。该网络包含 1994-2017 年的信息,离散化天数(代表基础论文的发表日期)。 Hash Brown 团队的最终提交,emphee5a,在测试集上获得了 0.92738 的分数。我们队的得分排名emph第二名,比获胜者的得分低0.01。这篇论文详细介绍了我们的模型、它的直觉以及它在测试集中的变化的性能。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20211201/