Arxiv网络科学论文摘要18篇(2021-06-01)

  • 学习用于生成图建模的Graphon自动编码器;
  • 具有不确定数据的网络上的流行病的双曲分隔模型:在意大利Covid-19的出现中的应用;
  • 数据采集​​中的隐私悖论和最佳偏差-方差权衡;
  • 哈希加速图神经网络的链路预测;
  • 加权无向多层网络中的聚类系数;
  • GINA:来自独立快照的神经关系推断;
  • 图相似性描述:这些图如何相似?;
  • 难民动态安置;
  • 稀疏图的样本Frechet平均值是稀疏的;
  • 与期限相关的优先级排队模型的数值研究;
  • 重新审视长期科学影响;
  • 基于SEIR模型的印度第二波COVID-19浪潮分析;
  • 荷兰CoronaMelder App进行接触者追踪的流行病学模型;
  • 基于交通和运输网络的印度传染病危害地图;
  • 社会交往波动对流行病传播的影响;
  • 通过新闻生态系统中的供求动态评估虚假信息;
  • COVID-19大流行期间人员流动性的优化策略:综述;
  • 基于从查询到报价转换的报价建议与解释;

学习用于生成图建模的Graphon自动编码器

原文标题: Learning Graphon Autoencoders for Generative Graph Modeling

地址: http://arxiv.org/abs/2105.14244

作者: Hongteng Xu, Peilin Zhao, Junzhou Huang, Dixin Luo

摘要: Graphon是一种非参数模型,可以生成具有任意大小的图,并且可以轻松地从图中得出。基于此模型,我们提出了一个称为 graphon autoencoder的新颖算法框架,以构建可解释且可扩展的图生成模型。该框架将观察到的图视为功能空间中的诱导形图,并通过汇总Chebshev形图滤镜的编码器得出它们的潜在表示。线性石墨烯分解模型可作为解码器,利用潜在表示来重建诱导的石墨烯(和相应的观察图)。我们开发了一种有效的学习算法来学习编码器和解码器,从而最大程度地减小了模型与数据分布之间的Wasserstein距离。该算法将以不同石墨烯为条件的图分布的KL散度作为基础距离,并导致奖励增强的最大似然估计。 Graphon自动编码器提供了一种新的范式来表示和生成图,具有良好的通用性和可传递性。

具有不确定数据的网络上的流行病的双曲分隔模型:在意大利Covid-19的出现中的应用

原文标题: Hyperbolic compartmental models for epidemic spread on networks with uncertain data: application to the emergence of Covid-19 in Italy

地址: http://arxiv.org/abs/2105.14258

作者: Giulia Bertaglia, Lorenzo Pareschi

摘要: 在对传染病动态进行建模时,空间网络在流行病传播中的重要性是必不可少的方面。此外,任何现实的数据驱动模型都必须考虑到官方来源报告的值(例如传染性个体的数量)的巨大不确定性。在本文中,我们通过网络上的双曲线分隔模型解决了上述问题,其中节点标识了感兴趣的位置,例如城市或区域,而弧线则代表了主要移动路径的集合。该模型从流行病学角度描述了人口的空间移动和相互作用,这些人在一个扩展的车厢结构的基础上划分为郊区的通勤者和城市规模的非通勤者。通过扩散重定标,该模型使我们能够恢复与通勤动力学有关的经典扩散方程。然后,使用随机配置方法与有限体积IMEX方法相结合,解决了具有不确定性的所得多尺度双曲系统的数值解。通过对意大利COVID-19的暴发及其在伦巴第大区的传播的研究,证实了该模型正确描述流行病在现实的城市网络中传播的空间异质性的能力。

数据采集​​中的隐私悖论和最佳偏差-方差权衡

原文标题: The Privacy Paradox and Optimal Bias-Variance Trade-offs in Data Acquisition

地址: http://arxiv.org/abs/2105.14262

作者: Guocheng Liao, Yu Su, Juba Ziani, Adam Wierman, Jianwei Huang

摘要: 尽管用户声称担心隐私,但他们在在线操作中通常很少采取任何措施来保护自己的隐私。这种“隐私悖论”的一个突出解释是,当一个人共享她的数据时,受到损害的不仅是她的隐私。具有相关数据的其他个人的隐私也会受到损害。这种信息泄漏会加剧数据共享,并严重影响在线平台中个人的动机。在本文中,我们研究了在具有信息泄漏和可验证数据的环境中数据获取机制的设计。我们设计了一种激励兼容机制,该机制可在预算约束下优化估计的偏差和方差之间的最坏情况折衷,其中最坏情况超出了成本和数据之间的未知相关性。此外,我们以封闭形式描述最优机制的结构,并研究市场的单调性和非单调性。

哈希加速图神经网络的链路预测

原文标题: Hashing-Accelerated Graph Neural Networks for Link Prediction

地址: http://arxiv.org/abs/2105.14280

作者: Wei Wu, Bin Li, Chuan Luo, Wolfgang Nejdl

摘要: 网络在现实世界中无处不在。链路预测是网络结构数据的关键问题之一,旨在预测两个节点之间是否存在链接。传统方法基于紧凑节点表示之间的显式相似性计算,即通过将每个节点嵌入到低维空间中。为了有效处理链路预测中的密集相似性计算,已成功使用哈希技术在汉明空间中生成节点表示。但是,基于散列的链路预测算法在嵌入过程中面临着随机散列技术带来的精度损失或从学习到散列技术带来的效率低下。目前,图神经网络(GNN)框架已经以端到端的方式广泛应用于与图相关的任务,但是由于大量的参数学习,它通常需要大量的计算资源和内存成本,这使得GNN-如果没有强大的功能,基于算法的算法是不切实际的。在本文中,我们提出了一个简单有效的模型#GNN,该模型在精度和效率之间进行了权衡。 #GNN能够通过利用随机哈希技术在GNN框架中实现消息传递并刻画高阶接近度,从而有效地获取Hamming空间中的节点表示以进行链路预测。此外,我们在概率上刻画了#GNN的判别力。大量的实验结果表明,提出的#GNN算法可达到与基于学习的算法相当的精度,并且优于随机算法,同时运行速度明显快于基于学习的算法。而且,所提出的算法在资源有限的大规模网络上显示出极好的可扩展性。

加权无向多层网络中的聚类系数

原文标题: Clustering Coefficients in Weighted Undirected Multilayer Networks

地址: http://arxiv.org/abs/2105.14325

作者: Paolo Bartesaghi, Gian Paolo Clemente, Rosanna Grassi

摘要: 现实世界中的复杂系统通常以通过不同性质的关系连接的实体为特征。这些系统可以由多层网络适当地描述,其中可以方便地表示节点之间的不同关系,从而通过不同的层来构造网络。为了在多层环境中扩展,为单层网络提出的经典网络指标是一个重要的问题。在这项工作中,我们研究在加权无向多层网络中通过局部聚类系数表示的三角形模体的发生率。我们为多层网络提供了新的局部聚类系数,根据节点的位置从不同角度查看网络,以及整个网络的全局聚类系数。我们还证明,文献中存在的所有众所周知的聚类系数表达式,都可以适当地扩展到多层框架,无论是在张量还是在超矩阵方面,都可以统一到我们的建议中。为了显示所提出措施的有效性,我们基于S&P100资产的收益研究了多层时间金融网络的应用。

GINA:来自独立快照的神经关系推断

原文标题: GINA: Neural Relational Inference From Independent Snapshots

地址: http://arxiv.org/abs/2105.14329

作者: Gerrit Großmann, Julian Zimmerlin, Michael Backenköhler, Verena Wolf

摘要: 在自然和社会中,动因之间的局部相互作用引起复杂的新兴现象的动力学系统无处不在。这项工作探讨了根据其组成主体或单个组件(表示为节点)的测量来推断此类系统的未知交互结构(表示为图)的问题。我们考虑一种设置,其中基本的动力学模型是未知的,并且不同的测量值(即快照)可能是独立的(例如可能来自不同的实验)。我们提出了图神经网络(GNN)GINA(图推理网络体系结构),以同时学习潜在的交互图,并在交互图的条件下,基于相邻顶点预测节点的可观察状态。 GINA基于以下假设:地面真相交互图以及所有其他潜在图均允许以最高的精度预测节点的状态(给定其邻居的状态)。我们检验了这一假设,并在广泛的相互作用图和动力学过程中证明了GINA的有效性。

图相似性描述:这些图如何相似?

原文标题: Graph Similarity Description: How Are These Graphs Similar?

地址: http://arxiv.org/abs/2105.14364

作者: Corinna Coupette, Jilles Vreeken

摘要: 社会网络在各个平台之间有何不同?信息网络如何随着时间变化?要回答此类问题,我们需要比较两个或多个图。该任务通常被视为度量问题,但是数字答案只能提供有限的洞察力。在这里,我们认为如果目标是获得理解,则应该将图相似性评估视为描述问题。我们使用最小描述长度原则将此问题形式化为模型选择任务,刻画通用模型中输入图的相似性以及转换为单个模型时它们之间的差异。为了发现好的模型,我们提出了Momo,它将问题分为两部分,并为每部分引入了有效的算法。通过在广泛的合成图和真实图上进行的大量实验,我们确认Momo在实践中效果很好。

难民动态安置

原文标题: Dynamic Placement in Refugee Resettlement

地址: http://arxiv.org/abs/2105.14388

作者: Narges Ahani, Paul Gölz, Ariel D. Procaccia, Alexander Teytelboym, Andrew C. Trapp

摘要: 安置难民的就业结果在很大程度上取决于他们在收容国内部的位置。在美国每年为社区设定难民能力的同时,难民必须在一年中到达并必须被安置。我们引入基于两阶段随机规划的动态分配系统,以改善就业成果。我们的算法能够实现超过98%的后见之明的最佳就业机会,而目前的贪婪式方法则不到90%。即使我们纳入了难民重新安置过程的许多实际特征,包括不可分割的家庭,批次和对未来抵达人数的不确定性,这种巨大的改善仍然持续存在。我们的算法现已成为美国领先的难民安置机构使用的Annie MOORE优化软件的一部分。

稀疏图的样本Frechet平均值是稀疏的

原文标题: The Sample Frechet Mean of Sparse Graphs is Sparse

地址: http://arxiv.org/abs/2105.14397

作者: Francois G. Meyer, Daniel Ferguson

摘要: 在本文中,我们证明了以下结果:一组稀疏图的样本Fr’echet均值是稀疏的。我们使用非常不同的参数证明了汉明距离图和谱邻接伪度量的结果。

与期限相关的优先级排队模型的数值研究

原文标题: Numerical study on the deadline-concerning priority queuing model

地址: http://arxiv.org/abs/2105.14718

作者: Hang-Hyun Jo

摘要: Barab’asi的优先级排队模型[A.-L. Barab’asi,Nature textbf 435,207(2005)]及其变体已得到广泛研究,以理解事件间时间的重尾分布以及在人类动力学的各种经验分析中观察到的响应时间。在本文中,我们重点关注分配给固定大小队列中的任务的最后期限对响应时间分布的影响。在此,响应时间定义为任务到达与执行之间的时间间隔。我们提出了一个有关期限的优先级排队模型,其中,随着期限的临近,优先级是使用截止期限的剩余时间的倒数来调整的。通过进行数值模拟,我们发现表征响应时间分布的幂律指数在确定性选择协议下小于 1 ,而在非确定性选择协议下具有 1 的值。

重新审视长期科学影响

原文标题: Long-term Scientific Impact Revisited

地址: http://arxiv.org/abs/2105.14918

作者: Sandro M. Reia, José F. Fontanari

摘要: 基于引文的度量被广泛用作主观因素(例如论文的重要性甚至个人研究人员的价值)的定量主体。在这里,我们分析了在1960年至1968年之间在美国物理学会期刊上发表的4669美元论文的被引历史,并认为最新的引种动力学模型和预测非平稳时间序列的算法很可能会失败使用发表后短时期内(例如, 10 年)收集的引文数据来预测高被引论文的长期引用( 50 年)。之所以如此,是因为这些论文没有表现出独特的短期引用方式,尽管它们的长期引用方式明显地将它们与其他论文区分开了。我们得出的结论是,即使人们承认引用计数是论文质量的主体,它们也不是有用的评估工具,因为在被高引用的论文中,短期计数不能提供长期计数的信息。

基于SEIR模型的印度第二波COVID-19浪潮分析

原文标题: Analysis of the second wave of COVID-19 in India based on SEIR model

地址: http://arxiv.org/abs/2105.15109

作者: R. Gopal, V. K. Chandrasekar, M. Lakshmanan

摘要: 印度正遭受第二次COVID-19大流行的严重威胁。情况令人沮丧,因为与第一个高峰相比,受感染的个人/活跃病例的数量正在惊人地增加。印度政府/州政府正在实施各种控制措施,例如封锁,建立新医院以及在各个阶段设置出行限制,以减轻从最初的大流行开始传播的病毒。最近,我们通过适当的参数量化了各种政府行动和个人的强度,研究了印度COVID-19流行演变的SEIR动态模型(CURRENT SCIENCE,第120卷,第1342页(2021年))。反应。我们的分析已经很好地预测了第一波的情景。在本文中,我们将借助上述SEIR模型扩展我们的分析,以估计印度正在进行的第二波COVID-19浪潮中的感染个体数量。我们的研究结果表明,人们的个人努力是控制当前和未来大流行的最重要因素。我们还指出了第三波的可能性。

荷兰CoronaMelder App进行接触者追踪的流行病学模型

原文标题: An Epidemiological Model for contact tracing with the Dutch CoronaMelder App

地址: http://arxiv.org/abs/2105.15111

作者: Peter Boncz

摘要: 我们提供了一种流行病学模型,用于证明CoronaMelder的有效性,CoronaMelder是在Google / Apple Exposure Notification框架之上开发的荷兰数字联系人跟踪应用程序。我们在许多指标上将CoronaMelder的有效性与手动合同跟踪进行了比较。事实证明,CoronaMelder在减缓COVID-19大流行方面具有很小但明显的积极影响,在开放社会中,采用CoronaMelder的人数增加了,这种影响将变得更加明显。

基于交通和运输网络的印度传染病危害地图

原文标题: An infectious diseases hazard map for India based on mobility and transportation networks

地址: http://arxiv.org/abs/2105.15123

作者: Onkar Sadekar, Mansi Budamagunta, G. J. Sreejith, Sachin Jain, M. S. Santhanam

摘要: 我们建议并构建印度的传染病危害地图。给定传染病的爆发地点,危害图量化了印度城镇所面临的感染风险。一个由SIR元人口模型和流动性数据组成的框架被用来模拟传染病的传播。尽管针对该主题进行了多次针对印度的研究,但由于主要的感染方式扩散,很少有人关注长途旅行。利用广泛的实际数据和空中,铁路和公路的流动性估算,构建了一个由446个人口超过10万的印度城市组成的交通和流动网络。基于结合了流动性信息的有效距离的概念,将给定爆发地点的危险值分配给每个城市。结果表明,距疫情爆发地点的有效距离而不是地理距离与每个城市感染的到达时间呈线性关系,因此提供了更好的风险度量。还将估计的危险指数与2020年第一波期间传播的SARS-CoV-2真实数据进行了比较,并取得了良好的一致。有了更好的流动性数据,建议的危害图框架可在将来用于任何其他传染病传播。

社会交往波动对流行病传播的影响

原文标题: Impact of fluctuations in social contacts on the spread of epidemics

地址: http://arxiv.org/abs/2105.15140

作者: S. P. Fisenko, P.S. Grinchuk

摘要: 建立了流行病传播的数学模型,该模型考虑了人类社会交往数量的波动。该模型基于逻辑方程。一周内社交联系数量的波动被认为是波动的主要来源。触点数量的时间波动变量表示为触点数量的傅里叶级数展开的前两个项的总和。结果表明,最大的波动幅度出现在流行病传播的最大速率附近。在那之后,波动的影响减小,直到流行病结束。

通过新闻生态系统中的供求动态评估虚假信息

原文标题: Assessing disinformation through the dynamics of supply and demand in the news ecosystem

地址: http://arxiv.org/abs/2105.15172

作者: Pietro Gravino, Giulio Prevedello, Martina Galletti, Vittorio Loreto

摘要: 作为我们民主制国家基础的社会对话目前受到虚假信息和党派关系的威胁,它们破坏了个人和集体意识,对决策过程造成了不利影响。尽管对新闻领域本身有很多关注,但对于信息要约与信息之间的微妙相互作用却知之甚少。尽管如此,仍需要对新闻生态系统有更广阔的视野,包括信息的生产者和消费者,以建立评估信息层健康状况的新工具。在这里,我们将新闻提供整合到一个框架中,就像一个相当完整的意大利新闻数据库所反映的那样-部分通过假冒新闻和新闻需求(通过意大利的Google趋势数据刻画)进行注释。我们的调查重点是新闻,假新闻以及在多个领域(包括SARS-CoV-2病毒大流行)中的搜索在时间和语义上的相互作用。出现两个主要结果。首先,虚假信息对人们的利益具有极大的反应性,并且容易发扬光大,尤其是当人们感兴趣的内容与新闻媒体提供的内容不匹配时。第二,适当定义的索引只能根据新闻和搜索的可用量来评估虚假信息的级别。尽管我们的结果主要涉及冠状病毒主题,但我们提供了暗示,即相同的发现可能具有更广泛的应用。我们认为,这些结果可以成为通知反对虚假信息的运动的强大资产,并为新闻媒体和机构提供潜在的相关策略。

COVID-19大流行期间人员流动性的优化策略:综述

原文标题: Optimization strategies of human mobility during the COVID-19 pandemic: A review

地址: http://arxiv.org/abs/2105.15185

作者: Soumyajyoti Biswas, Amit Kr Mandal

摘要: 持续的COVID-19大流行的影响正在我们的生活的各个领域中感受到-跨越国家,财富,宗教或种族的界限。从首次在公众中发现感染开始,这种病毒就在短时间内传播到了世界上几乎所有国家。以人类为病毒载体,传播过程必然取决于其被感染后的活动能力。不仅在最初的传播过程中,而且在突变体变种的后续传播中,人类活动性在动力学中都起着核心作用。因此,一方面,各国在国内外都施加了不同程度的旅行限制。另一方面,这些限制通常会严重影响企业和民生。因此,这是一个优化过程,在全球范围内进行,具有多个变化的变量。在这里,我们回顾了这些技术及其对数据迁移,机器学习和模型方法在不同规模上对人类移动性的优化或拟议优化的影响。

基于从查询到报价转换的报价建议与解释

原文标题: Quotation Recommendation and Interpretation Based on Transformation from Queries to Quotations

地址: http://arxiv.org/abs/2105.14189

作者: Lingzhi Wang, Xingshan Zeng, Kam-Fai Wong

摘要: 为了帮助个人更好地表达自己的意见,报价建议越来越受到关注。然而,大多数先前的努力集中于分别对报价和查询建模,而忽略报价和查询之间的关系。在这项工作中,我们引入了一个转换矩阵,该矩阵直接将查询表示映射到报价表示。为了更好地理解映射关系,我们采用了一种映射损失,该损失使两个语义空间(一个用于引用,另一个用于映射查询)的距离最小。此外,我们探索使用历史查询中的单词来解释报价的比喻语言,其中在历史查询的顶部应用了引起报价的注意,以突出指示词。在中英文两个数据集上进行的实验表明,我们的模型优于以前的最新模型。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20210601/