Arxiv网络科学论文摘要15篇(2020-12-02)

  • 异构图嵌入综述:方法、技术、应用和源代码;
  • 机器学习时空流行病学模型评估德国县级COVID-19风险;
  • 技术知识的累积程度如何?;
  • Twitch上的观众和流媒体的大规模参与;
  • 振荡模型基本方程对代数表示的独立性:社交媒体回声室效应;
  • 从社交媒体帖子中识别与大流行相关的压力因素——对学生和年轻人的影响;
  • 高阶网络影响框架之间的等价性:通用阈值、超图触发和逻辑触发模型;
  • 更少但更好:带有异常值的社区搜索;
  • 使用基于迁移的流行病学模型预测已确诊的COVID-19大流行病例;
  • 缺乏实际可识别性可能会妨碍COVID-19流行病模型的可靠预测;
  • 性能波动在实际项目网络中的传播;
  • 深度引力:利用深度神经网络和地理信息增强流动性的产生;
  • 流行病学的k统计方法;
  • 土耳其安那托利亚东南部2019年和2020年的种植方式变化;
  • 数据驱动的COVID-19 SEIR模型的最优控制;

异构图嵌入综述:方法、技术、应用和源代码

原文标题: A Survey on Heterogeneous Graph Embedding: Methods, Techniques, Applications and Sources

地址: http://arxiv.org/abs/2011.14867

作者: Xiao Wang, Deyu Bo, Chuan Shi, Shaohua Fan, Yanfang Ye, Philip S. Yu

摘要: 异构图(HG)也称为异构信息网络,在现实世界中已经无处不在。因此,HG嵌入旨在在较低维空间中学习表示形式,同时保留下游任务的异构结构和语义(例如,节点/图分类,节点聚类,链路预测),近年来受到了广泛的关注。在本次调查中,我们对HG嵌入方法和技术的最新发展进行了全面回顾。我们首先介绍HG的基本概念,并讨论与同构图表示学习相比,HG嵌入的异构性带来的独特挑战;然后,我们根据学习过程中使用的信息对HG嵌入方法进行系统地调查和分类,以解决HG异构性带来的挑战。特别是,对于每种代表性的HG嵌入方法,我们都会提供详细的介绍并进一步分析其优缺点;同时,我们还首次探索了不同类型的HG嵌入方法在现实工业环境中的可转换性和适用性。此外,我们进一步介绍了几个广泛部署的系统,这些系统已经证明了HG嵌入技术在解决具有广泛影响的实际应用问题方面的成功。为了促进该领域的未来研究和应用,我们还总结了开源代码,现有的图学习平台和基准数据集。最后,我们探讨了HG嵌入的其他问题和挑战,并预测了该领域的未来研究方向。

机器学习时空流行病学模型评估德国县级COVID-19风险

原文标题: Machine learning spatio-temporal epidemiological model to evaluate Germany-county-level COVID-19 risk

地址: http://arxiv.org/abs/2012.00082

作者: Lingxiao Wang, Tian Xu, Till Hannes Stoecker, Horst Stoecker, Yin Jiang, Kai Zhou

摘要: 随着COVID-19大流行继续肆虐世界,及时提供多层次的COVID-19风险预测至关重要。为了实施它并评估公共卫生政策,我们开发了一个机器学习框架,以协助从感染数据中提取流行病动态,其中包含一个县级时空流行病学模型,该模型将空间元胞自动机(CA)与时间易感性相结合-未诊断的感染-已移除(SUIR)模型。与现有的时间风险预测模型相比,提出的CA-SUIR模型显示了不同政策下该县对政府的多级风险和冠状病毒的传播方式。该新工具箱首先用于预测德国412个兰德克雷伊(县)的多级COVID-19患病率,包括提前t天风险预测和对旅行限制政策的风险评估。作为实际例证,我们预测圣诞节期间的死亡人数为3.45万,最有效的政策可能将其控制在2万1千以下。这种可干预的评估系统可以帮助决定大流行中的经济复苏和公共卫生政策。

技术知识的累积程度如何?

原文标题: How cumulative is technological knowledge?

地址: http://arxiv.org/abs/2012.00095

作者: P.G.J. Persoon, R.N.A. Bekkers, F. Alkemade

摘要: 技术累积性被认为是技术进步的主要机制之一,但其确切含义和动态往往仍不清楚。为了更好地理解这种机制,我们将技术视为由相互联系的发明组成的知识体系。因此,技术累积性可以理解为发明在同一知识体系内以其他发明为基础的程度。因此,技术的累积性以其知识库的结构为特征,该结构与知识库的规模不同但密切相关。我们通过分析得出描述累积性和知识库大小之间关系的方程。此外,我们使用专利数据对许多选定技术进行了经验检验。我们的结果表明,累积性与知识库的大小成比例地增加,其增长率在不同技术之间有很大差异。同时,我们发现,在各种技术中,随着时间的流逝,该速率与发明速率成反比。这表明,在快速发展的技术中,累积性增长相对较慢。总而言之,本文提出的方法可以对技术之间的累积性差异以及技术开发背​​后的知识动态进行深入,系统的分析。

Twitch上的观众和流媒体的大规模参与

原文标题: Audience and Streamer Participation at Scale on Twitch

地址: http://arxiv.org/abs/2012.00215

作者: Claudia Flores-Saviaga, Jessica Hammer, Juan Pablo Flores, Joseph Seering, Stuart Reeves, Saiph Savage

摘要: 诸如Twitch之类的大型流媒体平台正变得越来越流行,但详细的受众与流媒体交互动力学仍未得到大规模探索。在本文中,我们对包含1200万观众聊天消息和45小时流视频的数据集进行了混合方法研究,以理解Twitch上的观众参与和流媒体性能。我们根据规模和受众参与风格发现五种类型的流:Clique流,具有密切的流媒体与受众互动的小型流;上升的直播带,使用定制技术的中档直播带和主持人来规范其社区;颤音盒,具有确定的对话动态的中档流;聚光灯串流,大型流在吸引众多观众的同时还保留了社区感;和专业人士,与体育场风格的观众产生巨大的联系。我们讨论了每种风格的彩带和受众面临的挑战和机遇,并通过提供数据支持的设计含义来总结结论,这些含义可以增强彩带,受众,直播流平台和博弈设计师的能力

振荡模型基本方程对代数表示的独立性:社交媒体回声室效应

原文标题: Independence of the Fundamental Equation of the Oscillation Model on Algebraic Representations: Social Media Echo Chamber Effect

地址: http://arxiv.org/abs/2012.00302

作者: Kakeru Ohki, Ayako Hashizume, Masaki Aida

摘要: 在描述在线社会网络用户动态的振荡模型中,众所周知,基本方程式可以明确描述网络结构与用户动态之间的因果关系。基本方程式使用满足反换向关系的代数,并且其矩阵表示不是唯一的。但是,即使矩阵表示形式不同,如果它们描述的是相同现象,则应从基本方程的不同表示形式得出相同的结果。在本文中,我们以回声腔效应为例确认,不同矩阵表示形式的基本方程式得出的结果相同。

从社交媒体帖子中识别与大流行相关的压力因素——对学生和年轻人的影响

原文标题: Identifying pandemic-related stress factors from social-media posts – effects on students and young-adults

地址: http://arxiv.org/abs/2012.00333

作者: Sachin Thukral, Suyash Sangwan, Arnab Chatterjee, Lipika Dey

摘要: COVID-19大流行已使全球范围内的自然生活一团糟。采取了严格的措施来遏制引起该病毒的病毒的传播,其中最有效的措施是社会隔离。这导致了社会上广泛的忧郁和沮丧,但在年轻人和老年人中更是如此。目前,全球186个国家有2亿多大学生受到大流行的影响。随着电子学习的迅速适应,教育方式突然发生了变化,从而可以在数字平台上远程进行教学。这项研究提出了在COVID时代从学生和年轻人发布的社交媒体帖子中收集的见解。使用统计和自然语言处理技术,我们分析了用户自己在Reddit上与抑郁症相关的社区中发布的行为问题。我们提出了使用语言技术来系统分析内容的方法,以找出引起压力的因素。在线教育,失业,与朋友隔绝和家庭虐待成为主要的压力因素。

高阶网络影响框架之间的等价性:通用阈值、超图触发和逻辑触发模型

原文标题: On the Equivalence Between High-Order Network-Influence Frameworks: General-Threshold, Hypergraph-Triggering, and Logic-Triggering Models

地址: http://arxiv.org/abs/2012.00355

作者: Wei Chen, Shang-Hua Teng, Hanrui Zhang

摘要: 在本文中,我们研究了几种高阶网络影响力传播框架及其与经典网络扩散框架的联系,例如触发模型和通用阈值模型。在一个框架中,我们使用超边来表示多对一的影响-一组节点在另一个节点上的集体影响-并将超图触发模型定义为经典触发模型的自然扩展。在另一个框架中,我们使用单调布尔函数来刻画潜在的多对一影响行为的各种逻辑,并将触发模型扩展到布尔函数触发模型。我们证明,即使具有影响逻辑的详细信息,布尔函数触发模型也等同于超图触发模型,并且都等同于通用阈值模型。此外,在具有相同表达能力的所有模型中,一般阈值模型在参数数量上是最佳的。通过引入不同节点上影响传播之间的相关性,我们进一步扩展了这三个等效模型。令人惊讶地,我们发现,尽管基于超图的相关模型仍然与基于布尔函数的相关模型等效,但是与之相比,相关的一般阈值模型比两个高阶模型的限制性更强。我们的研究通过提供对现有模型中群体影响行为的新见解以及用于理解网络中影响传播的各种建模工具,为高阶网络影响传播提供了启示。

更少但更好:带有异常值的社区搜索

原文标题: Better Fewer but Better: Community Search with Outliers

地址: http://arxiv.org/abs/2012.00356

作者: Francesco Bonchi, Lorenzo Severini, Mauro Sozio

摘要: 给定网络中的一组顶点(我们认为分析中的应用程序感兴趣),社区搜索是生成可能解释所关注顶点之间存在的关系的子图的问题。在实践中,这意味着解决方案应在查询的顶点上添加一些顶点,以便创建显示出某些“内聚性”属性的连接子图。近年来,这个问题已受到越来越多的关注:尽管已经研究了几个内聚函数,但大量文献都在寻找包含所有查询顶点的解决方案子图。但是,在许多探索性分析中,我们可能只对感兴趣的顶点有一个合理的信念:如果只有其中一个顶点与其他顶点之间没有真正的联系,则强迫解决方案将所有顶点包括在内可能会隐藏更紧密和有意义的存在子图,我们可以通过允许解决方案检测并丢弃离群点来找到。在本文中,我们研究了具有离群值的社区搜索问题,其中允许我们丢弃最多 k 个查询顶点,其中 k 作为输入参数。我们考虑三种最常用的内聚性度量:最小度,子图的直径和带有查询顶点的最大距离。通过优化一个并使用另一个作为约束,我们获得了三个优化问题:我们研究了它们的硬度,并提出了不同的精确算法和近似算法。

使用基于迁移的流行病学模型预测已确诊的COVID-19大流行病例

原文标题: Forecasting confirmed cases of the COVID-19 pandemic with a migration-based epidemiological model

地址: http://arxiv.org/abs/2012.00397

作者: Xinyu Wang, Lu Yang, Hong Zhang, Zhouwang Yang, Catherine Liu

摘要: 自2020年头几个月以来,史无前例的冠状病毒病2019(COVID-19)大流行仍然是人类生命的全球威胁。预测确诊病例的大小对于国家和社区至关重要制定适当的预防和控制政策,以有效遏制COVID-19的传播。与2003年SARS流行病和2009年全球H1N1流感大流行不同,COVID-19在其感染区和恢复区中具有独特的流行病学特征。这驱使我们制定了一种新的传染性动态模型来预测人类移动网络内的COVID-19大流行,该模型被称为SaucIR模型,因为新的隔离模型通过划分受感染者的人流来扩展基准SIR模型。表现为无症状,经过病理感染但未经证实且已确认。此外,我们在模型中采用人口流动的动态模型,以便可以有效地合并空间效应。我们预测,到2020年2月下旬至2020年5月上旬期间,在中国大陆某些省份和其他遭受严重感染的国家中,确诊病例的蔓延情况。结合大流行病的地理分布的新颖性将导致与发布已确认的病例报告。数值分析证实了与现有相似度相比,我们提出的SaucIR模型具有较高的可预测性。建议的SaucIR预测模型是在Python中实现的。 Dash也正在开发基于Web的应用程序(正在建设中)。

缺乏实际可识别性可能会妨碍COVID-19流行病模型的可靠预测

原文标题: Lack of practical identifiability may hamper reliable predictions in COVID-19 epidemic models

地址: http://arxiv.org/abs/2012.00443

作者: Luca Gallo, Mattia Frasca, Vito Latora, Giovanni Russo

摘要: 隔室模型被广泛用来描述和预测传染病的传播。此类模型的未知参数需要根据数据进行估算。此外,当某些模型变量无法凭经验获得时,例如在无症状COVID-19携带者的情况下,必须将其作为模型的结果来获取。在这里,我们引入一个框架来量化数据中的不确定性如何影响给定模型的参数确定和未测变量的演变。我们说明了该方法如何能够表征不同的可识别性机制,即使在很少隔间的模型中也是如此。最后,我们讨论了在COVID-19现实模型中缺乏可识别性可能如何阻止流行病动态的可靠预测。

性能波动在实际项目网络中的传播

原文标题: Spreading of performance fluctuations on real-world project networks

地址: http://arxiv.org/abs/2012.00480

作者: Iacopo Pozzana, Christos Ellinas, Georgios Kalogridis, Konstantinos Sakellariou

摘要: 在研究网络上的传播过程时,理解各个节点的作用是一项关键挑战。在这项工作中,我们提出了一种新颖的度量标准,即可达性-异构性(RH),以量化每个节点相对于网络上传播过程的脆弱性。然后,我们引入一个数据集,该数据集由其活动网络描述的四个大型工程项目组成,包括每个活动的绩效记录;此类数据描述了各种活动之间的绩效波动分布,可以用作研究网络分布现象的可靠基础。我们在这些项目网络上测试了RH指标的有效性,并发现RH得分较低的节点往往表现得更好。我们还比较了RH和其他七个节点指标,表明前者与活动绩效高度相关。考虑到RH的上下文不可知性,我们基于实际数据的结果表明,网络结构在总体项目绩效方面发挥着作用。

深度引力:利用深度神经网络和地理信息增强流动性的产生

原文标题: Deep Gravity: enhancing mobility flows generation with deep neural networks and geographic information

地址: http://arxiv.org/abs/2012.00489

作者: Filippo Simini, Gianni Barlacchi, Massimiliano Luca, Luca Pappalardo

摘要: 个人在城市内部和城市之间的移动影响着我们社会的关键方面,例如客观和主观幸福感,创新的传播,流行病的传播以及环境的质量。因此,围绕具有挑战性的流量生成问题的兴趣日益浓厚,这涉及在给定位置的特征且没有任何有关实际流量的信息的情况下,在一组地理位置之间生成流量。现有的流产生解决方案主要基于机械方法,例如引力模型和辐射模型,这些方法存在拟合不足和过度分散的问题,忽略了土地使用和运输网络等重要变量,无法描述这些变量之间的非线性关系。变量。在本文中,我们提出了多特征深重力(MFDG)模型作为流产生的有效解决方案。一方面,MFDG模型利用了从自愿地理信息数据(OpenStreetMap)中提取的大量变量(例如,土地使用和道路网络的特征;交通,食品和卫生设施)。另一方面,我们的模型利用深度神经网络来描述这些变量之间的复杂非线性关系。我们对英格兰的通勤流量进行的实验表明,与不使用深层神经网络或不利用地理区域的机械模型相比,MFDG模型的性能有了显著提高(对于人口稠密的地区,可达250%)自愿数据。我们的工作提出了对流生成问题的精确定义,这对于使用时空数据的深度学习社区来说是一项新任务,并提出了一种深度神经网络模型,该模型明显优于当前的最新统计模型。

流行病学的k统计方法

原文标题: The k-statistics approach to epidemiology

地址: http://arxiv.org/abs/2012.00629

作者: Giorgio Kaniadakis, Mauro M. Baldi, Thomas S. Deisboeck, Giulia Grisolia, Dionissios T. Hristopulos, Antonio M. Scarfone, Amelia Sparavigna, Tatsuaki Wada, Umberto Lucia

摘要: 大量复杂的物理,自然和人工系统由统计分布控制,这些统计分布通常在整体上遵循标准指数函数,而它们的尾部遵循帕累托幂定律。最近引入的 kappa-statistics框架使用此功能预测分布函数。越来越多的不同调查领域的应用程序开始证明 kappa统计量在拟合经验数据中的相关性和有效性。在本文中,我们使用 kapp -statistics制定流行病学分析的统计方法。我们通过用1417年佛罗伦萨瘟疫大流行的数据以及2020年4月16日结束的中国整个COVID-19大流行的数据拟合导出的 kappa -Weibull分布来验证理论结果。为了进一步验证所提出的方法,我们对来自德国,意大利,西班牙和英国等国家的COVID-19数据进行了更为系统的分析,从而在理论预测和实证观察之间取得了很好的一致性。对于这些国家,我们还研究了整个大流行的第一个周期,一直持续到2020年7月结束。事实上,佛罗伦萨瘟疫数据和Covid-19大流行的数据都可以用相同的理论模型成功描述,甚至尽管这两个事件是由不同的疾病引起的,并且相隔了600多年,但这证明了 kappa -Weibull模型具有通用特征。

土耳其安那托利亚东南部2019年和2020年的种植方式变化

原文标题: Change of Cropping Patterns of Southeastern Anatolia, Turkey in 2019 and 2020

地址: http://arxiv.org/abs/2012.00684

作者: Mustafa Teke

摘要: 土耳其东南部安纳托利亚地区多年作物作图的简短技术报告及其对用水量估算的潜在影响。

数据驱动的COVID-19 SEIR模型的最优控制

原文标题: Data-driven optimal control of a SEIR model for COVID-19

地址: http://arxiv.org/abs/2012.00698

作者: Hailiang Liu, Xuping Tian

摘要: 自2019年12月发生第一例COVID-19以来,截至2020年11月17日,美国共报告确诊病例 11,357,322 ,全球确诊病例 55,624,562 ,引起当地和国际恐惧。尤其是,冠状病毒目前正在全国范围内风起云涌。在本文中,我们研究了基本的易感暴露传染恢复(SEIR)模型,并将模型参数校准为所报告的数据。我们还尝试在相对较短的时间内预测疫情的演变,并提供对COVID-19流行病的预定最佳控制。我们基于与最优控制理论相关的广义庞特里亚金最大原理提供有效的数值算法。数值实验证明了该模型及其数值近似的有效性能。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20201202/