- 具有不可知分布偏移的图的稳定预测;
- 可访问性:节点度的一般化(教程);
- Covid-19 社交媒体信息的新数据集成框架;
- 使用最大熵推断疾病爆发的空间来源;
- 使用统计物理学启发的概率对 COVID-19 大流行进行蒙特卡罗模拟;
- KPop 粉丝在社交媒体上推动 COVID-19 公共卫生信息传播;
- 文本分析和深度学习:一种网络方法;
- 美国大都市区城市混合模式中的社会经济偏见;
- 尽管如此:微小的影响和等级规范如何在组织中创造和维持性别差异;
具有不可知分布偏移的图的稳定预测
原文标题: Stable Prediction on Graphs with Agnostic Distribution Shift
地址: http://arxiv.org/abs/2110.03865
作者: Shengyu Zhang, Kun Kuang, Jiezhong Qiu, Jin Yu, Zhou Zhao, Hongxia Yang, Zhongfei Zhang, Fei Wu
摘要: 图是一种灵活有效的工具,可以在实践中表示复杂的结构,图神经网络 (GNN) 已被证明在具有随机分离的训练和测试数据的各种图任务上是有效的。然而,在实际应用中,训练图的分布可能与测试图的分布不同(例如,用户在用户-项目训练图上的交互和他们对项目的实际偏好,即测试环境,已知存在不一致)在推荐系统中)。此外,在训练 GNN 时,测试数据的分布总是不可知的。因此,我们面临着图学习训练和测试之间的不可知分布转变,这将导致传统 GNN 在不同测试环境中的推理不稳定。为理解决这个问题,我们为 GNN 提出了一种新颖的稳定预测框架,它允许对图进行局部和全局稳定的学习和预测。特别是,由于每个节点在 GNN 中由其邻居部分表示,我们建议通过重新加权信息传播/聚合过程来刻画每个节点的稳定属性(局部稳定)。为了全局稳定性,我们提出了一个稳定的正则化器,可以减少异构环境中的训练损失,从而使 GNN 能够很好地泛化。我们对几个图基准和嘈杂的工业推荐数据集进行了广泛的实验,这些数据集是在产品促销节期间连续 5 天收集的。结果表明,我们的方法优于各种 SOTA GNN,可对具有不可知分布偏移的图进行稳定预测,包括由节点标签和属性引起的偏移。
可访问性:节点度的一般化(教程)
原文标题: Accessibility: A Generalization of the Node Degree (A Tutorial)
地址: http://arxiv.org/abs/2110.04086
作者: Alexandre Benatti, Luciano da F. Costa
摘要: 复杂网络拓扑特性的稳健而全面的表征需要采用多个相应的度量,其中节点度具有特别重要的意义。在目前的工作中,我们介绍了这些度量之一,即节点的可访问性,可以将其理解为节点度概念的概括,不仅包括该节点的连续邻域,而且还反映特定的在网络中展开的动态类型。在讨论了节点度及其层次扩展之后,我们提出了随机游走、熵和可达性的概念。提供了其数值计算的几个例子,以及一些实验结果表明它可以有效地补充四种复杂网络的其他拓扑测量提供的信息,即 Erdos-Renyi、Watts-Strogatz、Barabasi-Albert 和 Geometric .我们还描述了最近开发的工具箱如何用于计算相对大型网络中的可访问性。
Covid-19 社交媒体信息的新数据集成框架
原文标题: A New Data Integration Framework for Covid-19 Social Media Information
地址: http://arxiv.org/abs/2110.03845
作者: Lauren Ansell, Luciana Dalla Valle
摘要: Covid-19 大流行对人们的健康构成严重威胁,导致全球确诊病例超过 2.5 亿,死亡人数超过 500 万。为了减轻国家卫生保健系统的负担并减轻疫情的影响,需要针对短期和长期卫生需求的准确建模和预测方法,为旨在遏制大流行的政府干预措施提供信息。当前对 Covid-19 的研究通常基于单一信息源,特别是结构化的历史大流行数据。其他研究专门针对非结构化的在线检索洞察,例如社交媒体上的可用数据。然而,结构化和非结构化信息的结合使用仍然是未知的。本文旨在通过一种新颖的数据集成方法利用历史和社交媒体信息来填补这一空白。所提出的方法基于 vine copulas,它使我们能够通过利用不同信息源之间的依赖关系来改进预测。我们应用该方法将从官方来源检索的结构化数据集与从社交媒体收集的大型非结构化信息数据集相结合。结果表明,与传统方法相比,所提出的方法对 Covid-19 大流行的演变产生了更准确的估计和预测。
使用最大熵推断疾病爆发的空间来源
原文标题: Inferring Spatial Source of Disease Outbreaks using Maximum Entropy
地址: http://arxiv.org/abs/2110.03846
作者: Mehrad Ansari, David Soriano-Paños, Gourab Ghoshal, Andrew D. White
摘要: 疾病爆发的数学模型可以推断流行病的未来轨迹,从而为政策决策提供信息。另一项任务是推断疾病的起源,这在当前的数学模型中相对困难。这样的框架——跨越不同的复杂程度——通常对有关流行病参数、病例数和死亡率的输入数据很敏感,这些数据通常是嘈杂和不完整的。为了减轻这些限制,我们提出了一个最大熵框架,该框架适合流行病学模型,提供校准的感染源概率,并且由于先验信念模型而对噪声具有鲁棒性。最大熵与所使用的参数或模型结构无关,并允许在疾病传播动态阶段面临稀疏数据条件和不完整知识时灵活使用,从而在爆发的早期阶段提供更可靠的建模。我们通过预测合成图网络和纽约州真实移动网络中的未来疾病轨迹来评估模型的性能。此外,与现有方法不同,我们证明该方法可用于准确地推断爆发的起源。事实上,尽管人们普遍认为接触者追踪的可行性仅限于爆发的初始阶段,但我们报告了在晚期重建早期疾病动态(包括流行种子)的可能性。
使用统计物理学启发的概率对 COVID-19 大流行进行蒙特卡罗模拟
原文标题: Monte Carlo simulation of COVID-19 pandemic using statistical physics-inspired probabilities
地址: http://arxiv.org/abs/2110.03862
作者: José Enrique Amaro, José Nicolás Orce
摘要: 我们提出了一种流行病传播的蒙特卡罗模拟模型,该模型受到温度、横截面和相互作用范围等物理变量的启发,该模型考虑了黑体辐射中光子的普朗克分布来描述个体的移动性。该模型由可以处于四种不同状态的细胞格组成:易感、感染、恢复或死亡。受感染的细胞可以将疾病传播给某个随机范围 R 内的任何其他易感细胞。传输机制遵循粒子与目标之间相互作用的物理定律。每个受感染的粒子根据其能量影响相互作用区域 n 次。相互作用的数量与相互作用截面 sigma 和目标表面密度 rho 成正比。离散能量遵循普朗克分布规律,取决于系统的温度 T。对于任何交互,应用感染、恢复和死亡概率。我们调查了不同参数集的病毒传播结果,并将它们与可用的 COVID-19 数据进行比较。可以使模型的参数与时间相关,以考虑例如大流行期间封锁的影响。
KPop 粉丝在社交媒体上推动 COVID-19 公共卫生信息传播
原文标题: KPop Fandoms drive COVID-19 Public Health Messaging on Social Media
地址: http://arxiv.org/abs/2110.04149
作者: Ho-Chun Herbert Chang, Becky Pham, Emilio Ferrara
摘要: 本报告研究了 COVID-19 大流行期间一个意外但重要的积极公共卫生信息来源——K-pop 粉丝。利用 2020 年 3 月至 2021 年 3 月期间与戴口罩和 K-pop 相关的超过 700 万条推文,我们分析了标签 #WearAMask 在反戴口罩情绪和公共卫生错误信息中的在线传播情况。分析显示,韩国男团 BTS 是健康话题最重要的推动者。与没有提及 K-pop 的推文相比,来自卫生机构和知名人士的推文中提到 K-pop 产生的在线反应要高 111 倍。这些推文还引起了南美洲、东南亚和农村国家的强烈反应——主流社交媒体活动在基于 Twitter 的消息传递中经常忽视这些领域。我们的结果表明,公共卫生机构可以利用现有的受众市场在国内和全球范围内协同传播和瞄准服务不足的社区,尤其是在 COVID-19 等健康危机期间。
文本分析和深度学习:一种网络方法
原文标题: Text analysis and deep learning: A network approach
地址: http://arxiv.org/abs/2110.04151
作者: Ingo Marquart
摘要: 许多可供应用研究人员使用的信息都包含在书面语言或口语文本中。 BERT 等深度语言模型在计算语言学的许多应用中取得了前所未有的成功。然而,关于如何使用这些模型来分析现有文本,人们知之甚少。我们提出了一种新方法,将转换器模型与网络分析相结合,在感兴趣的语料库中形成语言使用的自我参照表示。我们的方法产生与底层模型高度一致的语言关系以及对它们进行数学上明确定义的操作,同时减少表示和距离度量的自由选择的数量。据我们所知,它代表了第一个直接从深度语言模型中提取语义网络的无监督方法。我们通过对术语“创始人”的语义分析来说明我们的方法。使用 1980 年至 2020 年《哈佛商业评论》的整个语料库,我们发现我们网络中的关系随时间和跨上下文跟踪话语的语义,识别和关联语义和句法关系的集群。最后,我们讨论了这种方法如何补充和告知对深度学习模型行为的分析。
美国大都市区城市混合模式中的社会经济偏见
原文标题: Socioeconomic biases in urban mixing patterns of US metropolitan areas
地址: http://arxiv.org/abs/2110.04183
作者: Rafiazka Millanida Hilman, Gerardo Iñiguez, Márton Karsai
摘要: 城市地区是具有不同社会经济背景的人的大熔炉,他们可能不仅被隔离,而且在城市中具有独特的流动模式。虽然流动性是由个人需求和偏好驱动的,但参观地点的具体选择通常受到人们社会经济地位的限制。考虑到他们的个人属性和同质倾向,人们和他们访问的地方之间复杂的相互作用是社会经济分层模式出现背后的关键机制,最终导致城市隔离。在这里,我们通过将来自社交定位平台 Foursquare 的个人登记数据与来自美国社区调查的人口普查信息相结合,调查了美国 20 个最大城市的混合流动模式。我们发现明显的分层迹象表明人们主要访问他们自己社会经济阶层的地方,偶尔会访问更高阶层的地方。这种“向上偏见”的强度随着社会经济地位的增加而增加,并与种族居住隔离的标准措施相关。我们的研究结果表明,个人流动性的社会经济隔离比系统级分布所预期的还要强烈,进一步揭示了城市中不均匀的流动性混合模式。
尽管如此:微小的影响和等级规范如何在组织中创造和维持性别差异
原文标题: Insidious Nonetheless: How Small Effects and Hierarchical Norms Create and Maintain Gender Disparities in Organizations
地址: http://arxiv.org/abs/2110.04196
作者: Yuhao Du, Jessica Nordell, Kenneth Joseph
摘要: 玻璃天花板一词适用于一种公认的现象,在这种现象中,女性和有色人种一直被阻止进入公司层级的最高层。关注性别,我们提出了一个基于主体的模型,该模型探讨了凭经验建立的人际歧视机制如何与组织(中观)和社会(宏观)层面的社会规范共同演化,从而为女性产生这种玻璃天花板效应。我们的模型扩展了我们对玻璃天花板是如何产生的以及为什么它可以抵抗变化的理解。我们通过将现有的歧视心理和结构理论综合到一个数学模型中来实现这一点,该模型明确量化了复杂的组织系统如何产生和维持不平等。我们讨论了我们的发现对干预和未来实证分析的影响,并为那些希望调整或扩展我们工作的人提供开源代码。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20211011/