Arxiv网络科学论文摘要11篇(2021-11-05)

  • 用于多药副作用、组合协同和药物相互作用预测的关系深度学习的统一视图;
  • 通过有针对性的枚举实现经济高效的网络解体;
  • 具有异质性的可解释图生成模型;
  • 使用平均转换概率和聚类的顺序电影类型预测;
  • 对流行病的有效抵抗:用于高保真流行病模拟的移动网络稀疏化;
  • “我们甚至不会挑战他们对种族主义的左派学术定义:”理解 Reddit 和 4chan 上电子论文的使用;
  • 美国两次总统选举之间的两极分化和 Twitter 新闻影响者的转变;
  • 识别党派选区的指标比较;
  • 在社交媒体上吸引政治上多元化的受众;
  • COVID-19 爆发的 Gompertz 增长是由超级传播者引起的;
  • 疫情初期限制政策对 COVID-19 传播动态的影响;

用于多药副作用、组合协同和药物相互作用预测的关系深度学习的统一视图

原文标题: A Unified View of Relational Deep Learning for Polypharmacy Side Effect, Combination Synergy, and Drug-Drug Interaction Prediction

地址: http://arxiv.org/abs/2111.02916

作者: Benedek Rozemberczki, Stephen Bonner, Andriy Nikolov, Michael Ughetto, Sebastian Nilsson, Eliseo Papa

摘要: 近年来,已经提出了许多试图解决多药副作用识别、药物相互作用预测和联合治疗设计任务的机器学习模型。在这里,我们提出了可以解决这些任务的关系机器学习模型的统一理论观点。我们提供基本定义、比较现有模型架构并讨论性能指标、数据集和评估协议。此外,我们强调该领域可能的高影响应用和重要的未来研究方向。

通过有针对性的枚举实现经济高效的网络解体

原文标题: Cost-effective Network Disintegration through Targeted Enumeration

地址: http://arxiv.org/abs/2111.02655

作者: Zhi-Gang Wang, Ye Deng, Zeng-Ru Di, Jun Wu

摘要: 尽管我们处于一个高度连接的世界,但这种连接在自然和社会中存在着不受欢迎的方面。寻找节点或链接的最佳子集来瓦解有害网络是网络科学中的一个基本问题,在反恐、流行病控制和许多其他领域都有潜在的应用。网络解体问题的挑战在于平衡策略的有效性和效率。在本文中,我们提出了一种用于网络解体的具有成本效益的目标枚举方法。我们的方法包括两个阶段:搜索候选对象和确定最佳解决方案。在第一阶段,我们采用排名聚合方法来生成综合节点重要性排名,在此基础上我们确定要删除的小规模候选节点集。在第二阶段,我们使用枚举方法在候选节点之间寻找最优组合。在合成网络和现实世界网络上的大量实验结果表明,我们的方法在有效性和效率之间实现了令人满意的折衷。引入的两阶段目标枚举框架可以进一步扩展到其他组合优化问题。

具有异质性的可解释图生成模型

原文标题: An Interpretable Graph Generative Model with Heterophily

地址: http://arxiv.org/abs/2111.03030

作者: Sudhanshu Chanpuriya, Ryan A. Rossi, Anup Rao, Tung Mai, Nedim Lipka, Zhao Song, Cameron Musco

摘要: 许多图模型都属于边无关点积模型的框架。这些模型输出所有节点对之间存在边的概率,并且两个节点之间链接的概率随着与节点关联的向量的点积而增加。最近的工作表明,这些模型无法捕捉现实世界图中的关键结构,尤其是异质结构,其中不同节点之间存在链接。我们提出了第一个与边无关的图生成模型,该模型 a) 表达能力足以捕捉异质性,b) 产生非负嵌入,允许根据社区来解释链路预测,以及 c) 在具有梯度的现实世界图上有效优化交叉熵损失的下降。我们的理论结果证明了我们的模型的表达能力,它能够使用大量线性最大程度的集群精确重建图,以及刻画数据中的异质性和同质性的能力。此外,我们的实验证明了我们的模型对各种重要应用任务的有效性,例如多标签聚类和链路预测。

使用平均转换概率和聚类的顺序电影类型预测

原文标题: Sequential Movie Genre Prediction using Average Transition Probability with Clustering

地址: http://arxiv.org/abs/2111.02740

作者: Jihyeon Kim, Jinkyung Kim, Jaeyoung Choi

摘要: 在最近的电影推荐中,预测用户的连续行为并建议观看下一部电影是最重要的问题之一。然而,捕捉这种连续行为并不容易,因为必须考虑每个用户的短期或长期行为。为此,许多研究结果表明,在顺序推荐中,推荐特定电影的性能并不是很高。在本文中,我们提出了一种基于聚类的方法,用于对具有相似电影购买模式的用户进行分类,并提出了一种电影类型预测算法,而不是考虑他们的短期和长期行为的电影本身。电影类型预测不推荐特定的电影,而是基于电影中包含的类型,考虑到每个用户对电影类型的偏好,预测下一部电影要观看的类型。通过这种方式,可以向倾向于喜欢特定类型的用户提供用于推荐包括该类型的电影的适当指南。特别是,在本文中,将具有相似流派偏好的用户组织成簇来推荐流派,而在没有相对特定倾向的簇中,通过适当修剪推荐不需要的流派来进行流派预测,以提高性能.我们在著名的电影数据集上评估我们的方法,并定性地认为它可以捕捉个性化动态并能够提出有意义的建议。

对流行病的有效抵抗:用于高保真流行病模拟的移动网络稀疏化

原文标题: Effective Resistance for Pandemics: Mobility Network Sparsification for High-Fidelity Epidemic Simulation

地址: http://arxiv.org/abs/2111.02449

作者: Alexander M. Mercier, Samuel V. Scarpino, Cristopher Moore

摘要: 网络科学越来越成为流行病学领域和我们应对传染病威胁能力的核心。然而,许多源自现代数据集的网络非常密集,例如每个位置都链接到大量目的地的移动网络。因此,使用数据驱动网络模拟大规模流行病需要大量计算资源,并且在许多情况下实际上是不可行的。减少在这些网络上模拟流行病的计算成本的一种方法是稀疏化,其中根据其重要性的某种度量选择具有代表性的边子集。我们在来自美国的移动性数据上测试了几种稀疏化策略,从朴素的阈值到边的随机采样根据最近在计算机科学领域的工作,我们发现最准确的方法使用边的有效阻力,它优先考虑唯一的边在他们的端点之间旅行的有效方式。由此产生的稀疏网络保留了 SIR 模型行为的许多方面,包括全局数量,如流行病规模,以及各个节点随机事件的详细信息,包括每个节点被感染的概率及其到达时间的分布。即使稀疏网络保留的原始网络的边少于 10% 也是如此。除了其实际效用之外,该方法还有助于阐明加权无向网络的哪些链接对疾病传播最重要。

“我们甚至不会挑战他们对种族主义的左派学术定义:”理解 Reddit 和 4chan 上电子论文的使用

原文标题: “We won’t even challenge their lefty academic definition of racist:” Understanding the Use of e-Prints on Reddit and 4chan

地址: http://arxiv.org/abs/2111.02455

作者: Satrio Baskoro Yudhoatmojo, Emiliano De Cristofaro, Jeremy Blackburn

摘要: 科学知识的传播和范围以惊人的速度扩大。在这种情况下,电子打印服务器发挥了核心作用,为科学家提供了一种快速开放的研究传播机制,而无需等待(冗长的)同行评审过程。在以多种方式帮助科学界的同时,电子打印服务器还为科学传播者和公众提供了获取丰富知识的途径,而无需支付高昂的订阅费。可以说,电子打印服务器的价值从未像 COVID-19 大流行期间那样明显,无论好坏。这促使我们研究电子打印服务器如何在更大的网络中定位,以及它们如何在网络社区中“使用”。使用来自 Reddit(2005-2021)和 4chan 的政治不正确委员会(2016–2021)的数据,我们发现了一组令人惊讶的多样化社区讨论电子印刷论文。我们发现现实世界的事件和不同的因素会影响人们谈论的电子印刷品。例如,在大流行的第一阶段,与 COVID-19 相关研究的激增相对应,对电子印刷品的讨论突然增加。我们发现围绕电子印刷品及其实际内容的对话存在重大差异;事实上,电子印刷品经常被用来传播阴谋论和/或极端主义意识形态。总体而言,我们的工作进一步强调了快速有效地验证获得大量新闻/社交媒体报道的非同行评审电子印刷品的必要性,并减少对科学成果的错误解释。

美国两次总统选举之间的两极分化和 Twitter 新闻影响者的转变

原文标题: Shifting Polarization and Twitter News Influencers between two U.S. Presidential Elections

地址: http://arxiv.org/abs/2111.02505

作者: James Flamino, Alessandro Galezzi, Stuart Feldman, Michael W. Macy, Brendan Cross, Zhenkun Zhou, Matteo Serafino, Alexandre Bovet, Hernan A. Makse, Boleslaw K. Szymanski

摘要: 社交媒体是分散的、互动的和变革性的,使用户能够生产和传播信息以影响他人。这改变了以前由传统企业新闻媒体主导的政治传播动态。在 2016 年和 2020 年美国总统大选期间收集了数亿条推文,这为我们提供了一个独特的机会来衡量两极分化的变化和政治信息的传播。我们分析了 Twitter 用户之间政治信息的传播,并调查了这些选举之间两极分化的变化以及这种变化如何影响影响者及其转发者的构成和两极分化。我们通过传播信息的能力来识别“影响者”,并将他们分类为隶属于媒体组织、政治组织或非附属组织的人。在两次选举期间,大多数最有影响力的人都隶属于媒体组织。我们发现,从 2016 年到 2020 年,有影响力的人和受他们影响的人之间的两极分化明显增加。此外,2020 年 75% 的顶级影响者在 2016 年没有出现,这表明这种地位很难保持。 2016 年至 2020 年间,10% 的媒体影响者被附属于政治组织和非附属影响者的中心或右翼影响者所取代。

识别党派选区的指标比较

原文标题: A Comparison of Metrics for the Identification of Partisan Gerrymandering

地址: http://arxiv.org/abs/2111.02540

作者: Karthik Seetharaman

摘要: 只有 2% 的美国人认为选举是完全公平的,这主要是由于党派分裂。然而,目前没有有效的、标准化的方法来识别党派选区的存在。一种相对较新提出的识别方法是集成分析。这是通过生成一个大型的中立投票计划集合来完成的,然后通过使用数学度量将给定的投票计划与集合进行比较。在本文中,我们调查了用于此识别过程的七个最常见的数学指标。这些指标是效率差距、权重为 2 美元的加权效率差距、权重为 1 美元的相对效率差距、权重为 2 美元的相对效率差距、党派偏见、平均中值得分和下降,所有这些都是我们定义和讨论的。这是通过对每个指标对十次选举进行集成分析来完成的,以确定每个指标是否将每个选举确定为 gerrymandered。所有这十种选举都在文献中进行了研究,因此我们将文献中的结果与指标发现的结果与此处发现的结果进行比较,以评估指标的准确性。我们表明,虽然平均中值分数和党派偏见在所有七个指标中最适用,但它们也是最不准确的。其余五个指标之间没有检测到显著差异,因此我们的最终建议是使用效率差距或衰退的四个变体之一(如果适用),如果不是,则使用平均中值分数。党派偏见是所有测试指标中最不准确的。

在社交媒体上吸引政治上多元化的受众

原文标题: Engaging Politically Diverse Audiences on Social Media

地址: http://arxiv.org/abs/2111.02646

作者: Martin Saveski, Doug Beeferman, David McClure, Deb Roy

摘要: 我们研究了媒体机构用来在线宣传其内容的社交媒体帖子中如何反映政治两极分化。特别是,我们在三年多的时间里跟踪了多家媒体的 Twitter 帖子(566K 条推文),以及其他用户对这些推文的参与(1.04 亿转推),对推文文本与政治多样性之间的关系进行建模的观众。我们构建了一个工具来集成我们的模型,并帮助记者在模型预测的指导下制作能够吸引不同政治群体的推文。为了测试该工具对现实世界的影响,我们与 PBS 纪录片系列 Frontline 合作,并在 Twitter 上进行了一系列广告实验。我们发现,在十次实验中的七次中,我们模型选择的推文确实吸引了政治上更加多样化的受众,这说明了我们方法的有效性。

COVID-19 爆发的 Gompertz 增长是由超级传播者引起的

原文标题: The Gompertz Growth of COVID-19 Outbreaks is Caused by Super-Spreaders

地址: http://arxiv.org/abs/2111.02962

作者: Francesco Zonta, Andrea Scaiewicz, Michael Levitt

摘要: 在个别 SARS-CoV-2 爆发中,确诊病例和死亡人数遵循 Gompertz 增长函数,适用于不同规模的地点。这种对区域大小的依赖性的缺乏使我们假设病毒传播取决于社会互动网络的普遍特性。我们通过模拟病毒在不同拓扑网络上的传播来检验这一假设。我们的主要发现是,在早期爆发中观察到的 Gompertz 增长仅发生在无标度网络中,在该网络中,具有比平均数多得多的邻居的节点很常见。这些具有非常多邻居的节点在爆发早期就被感染,然后迅速传播感染。当这些节点不再具有传染性时,拥有最多邻居的其余节点将接管并继续传播感染。通过这种方式,传播速度在一开始是最快的,然后立即减慢。从几何上可以看出,流行病的“表面”,即与受感染节点接触的易感节点的数量,在流行病的早期以及较大的节点被感染后就开始迅速减少。在我们的模拟中,爆发的速度和影响取决于三个参数:每个节点的平均接触次数、被邻居感染的概率以及恢复的概率。减少未来疫情影响的智能干预需要关注这些关键参数,以最大限度地减少经济和社会附带损害。

疫情初期限制政策对 COVID-19 传播动态的影响

原文标题: Efficacy the of Confinement Policies on the COVID-19 Spread Dynamics in the Early Period of the Pandemic

地址: http://arxiv.org/abs/2111.03020

作者: Mehedi Hassan, Md Enamul Haque, Mehmet Engin Tozal

摘要: 在这项研究中,我们提出了一种基于时间序列数据的聚类方法,以捕捉大流行早期的 COVID-19 传播模式。我们分析了基于不同地理位置的不同国家的 COVID-19 早期和后期阶段的传播动态。此外,我们调查了限制政策及其对传播的影响。我们发现,在不同的国家实施相同的限制政策表现出不同的结果。具体而言,由于不愿遵守社会疏远措施,在人口稠密地区,封锁变得不那么有效。一些国家缺乏检测、接触者追踪和社会意识,阻碍了人们自我隔离和保持社交距离。生活条件不健康的大型劳改营也有助于在依赖外国劳动力的国家中进行高社区传播。对政府政策的不信任和假新闻在发达国家和欠发达国家都助长了传播。大型社交聚会在导致几乎所有地方的快速爆发方面发挥着至关重要的作用。虽然一些国家能够通过实施严格且广泛采用的隔离政策来控制传播,但另一些国家则借助社会疏远措施和严格的检测能力控制了传播。在大流行开始时及早迅速做出反应是遏制蔓延所必需的,但这并不总是足够的。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20211105/