Arxiv网络科学论文摘要12篇(2021-07-07)

2021年07月07日 · 4980 字 · 阅读时间约10分

不断发展的城市自行车网络;
无人问津：Topcoder 中工人聚类的实证评估;
网络生成模型上的信息访问平等;
“垃圾进，垃圾出”重温：机器学习应用论文如何报告人工标记的训练数据？;
协调网络的时间细微差别;
驾驶员异质性的表征及其在交通模拟中的集成;
社区检测的超球面几何：作为距离的模块化;
网络的引力模型：整合最大熵和计量经济学方法;
使用本地化 Twitter 活动进行赤潮影响评估;
伯努利随机图叠加中子图计数的正态和稳定近似;
协同保险可持续性和网络结构;
瑞典医院中患者和 MRSA 传播的联系网络建模;

不断发展的城市自行车网络

原文标题： Growing Urban Bicycle Networks

作者： Michael Szell, Sayat Mimar, Tyler Perlman, Gourab Ghoshal, Roberta Sinatra

摘要：骑自行车是解决不可持续的以汽车为中心的城市交通系统的一个有前途的解决方案。然而，普遍的自行车网络发展遵循缓慢和分段的过程，没有考虑交通网络的结构复杂性。在这里，我们系统地探讨了城市自行车网络发展的拓扑局限性。对于 62 个城市，我们研究了在城市街道网络上的任意一组点之间建立合成自行车网络的不同变化。我们发现最初投资回报会下降，直到达到临界阈值，这对可持续城市规划造成了根本性的影响：城市必须以正确的增长战略投资自行车网络，并坚持不懈地超过临界质量。我们还发现，在现有自行车网络发达的城市中，综合增长的网络有明显的重叠，这表明我们的模型反映了现实。从头开始发展网络使我们的方法成为具有最少数据要求的可持续城市自行车网络规划的普遍适用的起点。

无人问津：Topcoder 中工人聚类的实证评估

原文标题： Nobody of the Crowd: An Empirical Evaluation on Worker Clustering in Topcoder

地址： http://arxiv.org/abs/2107.02221

作者： Razieh Saremi, Hamid Shamszare, Marzieh Lotfalian Saremi, Ye Yang

摘要：背景：软件众包平台通常采用评级或排名系统等外在奖励来激励员工。这样的评级系统是嘈杂的，并且只能提供关于工人偏好和表现的有限知识。目标：本研究的目的是对软件众包平台中工人行为的模式和影响进行实证研究，以提高软件众包的成功率和效率。方法：首先，我们基于任务的共同注册创建活跃工人的二分网络。然后，我们使用 Clauset-Newman-Moore 图聚类算法来识别网络中的开发者集群。最后，我们进行了实证评估，通过工人排名来衡量和分析平台中每个已识别集群的工人行为。更具体地说，基于工人可靠性、工人可信度和工人成功来分析工人的行为，作为衡量工人绩效、工人效率和工人弹性的措施来代表工人的偏好，以及工人竞争、工人信心和工人欺骗性以理解工人的策略。实证研究是对 topcoder 一年多的真实世界数据进行的，topcoder 是领先的软件众包平台之一。结果：我们确定了四个活跃工人集群：混合排名、高级、中级和低级。根据统计分析，本研究只能支持低等级组与平均可信度最高的员工相关联，平均可信度为 25%，而混合排名组包含最值得信赖的员工，平均可信度为 16%。结论：这些发现有助于任务请求者理解平台中未知资源之间的偏好和关系，并在软件众包平台中以更有效和高效的方式规划任务成功。

网络生成模型上的信息访问平等

原文标题： Information Access Equality on Network Generative Models

地址： http://arxiv.org/abs/2107.02263

作者： Xindi Wang, Onur Varol, Tina Eliassi-Rad

摘要：众所周知，由优先依附和同质性等常见机制生成的网络会限制少数群体与多数群体建立联系的能力，从而使少数群体处于不利地位。这具有限制少数节点访问信息的效果。在本文中，我们展示了具有不同增长机制和传播过程的网络模型中信息访问平等的实证研究结果。对于增长机制，我们关注多数/少数二分法、同质性、优先依附和多样性。对于传播过程，我们调查了简单与复杂的传染病、群体内部和群体之间的不同传播率以及各种播种条件。我们观察到两种现象。首先，信息访问平等是网络结构和传播过程之间复杂的相互作用。其次，在某些情况下（例如，当组间边较低且信息传输不对称时）在信息访问的平等性和效率之间存在权衡。我们的发现可用于为社会网络的机械设计提出建议。

“垃圾进，垃圾出”重温：机器学习应用论文如何报告人工标记的训练数据？

原文标题： “Garbage In, Garbage Out” Revisited: What Do Machine Learning Application Papers Report About Human-Labeled Training Data?

地址： http://arxiv.org/abs/2107.02278

作者： R. Stuart Geiger, Dominique Cope, Jamie Ip, Marsha Lotosh, Aayush Shah, Jenny Weng, Rebekah Tang

摘要：有监督的机器学习，其中模型是从标记的训练数据中自动派生出来的，它的好坏取决于该数据的质量。这项研究建立在先前的工作基础上，该工作调查了在单一领域（社交媒体平台）内的应用 ML 出版物中遵循标签训练数据的“最佳实践”的程度。在本文中，我们通过研究在更广泛的学科中应用监督 ML 的出版物进行扩展，重点是人类标记的数据。我们报告了跨学科的 ML 应用论文的随机样本在多大程度上提供了有关是否遵循最佳实践的具体细节，同时承认更大范围的应用领域必然会产生更大的标签和注释方法的多样性。由于大部分机器学习研究和教育只关注在训练数据的“基本事实”或“黄金标准”可用后所做的工作，因此围绕此类数据是否可靠这一同样重要的方面来讨论问题尤为重要首先。当应用于各种专业领域时，这种确定变得越来越复杂，因为标签可以从需要很少或不需要背景知识的任务到必须由具有职业专业知识的人来执行。

协调网络的时间细微差别

原文标题： Temporal Nuances of Coordination Networks

地址： http://arxiv.org/abs/2107.02588

作者： Derek Weber, Lucia Falzon

摘要：当前用于检测社交媒体上协调的不真实行为的基于网络的方法主要侧重于根据“行为痕迹”[1] 推断帐户之间的链接，例如转发相同的推文或发布相同的 URL。假设协调的目标是放大，即在受限时间内增强消息，大多数方法使用时间窗口来确保协同活动发生在特定时间范围内 [1]-[4]。这些方法都可以利用协调活动的时间元素。我们描述了关于协调网络语义、协调网络构建、三个政治 Twitter 数据集中的相关观察以及“啦啦队”在寻找社交机器人方面的作用的初步研究。有关代码和数据，请参阅 https://github.com/weberdc/find_hccs。

驾驶员异质性的表征及其在交通模拟中的集成

原文标题： Characterization of drivers heterogeneity and its integration within traffic simulation

地址： http://arxiv.org/abs/2107.02618

作者： Aikaterini Anesiadou, Michail Makridis, Konstantinos Mattas, Georgios Fontaras, Biagio Ciuffo

摘要：驾驶员的异质性和广泛的车辆特性被认为是造成道路交通动态中观察到的随机性的主要原因。评估驾驶风格的差异并将个体驾驶行为纳入微观模拟最近引起了极大的关注。第一个主题在文献中得到了广泛的研究。相反，第二个问题仍然是一个悬而未决的问题。本研究提出了一种方法来表征自由流动状态下的驾驶风格，并将驾驶员的异质性纳入微观模拟框架。该方法使用车辆动力系统的显式和简化建模来将驾驶员行为与车辆特性分开。结果表明，驱动程序内部和内部的异质性可以通过设计良好的指标的对数正态分布来刻画。驱动程序分为三个不同的组（动态、普通和胆小驱动程序）。

社区检测的超球面几何：作为距离的模块化

原文标题： The Hyperspherical Geometry of Community Detection: Modularity as a Distance

地址： http://arxiv.org/abs/2107.02645

作者： Martijn Gösgens, Remco van der Hofstad, Nelly Litvak

摘要： Louvain算法是目前最流行的社区检测方法之一。该算法通过最大化称为模块化的数量来找到社区。在这项工作中，我们描述了聚类的度量空间，其中聚类由由顶点对索引的二进制向量描述。我们将此几何扩展到超球面，并证明最大化模块化等效于最小化聚类向量集上某个模块化向量的角距离。这种等价性允许我们将 Louvain 算法视为最近邻搜索，它近似地最小化到这个模块化向量的距离。通过用不同的向量替换这个模块化向量，可以获得许多替代的社区检测方法。我们探索这个更广泛的类，并将其与现有的基于模块化的方法进行比较。我们的实验表明，这些替代方案可能优于基于模块化的方法。例如，当社区与顶点邻域相比较大时，基于共同邻域数量的向量优于现有的社区检测方法。虽然目前工作的重点是网络中的社区检测，但所提出的方法可以应用于任何成对相似性数据可用的聚类问题。

网络的引力模型：整合最大熵和计量经济学方法

原文标题： Gravity models of networks: integrating maximum-entropy and econometric approaches

地址： http://arxiv.org/abs/2107.02650

作者： Marzio Di Vece, Diego Garlaschelli, Tiziano Squartini

摘要：世界贸易网 (WTW) 是世界各国之间的国际贸易关系网络。通过单个模型表征 WTW 的本地链接权重（观察到的交易量）和全球网络结构（大规模拓扑）仍然是一个悬而未决的问题。虽然传统的引力模型 (GM) 通过使用 GDP 和地理距离等宏观经济属性成功地复制了观察到的贸易量，但不幸的是，它预测了一个完全连接的网络，从而返回了一个完全不切实际的 WTW 拓扑。为了克服这个问题，计量经济学和统计物理学中引入了两种不同类别的模型。计量经济学方法将传统的 GM 解释为概率分布的预期值，可以任意选择并针对替代分布进行测试。统计物理学方法从一组选定的可测量结构约束和由不同约束产生的测试分布构建（加权）图的最大熵概率分布。在这里，我们通过考虑一类可以包含标准计量经济学模型中使用的宏观经济属性的最大熵模型来比较和整合这两种方法。我们发现综合方法比纯粹的计量经济学方法取得了更好的表现。这些结果表明，通过结合拓扑约束和二元宏观经济变量，最大熵构造可以作为一个可行的计量经济学框架，其中可以分别控制粗放边际和集约边际。

使用本地化 Twitter 活动进行赤潮影响评估

原文标题： Using Localized Twitter Activity for Red Tide Impact Assessment

地址： http://arxiv.org/abs/2107.02677

作者： A. Skripnikov (1), N. Wagner (1), J. Shafer (2), M. Beck (3), E. Sherwood (3), M. Burke (3) ((1) New College of Florida, (2) Science and Environment Council of Southwest Florida, (3) Tampa Bay Estuary Program)

摘要：短鞭毛藻 (K. brevis) 的赤潮爆发会产生有毒的沿海条件，会影响海洋生物和人类健康，同时也会影响当地经济。在 2017-2019 年佛罗里达州极端赤潮事件期间，居民和游客转向社交媒体平台来接收与灾害相关的信息并交流他们自己的情感和经历。这是自社交媒体广泛使用以来的第一次重大赤潮事件，从而提供了独特的关于赤潮影响的众包报告。我们评估了 Twitter 上赤潮话题活动的空间和时间准确性，将推文情绪和用户类型（例如媒体、公民）考虑在内，并将推文活动与报告的赤潮条件（如 K. brevis 细胞计数、当地海滩上的死鱼和呼吸道刺激。分析在地点（例如，整个墨西哥湾沿岸、县级、市级、邮政编码列表区域）和时间频率（例如每天、每三天、每周）的多个层面上进行，导致了很强的相关性当地人均 Twitter 活动与该地区观察到的实际赤潮状况之间的差异。此外，还观察到与受影响沿海地区的接近程度与相关推文的人均数量之间存在关联。结果表明，Twitter 是红潮随时间推移对当地影响和发展的可靠代表，它有可能被用作更有效的评估和更协调的实时灾害响应的工具之一。

伯努利随机图叠加中子图计数的正态和稳定近似

原文标题： Normal and stable approximation to subgraph counts in superpositions of Bernoulli random graphs

地址： http://arxiv.org/abs/2107.02683

作者： Mindaugas Bloznelis, Joona Karjalainen, Lasse Leskelä

摘要：复杂网络的聚类特性表明稀疏网络中小密集子图的丰度。我们建立了网络模型中小集团、循环和更一般的 2-connected subgraphs 数量的正常和稳定近似值，该模型由 Bernoulli 随机图的叠加定义，该图允许非零全局聚类系数和幂律度。

协同保险可持续性和网络结构

原文标题： Collaborative Insurance Sustainability and Network Structure

地址： http://arxiv.org/abs/2107.02764

作者： Arthur Charpentier, Lariosse Kouakou, Matthias Löwe, Philipp Ratz, Franck Vermet

摘要：随着互联网的出现，点对点 (P2P) 经济一直在增长，优步或爱彼迎等知名品牌就是其中的例子。在保险领域，这种方法仍处于起步阶段，但一些公司已经开始探索基于 P2P 的协作保险产品（例如美国的 Lemonade 或法国的 Inspeer）。精算文献直到最近才开始考虑这些风险分担机制，如 Denuit 和 Robert (2021) 或 Feng 等人所述。 (2021)。在本文中，描述和分析了这样一个 P2P 产品，具有一些互惠的风险分担合同。在这里，我们考虑保单持有人仍然有保险合同，但自付额以下的第一层自我保险可以与朋友分享的情况。我们研究了网络形状（通过度数分布）对风险降低的影响。我们还考虑了互惠承诺的一些最佳设置，并讨论了与朋友的朋友的合同的引入，以减轻人们没有足够的联系来交换风险的一些可能的缺点。

瑞典医院中患者和 MRSA 传播的联系网络建模

原文标题： Modeling contact networks of patients and MRSA spread in Swedish hospitals

地址： http://arxiv.org/abs/1611.06784

作者： Luis E C Rocha, Vikramjit Singh, Markus Esch, Tom Lenaerts, Mikael Stenhem, Fredrik Liljeros, Anna Thorson

摘要：耐甲氧西林金黄色葡萄球菌 (MRSA) 是一种难以治疗的感染，仅在欧盟影响约 150,000 名患者，每年给医疗保健系统造成 3.8 亿欧元的额外成本。已采取越来越多的努力来减轻流行病并避免在低流行环境中潜在的爆发。通过建模理解 MRSA 的种群动态对于确定驱动流行病的因果机制并将结论概括为不同的背景至关重要。我们开发了一种创新的患者之间相互作用的高分辨率时空接触网络模型，以在瑞典斯德哥尔摩县的背景下重现医院人口，并模拟 MRSA 在该人群中的传播。我们的模型捕捉了由人类行为以及病房和医院内的流动动态引起的空间和时间异质性。我们估计，在该人群中，流行阈值约为 0.008。我们还发现，这些异质接触模式导致了超级传播者患者的出现和流行曲线的多项式增长。我们最终研究了标准干预控制策略的效果，并确定筛查比改善卫生更有效，以引起较小或无效的爆发。

声明：Arxiv文章摘要版权归论文原作者所有，机器翻译后由本人进行校正整理，未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”（微信号netsci）和个人博客 https://netsci.complexly.cn （提供RSS订阅）进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者：ComplexLY
微信公众号：netsci
欢迎扫描左侧微信公众号二维码进行交流！
本文地址：https://netsci.complexly.cn/post/20210707/

网络科学研究速递