- 病毒变异的流行病学理论;
- 基于双向推测和双层关联的位置预测;
- 贪婪出版对学术界的干扰;
- 揭示通勤网络中的结构多样性:全局和局部熵;
- 按需拼车系统的规模分析以及与公共交通的比较;
- 科学的第三次转变:超越牛顿和量子力学——涌现的统计力学;
- 美国致命警察枪击案分析与预测;
- 细胞是行动者:使用经典机器学习进行 SOTA 组织学图像分类的社会网络分析;
- 用于基于行人尺度网络的城市分析的Python包cityseer;
- 估计订阅服务中内容发布的增量获取;
- 检测易手在线审查帐户;
- COVID-19 推文的文本挖掘和情感分析;
- 解开城市数据特征:用于在行人尺度上检测城市原型的无监督机器学习方法;
- 通过将领域专业知识与机器学习方法相结合,在行人尺度上预测“人工”城市原型;
- 通过Mastodon的视角理解Fediverse的成长;
- 日常地理学的交叉方法;
- GraphAnoGAN:从属性图中检测异常快照;
- 什么是意识?人工智能、真实智能、量子思维和品质;
- 评估能源系统分析的现状和未来挑战的专家调查;
- 反堕胎法令和出生分布扰动的时间滞后证据。本福德定律方法;
- 创新过程中的阻尼效应:来自 Twitter 的案例研究;
- 当标准网络指标无法对期刊进行排名时:理论和实证分析;
- BOTTER:分析 Twitter 中社交机器人的框架;
病毒变异的流行病学理论
原文标题: Epidemiological theory of virus variants
地址: http://arxiv.org/abs/2106.14982
作者: Giacomo Cacciapaglia, Corentin Cot, Adele de Hoffer, Stefan Hohenegger, Francesco Sannino, Shahram Vatani
摘要: 我们提出了一种基于竞争病毒变体时间演化的物理理论,该理论依赖于(准)固定点的存在,以捕捉动态的大时间尺度不变性。为了激发我们的结果,我们首先修改历史悠久的 SIR 类型的隔室模型,以解释竞争变体的存在,然后展示如何根据以准固定点结尾的流动方程自然地重新表述它们的演变。作为自然的下一步,我们采用(近)尺度不变性在流行病重整化组框架的有效描述内组织竞争变体的时间演变。我们根据 COVID-19 病毒变体的时间演变来测试由此产生的理论,从而从经验上验证了该理论。
基于双向推测和双层关联的位置预测
原文标题: Location Prediction via Bi-direction Speculation and Dual-level Association
地址: http://arxiv.org/abs/2106.15070
作者: Xixi Li1, Ruimin Hu, Zheng Wang, Toshihiko Yamasaki
摘要: 位置预测在基于位置的应用中对于智慧城市建设具有重要意义。据我们所知,现有的位置预测模型从人的角度关注用户对 POI 的偏好。然而,从历史轨迹建模用户的兴趣仍然受到数据稀疏性的限制。此外,大多数现有方法独立地根据个人数据预测下一个位置,但数据稀疏性使得难以挖掘明确的移动模式或刻画每个用户的随意行为。为理解决上述问题,我们提出了一种新颖的双向推测和双层关联方法(BSDA),它同时考虑了用户对 POI 的兴趣和 POI 对用户的吸引力。此外,我们开发了跨用户和跨 POI 关联,以减轻相似用户和 POI 的数据稀疏性,从而丰富候选者。在两个公共数据集上的实验结果表明,BSDA 比最先进的方法取得了显著的改进。
贪婪出版对学术界的干扰
原文标题: Disturbance of greedy publishing to academia
地址: http://arxiv.org/abs/2106.15166
作者: Taekho You, Jinseo Park, June Young Lee, Jinhyuk Yun, Woo-Sung Jung
摘要: 有问题的出版物因其贪婪的行为而受到批评,但尚未对它们对学术界的影响进行定量调查。在这里,我们通过对学术界的各种参与者进行系统和全面的分析来探讨有问题的出版物的影响,并使用数十亿条引文记录与他们最相似的未经质疑的同行进行比较:经纪人,例如期刊和出版商,以及产消者,例如作者。我们的分析表明,有问题的出版商通过对其期刊的出版商级自引来装饰其引文得分,同时他们控制期刊级自引以逃避期刊索引服务的评估;因此,很难通过传统的期刊级别指标来检测,而我们的新指标可以刻画。我们还表明,可疑出版物的新颖性和影响力都低于其同行,这意味着可疑出版物在学术生态系统中的负面影响,这为未来的政策制定提供了宝贵的基础。
揭示通勤网络中的结构多样性:全局和局部熵
原文标题: Uncovering structural diversity in commuting networks. Global and local entropy
地址: http://arxiv.org/abs/2106.15172
作者: Valentina Marin, Carlos Molinero, Elsa Arcaute
摘要: 在本文中,我们重新审视了流动熵的概念。随着时间的推移,城市中心之间的空间交互结构趋于变得更加复杂,并从集中模式演变为更加分散的起源和目的地模式。熵度量可用于探索这种复杂性,并量化不同尺度和整个系统的流入和流出的结构多样性程度。我们使用通勤网络的玩具模型来检查全局和本地度量,允许在系统的不同部分之间进行比较。我们表明,链接和节点级别的熵对系统的特征给出了不同的见解,使我们能够识别系统不同部分之间和内部的就业中心和相互依存关系。我们讨论如何将这些用于为面向权力下放和弹性的规划和政策决策提供信息。
按需拼车系统的规模分析以及与公共交通的比较
原文标题: Scale analysis for on-demand ridepooling systems and comparison with public transport
地址: http://arxiv.org/abs/2106.15270
作者: Andres Fielbaum, Alejandro Tirachini, Javier Alonso-Mora
摘要: 如果按需拼车 (ODRP) 吸引的是私家车用户而不是公共交通,它可以成为减少拥堵和排放的有力替代方案。因此,确定决定 ODRP 系统何时可以有效运行的战略现象,并理解何时可以将它们集成到公共交通网络中是至关重要的。在本文中,我们分析了在一条公共交通线路覆盖的区域内运行的 ODRP 系统的性能。低容量车辆的车队内生地适应了需求。考虑到用户和运营商的成本,我们确定了规模经济的两个来源:当需求增长时,平均成本会因莫林效应(存在于公共交通中)而降低,以及由于匹配用户当它们被分配到车辆时,更兼容的组,我们称之为更好的匹配效果。当车辆负载增加并且用户面临更长的弯路时,会观察到一种平衡力,称为 Flex-route 效应。我们找到了一个特定的需求范围,在这个范围内,最后一个效应支配了其他效应,当只考虑用户成本时,就会造成规模不经济。在基于固定路线的公共交通系统中没有观察到这种现象。然而,在考虑用户和运营商的成本时,规模经济占优势。我们将 ODRP 结果与公共交通进行了比较,对于具有同质需求的支线和环形线路。我们表明,当用户共享一个共同的目的地(馈线)并且需求低时,ODRP 更具竞争力,尽管规模效应表明 ODRP 也可以在需求高时发挥作用。如果 ODRP 必须满足所有请求,那么放宽上门车辆要求以允许短距离步行对于 ODRP 成为人工驾驶和自动车辆的可行替代方案至关重要。
科学的第三次转变:超越牛顿和量子力学——涌现的统计力学
原文标题: The Third Transition in Science: Beyond Newton and Quantum Mechanics – A Statistical Mechanics of Emergence
地址: http://arxiv.org/abs/2106.15271
作者: Stuart A. Kauffman, Andrea Roli
摘要: 自牛顿以来,所有经典物理学和量子物理学都依赖于“牛顿范式”。在此确定系统的相关变量。例如,我们确定经典粒子的位置和动量。建立了连接变量的微分形式的运动定律。一个例子是牛顿的三大运动定律和万有引力定律。定义了创建变量所有可能值的相空间的边界条件。然后,给定任何初始条件,对运动的微分方程进行积分以在预先规定的相空间中产生一个必然轨迹。所有这些都不适合我们或任何生物圈的历时演化。不断发展的生物圈完全在牛顿范式之外。也许令人惊讶的是,我们不能使用基于集合论的数学。结果是,对于像我们这样拥有一个或多个演化生物圈的宇宙,不可能有最终的理论。影响是巨大的。我们面临着超越毕达哥拉斯梦想“一切都是数字”的第三次重大科学转变。面对这种情况,我们必须放弃对生物圈历时演化的推论。然而,所有物理学,经典物理学和量子物理学,都适用于对现有生命的分析,一种共时分析。但还有更多。我们正处于发明一种类似物理学的新统计出现机制的边。
美国致命警察枪击案分析与预测
原文标题: US Fatal Police Shooting Analysis and Prediction
地址: http://arxiv.org/abs/2106.15298
作者: Yuan Wang, Yangxin Fan
摘要: 我们相信“人人生而平等”。随着媒体报道的警察枪击事件增多,美国越来越多的人认为警察在执法过程中过度使用武力,尤其是针对特定人群。我们希望应用多维统计分析来揭示比单调主流媒体更多的事实。我们的论文分为三个部分。首先,我们提出了一种新方法来量化主流媒体(包括 CNN、FOX、ABC 和 NBC)的致命警察枪击新闻报道偏差。其次,我们分析了来自《华盛顿邮报》的最全面的美国致命警察枪击数据集。我们使用 FP-growth 来揭示频繁模式和 DBSCAN 聚类来寻找致命的射击热点。我们带来了多属性(社会经济、人口统计、政治倾向、教育、枪支拥有率、警察培训时间等)来揭示冰山下的联系。我们发现一个州的警察开枪率取决于许多变量。前四个最相关的属性是州加入年份、州土地面积、枪支拥有率和暴力犯罪率。第三,我们提出了四种回归模型来预测州一级的警察射击率。最好的模型 Kstar 可以预测致命的警察射击率,相关系数约为 88.53%。我们还提出了分类模型,包括梯度提升机、多类分类器、逻辑回归和朴素贝叶斯分类器,以预测致命的警察射击受害者的种族。我们的分类模型没有显示出明显的证据表明种族歧视发生在 WP 数据集记录的致命警察枪击事件中。
细胞是行动者:使用经典机器学习进行 SOTA 组织学图像分类的社会网络分析
原文标题: Cells are Actors: Social Network Analysis with Classical ML for SOTA Histology Image Classification
地址: http://arxiv.org/abs/2106.15299
作者: Neda Zamanitajeddin, Mostafa Jahanifar, Nasir Rajpoot
摘要: 组织学图像的数字化和新计算方法(如深度学习)的出现,有助于结直肠腺癌 (CRA) 的自动分级。然而,目前的自动 CRA 分级方法通常使用微小的图像块,因此无法整合整个组织微结构以进行分级。为了应对这些挑战,我们建议使用统计网络分析方法通过将细胞核及其连接建模为网络来描述组织微环境的复杂结构。我们表明,通过仅分析网络中单元格之间的相互作用,我们可以为 CRA 分级提取具有高度辨别力的统计特征。与其他深度学习或基于卷积图的方法不同,我们的方法具有高度可扩展性(可用于由数百万个节点组成的细胞网络)、完全可解释且计算成本低。我们在广泛的 CRC 组织学图像数据集上创建细胞网络,试验我们的方法,并报告预测三级 CRA 分级的最先进性能。
用于基于行人尺度网络的城市分析的Python包cityseer
原文标题: The cityseer Python package for pedestrian-scale network-based urban analysis
地址: http://arxiv.org/abs/2106.15314
作者: Gareth D. Simons
摘要: cityseer-api 是一个 Python 包,由用于细粒度街道网络和土地利用分析的计算工具组成,有助于评估充满活力的社区的形态前兆。它以基于网络的方法为基础,从头开始开发,用于行人规模的本地化城市分析,为任何给定的街道位置提供上下文特定的指标。 cityseer-api 计算各种基于节点或段的网络中心性方法、土地使用可达性和混合使用措施以及统计聚合。聚合是动态计算的——直接在街道网络上计算,同时考虑到方法的方向——并且可以选择性地结合空间阻抗和网络分解来强调空间精度。 Python 的使用促进了与用于网络操作 (NetworkX)、地理空间拓扑(匀称)和科学包的 numpy 堆栈的流行计算工具的兼容性。图清理工具的提供有助于合并开放街道地图派生的网络拓扑。底层循环密集型算法在 Numba JIT 编译代码中实现,因此这些方法可以有效地扩展到更大的网络。在线文档可从 https://cityseer.benchmarkurbanism.com 获取,Github 存储库可从 https://github.com/benchmark-urbanism/cityseer-api 获取。
估计订阅服务中内容发布的增量获取
原文标题: Estimating Incremental Acquisition of Content Launches in a Subscription Service
地址: http://arxiv.org/abs/2106.15346
作者: Hamidreza Badri, Alex Kaufman
摘要: 在估计内容发布对获取的因果影响时,订阅服务面临一个难题。客户购买订阅,而不是单个内容,一旦订阅,除了吸引他们使用服务的内容之外,他们还可能消费许多内容。在本文中,我们提出了一种可扩展的方法来估计随机实验不可行时订阅业务模型中内容发布的增量获取影响。我们的方法使用简单的假设将问题转化为等价的问题:由于内容发布而未加入的新订户的预期消费率是多少?我们使用刚发布前加入的新订户的消费率来估计这个反事实比率,同时对与订户属性、产品内体验和季节性相关的变化进行调整。然后,我们将我们的反事实消费与实际费率进行比较,以得出收购估算。我们的方法提供了内容/天/区域粒度的顶线影响估计。此外,为了启用订阅者级别的归因,我们提出了一种算法,该算法分配特定的个人帐户以加起来作为顶线估算。订阅者级别的归因是通过解决优化问题来推导出来的,以最小化归因于多条内容的订阅者数量,同时最大化归因于每条内容的订阅者的平均递增倾向。最后,在缺乏明确的基本事实的情况下,我们提出了几种验证方法,可用于评估这些方法产生的影响估计的合理性。
检测易手在线审查帐户
原文标题: Detecting Changed-Hands Online Review Accounts
地址: http://arxiv.org/abs/2106.15352
作者: Geli Fei, Shuai Wang, Bing Liu, Leman Akoglu
摘要: 信誉良好的社交媒体或评论帐户可以很好地掩盖垃圾邮件活动。垃圾邮件发送者在 Web 上公开购买/出售此类帐户已变得普遍。我们将这些卖出/买入账户称为易手 (CH) 账户。它们很难被现有的垃圾邮件检测算法检测到,因为它们的垃圾邮件活动是在干净的历史记录下进行的。在本文中,我们首先提出了检测 CH 账户的问题,然后设计了一种有效的检测算法,该算法利用了个人账户内容和写作风格的变化,并提出了一种新的特征选择方法,该方法在每个账户的细粒度级别上工作。个人账户。所提出的方法不仅可以确定帐户是否已易手,还可以确定更改点。在线评论帐户的实验结果证明了我们方法的高效性。
COVID-19 推文的文本挖掘和情感分析
原文标题: Text mining and sentiment analysis of COVID-19 tweets
地址: http://arxiv.org/abs/2106.15354
作者: Qihuang Zhang, Grace Y. Yi, Li-Pang Chen, Wenqing He
摘要: 导致 COVID-19 疾病的人类严重急性呼吸系统综合症冠状病毒 2 (SARS-Cov-2) 继续在世界各地传播。它不仅对公共卫生和全球经济造成威胁,还对心理健康和情绪产生威胁。尽管 COVID-19 大流行的影响已得到广泛研究,但关于民众情绪反应的讨论却相对较少。在本文中,我们在微博平台 Twitter 上抓取了与 COVID-19 相关的推文,并检查了 2020 年 2 月~24 日至 2020 年 10 月~14 日在加拿大四个城市(多伦多、蒙特利尔、温哥华和卡尔加里)和四个城市的推文。美国城市(纽约、洛杉矶、芝加哥和西雅图)。应用 Vader 和 NRC 方法,我们评估情绪强度分数并可视化大流行不同时期的信息。计算了有关口罩、疫苗和封锁这三种抗疫措施的推文的情绪评分以进行比较。将加拿大四个城市的结果与美国四个城市的结果进行比较。我们通过将回声状态网络方法与收敛交叉映射相结合,研究了感染病例、推文活动和 COVID-19 相关推文的情绪分数之间的因果关系。我们的分析表明,公众对 COVID-19 的看法在不同的时间段和地点有所不同。一般来说,人们对 COVID-19 和口罩持积极态度,但对疫苗和封锁等话题持消极态度。因果推断表明,情绪会影响人们在 Twitter 上的活动,这也与每日感染人数相关。
解开城市数据特征:用于在行人尺度上检测城市原型的无监督机器学习方法
原文标题: Untangling urban data signatures: unsupervised machine learning methods for the detection of urban archetypes at the pedestrian scale
地址: http://arxiv.org/abs/2106.15363
作者: Gareth D. Simons
摘要: 以高分辨率分析应用的城市形态测量可能会产生大量数据,在相当程度上详细描述城市环境的各种特征;然而,这些形式的高维数据集与植根于传统城市主义概念的更广泛的结构并不直接相关。数据科学和机器学习方法提供了通过应用无监督机器学习方法探索此类数据形式的机会。从而可以减少数据的维度,同时恢复潜在主题并识别可能更普遍地与都市主义话语产生共鸣的特征模式。讨论和演示了降维和聚类方法,包括主成分分析 (PCA)、变分自动编码器和基于自动编码器的高斯混合模型,以“解开”城市数据集,揭示连接城市化定量和定性描述的主题。这些方法应用于大伦敦的形态数据集。空间聚合和形态测量是使用 cityseer-api Python 包在 20m 网络分辨率下以行人步行容差计算的,该包利用本地窗口方法,直接通过网络计算距离,并动态执行聚合并相对于方向方法,从而保留变量之间的关系并保持上下文精确度。尽管所展示的方法具有巨大的潜力,但使用传统的低维可视化方法很难传达或充分利用它们的力量,因此强调需要对这些方法如何与交互式可视化方法结合进行后续研究,以进一步阐明数据及其潜在影响。
通过将领域专业知识与机器学习方法相结合,在行人尺度上预测“人工”城市原型
原文标题: Prediction of ‘artificial’ urban archetypes at the pedestrian-scale through a synthesis of domain expertise with machine learning methods
地址: http://arxiv.org/abs/2106.15364
作者: Gareth D. Simons
摘要: 以汽车为中心的城市发展形式的普遍采用,其特点是密度较低、街道网络为行人提供较差的连通性以及缺乏可利用的土地用途,城市空间的活力一直在稳步削弱;然而,即使这些问题已经明确界定了一段时间,问题仍然存在于新的规划形式中。这里假设领域知识和机器学习方法的综合允许创建强大的工具集,可以以更严格的方式对新提出的开发进行基准测试,以实现更大的问责制和更明确的决策。一个工作示例开发了一系列机器学习模型,通常能够将“人造”城镇与更适合步行和混合使用的“历史”等价物区分开来。该数据集是根据针对英国 931 个城镇的 20m 网络分辨率计算的行人步行容差的形态学测量而开发的。它是使用 cityseer-api Python 包计算的,该包保留上下文精度并保留任何给定分析点的变量之间的关系。以官方指定的“新城镇”为出发点,开发了一系列线索。首先,基于通过迭代反馈过程聚合到各个城镇或城市边界的数据,培养了一个监督分类器(Extra-Trees),从中识别出 185 个“人工”位置。然后,该信息用于针对全分辨率数据集训练监督和半监督 (M2) 深度神经网络分类器,其中仅使用每个分析点可用的行人尺度信息以 20m 的网络分辨率评估位置。这些模型与城市规划者表达的直觉大体一致,并显示出持续发展的强大潜力。
通过Mastodon的视角理解Fediverse的成长
原文标题: Understanding the growth of the Fediverse through the lens of Mastodon
地址: http://arxiv.org/abs/2106.15473
作者: Lucio La Cava, Sergio Greco, Andrea Tagarelli
摘要: 开源、分散的在线社会网络 (DOSN) 正在成为 Facebook 或 Twitter 等流行但集中且以利润为导向的平台的替代品。在 DOSN 中,用户可以设置自己的服务器或实例,而他们实际上可以与其他实例的用户进行交互。此外,通过采用相同的通信协议,DOSN 成为大型社会网络的一部分,即 Fediverse。 Mastodon 是迄今为止 Fediverse 中最相关的平台,也是引起研究界关注的平台。然而,现有的研究仅限于对相对过时的乳齿象样本进行分析,重点关注用户层面的几个方面,而几个悬而未决的问题尚未得到解答,尤其是在实例层面。在这项工作中,我们旨在通过利用乳齿象在其中的主要作用来推动我们对 Fediverse 的理解。我们的第一个贡献是构建了最新且具有高度代表性的乳齿象数据集。根据这些新数据,我们在乳齿象实例上定义了一个网络模型,并利用它来研究三个主要方面:从宏观和细观角度研究乳齿象实例网络的结构特征,揭示底层的显著特征联邦机制;网络的骨干,发现实例之间的基本相互关系;以及 Mastodon 的增长,以理解实例网络的形状在过去几年中如何演变,以及扩大范围以考虑属于其他平台的实例。我们对上述方面的广泛分析提供了许多发现,这些发现揭示了乳齿象的显著特征,并且可以用作发现所有 DOSN Fediverse 的起点。
日常地理学的交叉方法
原文标题: Intersectional approach of everyday geography
地址: http://arxiv.org/abs/2106.15492
作者: Julie Vallée, Maxime Lenormand
摘要: 在新兴的日常隔离文献中,多重和普遍的排斥形式仍未得到充分研究,这些文献主要集中在单一城市焦点的单一社会维度上。通过汇总(385,000 名受访者和 1,711,000 次出行)并覆盖法国 60% 的人口流动性调查,我们从交叉的角度探讨了 2,572 个地区每小时人口分布的不匹配。尤其是在白天人口急剧增加或减少的地区,每小时的概况不仅结合了性别、年龄和教育亚组中最大的差异,而且在“占主导地位”(男性、中等年龄和受教育程度高的群体)高于“下属”亚群体(女性、老年人和受教育程度低的群体)。这些交叉的时空模式提供了经验钥匙,可以将排斥和隔离文献的范围扩大到同龄人能够联合起来的时间和地点。
GraphAnoGAN:从属性图中检测异常快照
原文标题: GraphAnoGAN: Detecting Anomalous Snapshots from Attributed Graphs
地址: http://arxiv.org/abs/2106.15504
作者: Siddharth Bhatia, Yiwei Wang, Bryan Hooi, Tanmoy Chakraborty
摘要: 从图表中寻找异常快照最近引起了极大的关注。现有的研究使用浅层学习机制来解决这个问题,例如子空间选择、自我网络或社区分析。这些模型没有考虑网络中结构和属性之间的多方面交互。在本文中,我们提出了 GraphAnoGAN,一种异常快照排名框架,它由两个核心组件组成——生成模型和判别模型。具体来说,生成模型学习从候选图快照集中近似异常样本的分布,判别模型检测采样快照是否来自地面实况。在 4 个真实世界网络上的实验表明,GraphAnoGAN 以显著的优势优于 6 个基线(与所有数据集平均的最佳基线相比,准确率和召回率分别高 28.29% 和 22.01%)。
什么是意识?人工智能、真实智能、量子思维和品质
原文标题: What Is Consciousness? Artificial Intelligence, Real Intelligence, Quantum Mind, And Qualia
地址: http://arxiv.org/abs/2106.15515
作者: Stuart A. Kauffman, Andrea Roli
摘要: 我们接近这个问题,“什么是意识?”以一种新的方式,不是笛卡尔的“系统性怀疑”,而是有机体如何在他们的世界中找到自己的方式。寻找自己的方式包括寻找可能有益的世界特征的可能用途或避免可能有害的特征。 “X 完成 Y 的可能用途”是“可供性”。 X 的使用次数是不确定的,不同的使用是无序的,并且不能相互推导出。所有的生物适应性要么是被可遗传变异和选择所抓住的可供性,要么是速度更快的生物体在其世界中寻找使用 X 来完成 Y 的用途。基于此,我们得出了相当惊人的结论:1)强人工智能是不可能的。通用图灵机无法“找到”新颖的可供性。 2)脑心不是纯粹的经典物理学,因为没有经典物理学系统可以是模拟计算机,其动力学行为可以同构为“可能的用途”。 3) 大脑思维必须部分是量子化的——6.0 西格玛到 7.3 西格玛的证据越来越多。 4)基于海森堡将量子状态解释为“潜在”通过测量转换为“实际”,一个自然的假设是心灵实现了潜在。 5.2 Sigma 支持此功能。然后心灵对纠缠的大脑-心灵-世界状态的实现被体验为感受质,并允许“看到”或“感知”X 的用途来完成 Y。我们可以并且做陪审团。电脑不行。 5) 除了熟悉的量子计算机,我们还考虑 Trans-Turing-Systems。
评估能源系统分析的现状和未来挑战的专家调查
原文标题: An expert survey to assess the current status and future challenges of energy system analysis
地址: http://arxiv.org/abs/2106.15518
作者: Fabian Scheller, Frauke Wiese, Jann Michael Weinand, Dominik Franjo Dominković, Russell McKenna
摘要: 计算机辅助能源系统分析 (ESA) 等决策支持系统被认为是制定可持续和可靠的能源转型战略的主要支柱之一。尽管当今多样化的工具已经可以在各种研究问题上为决策者提供支持,但仍需要进一步的发展。为了确定该领域的机遇和挑战,我们从广泛的文献综述中对建模能力 (32)、方法论 (15) 实施问题 (15) 和管理问题 (7) 进行分类。基于对主要从事模拟和优化模型工作的能源系统建模师 (N=61) 的定量专家调查,评估了这些建模主题的发展状况和实现的复杂性。虽然评级项目被认为比实际表示的更复杂,但没有可确定的显著异常值,这表明对 ESA 缺乏发展的特定方面没有达成共识。然而,根据专门定义的建模策略矩阵对项目进行分类,将土地利用规划模式、公平和分配效应以及内生技术学习等能力识别为需要增强的“唾手可得的果实”,以及大量复杂的已经很好实施的主题。关于建模能力的其余“顽固分子”包括非能源部门和社会行为交互效应。一般来说,优化模型和仿真模型在各自的优势上有所不同,证明两者都存在是合理的。虽然方法通常被评为相当发达,但组合优化方法以及机器学习被确定为 ESA 需要进一步开发的重要研究方法。
反堕胎法令和出生分布扰动的时间滞后证据。本福德定律方法
原文标题: Time Lag Evidence of Anti-Abortion Decree and Perturbation of Births Distribution. A Benford Law Approach
地址: http://arxiv.org/abs/2106.15520
作者: Bogdan-Vasile Ileanu
摘要: 本研究分析了 1958 年至 2019 年在重大干扰因素的潜在影响下,按母亲和父亲年龄组共同分布的罗马尼亚出生案例。分析了反堕胎法的应用或废除、共产主义垮台和移民等重大事件及其影响。虽然在实践中我们可能会发现赞成和反对的例子,但关于出生是否应该遵守本福德定律 (BL) 存在普遍争议。此外,此类分析并未详细讨论重大干扰因素的影响。我发现出生分布在整个样本上符合第一位本福德定律 (BL1),但在动态分析和主要子时期中关于 BL 服从的结果喜忧参半。尽管分析了许多破坏因素,但只有 1967 年的反堕胎法令具有重大影响。我捕捉到事件、反堕胎法令和出生分布开始扭曲之间的平均 15 年滞后。这种扭曲持续了大约 25 年,几乎是 1967-1968 年出生的大多数人的整个生育期(15 到 39 岁)。
创新过程中的阻尼效应:来自 Twitter 的案例研究
原文标题: Damping effect in innovation processes: case studies from Twitter
地址: http://arxiv.org/abs/2106.15528
作者: Giacomo Aletti, Irene Crimaldi
摘要: 理解创新过程,即新事物出现、传播和引发进一步新事物的潜在机制,无疑在许多领域(生物学、语言学、社会科学等)具有根本重要性。到目前为止介绍的模型满足关于新奇出现率的 Heaps 定律和 Zipf 定律,它说明元素频率分布的幂律行为。然而,有一些经验案例远未显示出纯粹的幂律行为,并且对于高频元素存在这种偏差。我们通过对旧元素重复概率的适当“阻尼”效应来解释这种现象。虽然所提出的模型非常通用,也可以在其他情况下使用,但它已经在一些 Twitter 数据集上进行了测试,并在 Heaps 定律方面表现出了出色的性能,最重要的是,在频率等级的拟合方面低频和高频图。
当标准网络指标无法对期刊进行排名时:理论和实证分析
原文标题: When standard network measures fail to rank journals: A theoretical and empirical analysis
地址: http://arxiv.org/abs/2106.15541
作者: Giacomo Vaccario, Luca Verginer
摘要: 期刊排名被广泛使用,通常基于引文数据并结合网络视角。我们认为,其中一些基于网络的排名会产生误导性结果。从理论的角度来看,我们表明期刊级别引文数据的标准网络建模方法(即论文引文到期刊的投影)引入了期刊之间的虚构关系。为了克服这个问题,我们提出了引文路径视角,并通过经验表明基于网络的排名和引文路径视角是非常不同的。基于我们的理论和实证分析,我们强调了标准网络指标的局限性,并提出了一种克服这些局限性和计算期刊排名的方法。
BOTTER:分析 Twitter 中社交机器人的框架
原文标题: BOTTER: A framework to analyze social bots in Twitter
地址: http://arxiv.org/abs/2106.15543
作者: Javier Pastor-Galindo, Félix Gómez Mármol, Gregorio Martínez Pérez
摘要: 社会网络在在线交流方面取得了成功,但也被利用来发动影响力操作来操纵社会。软件控制帐户(例如社交机器人)的部署已被证明是实现此目的最有效的推动因素之一,并且已开发并广泛采用了检测工具。然而,分析这些账户和衡量其影响的方法在文献中是异类的,每个案例研究都进行独特的衡量。为了统一这些努力,我们提出了一个通用框架来分析 Twitter 中社交机器人的干扰。该方法从不同的角度将非真实行为者与其他用户进行比较,从而构建客观指标来衡量他们的实际影响。我们通过将其应用于 2019 年西班牙大选前几周的 Twitter 迭代数据集来验证该框架。从这个意义上说,我们检查我们的框架是否有助于对不真实群体的定量评估,特别是发现社交机器人在这些天改变了网络的自然动态,但没有产生重大影响。我们还认为这种方法是对实验结果进行定性解释的实用工具,特别是在上述选举背景下,半自动账户可能比全自动账户更具威胁性。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20210630/