Arxiv网络科学论文摘要12篇(2019-08-30)

  • 动态复杂系统中的影响因子识别;
  • 可恶的人或可恶的机器人?在阿拉伯语社交媒体中传播宗教仇恨的机器人的检测与特征;
  • 自然环境下的群际联系:NBA相关论坛中群际和单群成员之间的语言差异特征;
  • 基于贝叶斯逻辑回归的国内旅客多模态选择行为评估——以中国为例;
  • Twitter上地理标记行为的大规模实证研究;
  • 不在家的范围:同行生产和城乡鸿沟;
  • 电子音乐的精英、社区和好处有限的指导;
  • 一项关于美国医疗众筹活动中社会不平等的截面研究;
  • 一种用于文本网络嵌入的深度神经信息融合架构;
  • 走在巨人的肩膀下:跟踪在综合引文网络中传播的累积知识;
  • 来自研究视角的维基数据——维基数据的系统映射研究;
  • 通过局部信息维度识别复杂网络中的影响者;

动态复杂系统中的影响因子识别

原文标题: Influencer identification in dynamical complex systems

地址: http://arxiv.org/abs/1907.13017

作者: Sen Pei, Jiannan Wang, Flaviano Morone, Hernán A Makse

摘要: 许多现实世界的复杂系统的完整性和功能取决于一小部分关键节点或影响者。在不同的环境中,这些影响因子被定义为维持网络连通性的结构上重要的节点,或者是可能不成比例地影响某些动态过程的动态关键单元。在实践中,识别给定系统中的最佳影响者集合在各种学科中具有深远的意义。在这篇综述中,我们调查了从不同角度发展的影响者识别研究的最新进展,并提出了针对不同目标设计的最先进的解决方案。特别是,我们首先讨论找到最小数量的节点的问题,这些节点的移除会破坏网络(即最佳渗透或网络拆除问题),然后调查方法来定位能够塑造全局动态的基本节点。连续的(例如,独立的级联模型)或不连续的相变(例如,阈值模型)。我们以摘要和展望结束审查。

可恶的人或可恶的机器人?在阿拉伯语社交媒体中传播宗教仇恨的机器人的检测与特征

原文标题: Hateful People or Hateful Bots? Detection and Characterization of Bots Spreading Religious Hatred in Arabic Social Media

地址: http://arxiv.org/abs/1908.00153

作者: Nuha Albadi, Maram Kurdi, Shivakant Mishra

摘要: 通过爬取阿拉伯语推特空间,机器人加剧了政治上的争斗,传播了错误信息,并扩散了宗派言论。虽然长期以来一直在努力分析和检测英语机器人,但阿拉伯语机器人的检测和表征仍然在很大程度上得到了充分的研究。在这项工作中,我们对机器人在阿拉伯语Twitter上传播宗教仇恨的作用提出了新的见解,并引入了一种可以准确识别阿拉伯语机器人的新型回归模型。我们的评估表明,在检测英语机器人方面高度准确的现有工具在阿拉伯语机器人上表现不佳。我们确定了这种不良表现的可能原因,对语言,内容,行为和网络功能进行了全面分析,并报告了区分阿拉伯机器人与人类之间最具信息性的功能以及阿拉伯语和英语机器人之间的差异。我们的结果标志着了解阿拉伯Twitter上恶意机器人行为的重要一步,并为更有效的阿拉伯机器人检测工具铺平了道路。

自然环境下的群际联系:NBA相关论坛中群际和单群成员之间的语言差异特征

原文标题: Intergroup Contact in the Wild: Characterizing Language Differences between Intergroup and Single-group Members in NBA-related Discussion Forums

地址: http://arxiv.org/abs/1908.10870

作者: Jason Shuo Zhang, Chenhao Tan, Qin Lv

摘要: 长期以来,群体间联系一直被认为是减少群体之间偏见的有效策略。然而,最近的研究表明,在线平台上暴露于对立群体可能会加剧两极分化。为了进一步了解在实践中积极参与群际接触的个体的行为,我们提供了一项关于群体间行为差异的大规模观察性研究,包括群体间接触和不群体间接触。我们利用Reddit上与NBA相关的讨论论坛的现有结构来研究职业体育的背景。我们将每个NBA球队的球迷确定为一个小组的成员,并追踪他们是否有群际联系。我们的结果显示,在控制活动水平后,具有群组间联系的成员在其附属群体中使用的语言比没有此类联系的群体更多。我们进一步量化了群间接触的不同水平,并表明可能存在关于群际接触如何与群内行为相关的非线性机制。我们的研究结果为新实验中的实验研究提供了补充证据,并阐明了先前研究中不同结果的可能原因。

基于贝叶斯逻辑回归的国内旅客多模态选择行为评估——以中国为例

原文标题: Assessment of Multimodal Choice Behavior for Domestic Passengers Using Bayesian Logistic Regressions: A Case Study in China

地址: http://arxiv.org/abs/1908.10913

作者: Xiaowei Li, Xiaojiao Hu, Junqing Tang, Wei Wang

摘要: 本文研究了乘客多式联运交通选择行为的影响因素,并提出了决策依据和改进策略。通过2018年3月1日至10日在中国西安市主要交通枢纽进行的综合实地调查收集大量个人数据,我们将数据中的21个变量与包括空气在内的四种旅行模式进行了比较高铁(HSR),传统旅客列车和高速巴士。变量中,相关分析和共线性检验后,采用12个变量作为自变量,包括年龄,汽车保有量,票务方法,出行目的,出行距离,票价率,百公里城际出行时间,安全性,舒适,准时,准入时间和出发时间。使用贝叶斯二项Logistic回归(BBL)和贝叶斯多元逻辑回归(BMNL)研究旅行模式选择和自变量之间的回归关系。应用接收器操作特征(ROC)曲线来分析回归模型的预测性能。结果表明,使用BMNL的航空旅行,高速列车,旅客列车和快速公交车的ROC曲线的曲线下面积(AUC)分别为0.9785,0.92663,0.8614和0.9025。使用BBL的快速公交车ROC曲线的AUC值为0.8797,表明贝叶斯Logistic回归建立的乘客出行选择模型具有良好的预测能力。贝叶斯逻辑回归在交通模式选择中的应用有利于丰富模式选择行为的评估,本研究结果可为制定股东和政策制定者实践中的交通管理策略提供依据。

Twitter上地理标记行为的大规模实证研究

原文标题: A Large-Scale Empirical Study of Geotagging Behavior on Twitter

地址: http://arxiv.org/abs/1908.10948

作者: Binxuan Huang, Kathleen M. Carley

摘要: 社交媒体上的地理标记已成为了解人们移动性和社交活动的重要信息。使用地理标记来推断公众意见的研究依赖于关于地理标记和非地理标记用户行为的几个关键假设。但是,这些假设尚未得到充分验证。缺乏对地理标记行为的理解会阻止人们进一步利用它。在本文中,我们基于从2000万用户收集的超过400亿条推文,对Twitter上的地理标记行为进行了实证研究。有三个主要发现可能挑战这些常见假设。首先,不同的用户组具有不同的地理标记偏好。例如,只有不到3%的使用韩语的用户进行地理标记,而超过40%的使用印尼语的用户使用地理标记。其次,在配置文件中报告其位置的用户更可能使用地理标记,这可能会影响非地理标记用户的位置预测系统的可生成性。第三,用户的地理标记行为存在强烈的同质效应,用户倾向于连接具有相似地理标记偏好的朋友。

不在家的范围:同行生产和城乡鸿沟

原文标题: Not at Home on the Range: Peer Production and the Urban/Rural Divide

地址: http://arxiv.org/abs/1908.10954

作者: Isaac Johnson, Allen Yilun Lin, Toby Jia-Jun Li, Andrew Hall, Aaron Halfaker, Johannes Schöning, Brent Hecht

摘要: 关于地点,OpenStreetMap功能以及其他形式的同行制作内容的维基百科文章已成为人类和智能技术的地理知识的重要来源。在本文中,我们探讨了同行生产模式在农村/城市鸿沟中的有效性,这种鸿沟已被证明是许多在线社会系统中的一个重要因素。我们发现,在维基百科和OpenStreetMap中,同行制作的有关农村地区的内容系统性质较低,不太可能由专注于本地区域的贡献者制作,并且更有可能由自动化软件主体生成(即机器人)。然后,我们将通过同行生产描述农村现象的系统性挑战编成法典,并讨论可能的解决方案。

电子音乐的精英、社区和好处有限的指导

原文标题: Elites, communities and the limited benefits of mentorship in electronic music

地址: http://arxiv.org/abs/1908.10968

作者: Milan Janosov, Federico Musciotto, Federico Battiston, Gerardo Iñiguez

摘要: 数千年来,音乐一直是文化表达和认同的最强形式之一,并已发展成为一个强烈协作的艺术领域。虽然音乐成功的出现已经被广泛研究,但个人成功与合作之间的联系尚未完全揭示。在这里,我们的目标是通过分析数以万计的电子音乐艺术家的共同发布和指导模式的纵向数据来填补这一空白,其中最受欢迎的数据出现在DJ杂志的年度百强排行榜中。我们发现,虽然这个受欢迎的排名列表发布了前100名,但只有前20名在时间上相对稳定,展示了对电子音乐明星的锁定效应。基于前100名音乐家的时间共同发布网络,我们发现了一个以电子音乐产业为特征的多元化社区结构。这些艺术家群体暂时隔离,围绕着主要音乐家一个接一个地形成,并代表音乐流派的微小变化。我们表明,这些社区背后的主要建设力量是指导:进入前100名的大约一半的音乐家在他们进入前100名之前已经被当前的领先数据指导。我们还发现受训者不太可能进入前20名但是,与那些没有受过指导的人相比,他们的最佳排名要高得多。这意味着导师有助于提升人才,但成为历史明星需要更多。我们的研究结果提供了对电子音乐中成功与合作相互交织的作用的见解,突出了塑造电子音乐艺术精英形成和景观的机制。

一项关于美国医疗众筹活动中社会不平等的截面研究

原文标题: A cross-sectional study of social inequities in medical crowdfunding campaigns in the United States

地址: http://arxiv.org/abs/1908.11018

作者: Nora Kenworthy, Zhihang Dong, Anne Montgomery, Emily Fuller, Lauren Berliner

摘要: 美国人越来越依赖众筹来支付医疗费用。在医疗众筹中,在线平台允许个人呼吁社会网络请求捐赠以满足健康和医疗需求。用户经常被告知成功取决于他们如何组织和分享他们的活动以增加社会网络参与度。然而,专家警告说,MCF可能通过扩大人群的选择和偏见来加剧健康和社会差异,并利用这些来确定谁可以获得医疗保健的财政支持。迄今为止,关于MCF差异的潜在轴及其对筹款结果的影响的研究受到限制。本文介绍了一个关于流行平台Gofundme的637 MCF活动的随机样本的探索性横断面研究,其中竞选者,性别,年龄以及活动家和活动接受者的关系与活动特征和结果一起被分类。我们的分析检查MCF使用中的种族,性别和年龄差异,并测试这些差异与不同的活动结果之间的关系。结果显示MCF使用和结果的系统差异:非白人用户代表性不足。有大量证据表明,女性活动组织者需要额外的数字护理劳动负担,边化的种族和性别群体与较差的筹款结果相关。结果仅与用户控制下的广告系列特征(例如照片,视频和更新)最低限度相关。这些结果证实了人们普遍担心技术如何加剧卫生不公平现象,以及众筹如何为那些寻求获得医疗保健的财政支持的人创造一个不平等且有偏见的市场。需要进一步研究和更好的数据访问,以更深入地探索这些动态,并为这个基本上不受监管的行业提供政策依据。

一种用于文本网络嵌入的深度神经信息融合架构

原文标题: A Deep Neural Information Fusion Architecture for Textual Network Embeddings

地址: http://arxiv.org/abs/1908.11057

作者: Zenan Xu, Qinliang Su, Xiaojun Quan, Weijia Zhang

摘要: 文本网络嵌入旨在学习网络中每个节点的低维表示,以便来自网络的结构和文本信息可以在表示中得到很好的保留。传统上,结构和文本嵌入是通过很少考虑它们之间的相互影响的模型来学习的。本文提出了一种深度神经结构,将两种信息有效地融合为一种表示。所提出的体系结构的新颖性体现在新定义的目标函数,结构和文本特征的互补信息融合方法以及文本特征提取的互门机制方面。实验结果表明,该模型优于所有三个数据集的比较方法。

走在巨人的肩膀下:跟踪在综合引文网络中传播的累积知识

原文标题: Going beneath the shoulders of giants: tracking the cumulative knowledge spreading in a comprehensive citation network

地址: http://arxiv.org/abs/1908.11089

作者: Pietro della Briotta Parolo, Rainer Kujala, Kimmo Kaski, Mikko Kivelä

摘要: 在所有科学中,出版物的作者都依赖于以前出版物提供的知识。因此,他们“站在巨人的肩膀上”,从以前的出版物到最近的出版物都有一种知识流。追踪这种知识流动的主导范式是计算直接引用的数量,但这忽略了这样一个事实,即在第一层引文下面有一整套文献。在这项研究中,我们通过调查大约3500万份出版物的引文网络中的累积知识创建过程来探讨“肩膀”。特别是,我们研究了持续影响和扩散的程式化模型,其中考虑了所有可能的引用链。当我们研究出版物的持续影响价值及其引用次数时,我们发现与诺贝尔奖相关的出版物即诺贝尔论文在持续影响方面的排名高于引用的排名,而且表现最佳的出版物通常是早期作品导致他们时代的热门研究课题。扩散模型揭示了不同研究领域共享知识的速率的显著变化。我们发现几十年来这些比率一直在增加,这可以通过出版量的增加来解释。总体而言,我们的结果表明,分析全球范围内的累积知识创造可用于估计单个出版物和整个研究领域的科学影响的类型和规模,以及通过仅使用直接引用计数产生无法发现的见解。

来自研究视角的维基数据——维基数据的系统映射研究

原文标题: Wikidata from a Research Perspective – A Systematic Mapping Study of Wikidata

地址: http://arxiv.org/abs/1908.11153

作者: Mariam Farda-Sarbas, Claudia Mueller-Birn

摘要: 维基数据是包含结构化数据的编辑最多的知识库之一。它是维基媒体领域内外许多项目的数据来源。自2012年10月成立以来,它的社区和内容都在不断增长。越来越多的研究专注于维基数据,这反映了这种增长。我们的研究旨在通过系统的绘图研究提供对维基数据进行的研究的总体概述,以确定现有研究的当前主题报道以及需要进一步调查的白点。在这项研究中,选择了来自期刊和会议论文的67项同行评审研究,并将其分类为有意义的类别。我们通过显示出版频率,出版地点和作者的起源来描述性地描述该数据集,并揭示当前的研究重点。这些特别包括与数据质量有关的方面,包括与语言覆盖和数据完整性相关的问题。这些结果表明了许多未来的研究方向,例如多语言和克服语言差距,多元化对维基数据质量的影响,维基数据在各个学科中的潜力以及用户界面的可用性。

通过局部信息维度识别复杂网络中的影响者

原文标题: Identification of influencers in complex networks by local information dimension

地址: http://arxiv.org/abs/1908.11298

作者: Tao Wen, Yong Deng

摘要: 识别复杂网络中有影响力的传播者一直是网络特征研究的热门话题。已经提出了许多中心措施来解决这个问题,但大多数方法都有其自身的局限和缺点。本文提出了一种通过局部信息维度识别复杂网络中影响因素的新方法。该方法考虑了中心节点周围的局部结构特性,因此局部尺度仅增加到距中心节点最短距离的最大值的一半。因此,该提出的方法考虑了准局部信息并降低了计算复杂度。框中的信息(节点数)由Shannon熵考虑,这更合理。当该节点的本地信息维度较高时,该节点将更具影响力。为了显示该方法的有效性,使用五种现有的中心度量作为比较方法来对六个真实复杂网络中的有影响的节点进行排序。此外,应用易感染(SI)模型和肯德尔tau系数来显示不同方法之间的相关性。实验结果表明了该方法的优越性。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20190830/