Arxiv网络科学论文摘要19篇(2019-10-29)

  • 采用强化学习最小化出租车空闲时间;
  • 当前网络欺凌检测的局限:评价标准、可重复性和数据稀缺;
  • 复用效率指数:解密巴西航空运输多路网络;
  • 人群计数Logistic模型;
  • 符号社会网络最大化对比意见;
  • 理解图数据集同构偏差;
  • CONNA:过程中名称消歧;
  • 使用智能合约保护个人信息;
  • 使用用户生成内容的在线新闻媒体网站排名;
  • 迈向成功的社交媒体广告:预测商务推特的影响;
  • 二模网络潜空间生成模型;
  • 利用网络科学量化区域投入产出网络的经济扰动;
  • 单纯复形的谱维数:重整化群理论;
  • 基于BERT的迁移学习方法用于在线社交媒体仇恨言论检测;
  • 基于渗流理论的多源数据量化城市区域;
  • 网上造谣和维基百科的作用;
  • 自杀想法检测:机器学习方法与应用研究综述;
  • 概率腐败的执法者和违法者群体的合作的演化动力学;
  • 大脑反应时间。从个体到群体描述;

采用强化学习最小化出租车空闲时间

原文标题: Using reinforcement learning to minimize taxi idle times

地址: http://arxiv.org/abs/1910.11918

作者: Kevin O’Keeffe, Sam Anklesaria, Paolo Santo, Carlo Ratti

摘要: 出租车花费时间空闲的显著量,寻找乘客。该路线空置出租车应遵循以尽量减少他们的空闲时间都很难计算;它们依赖于复杂的数量像乘客需求,交通状况和出租车间的竞争。这里,我们探讨是否强化学习(RL)可以被用于此目的。使用真实世界的数据来表征乘客的需求,我们将展示RL-出租车确实学习到如何减少许多环境下的空闲时间。特别是,单RL-出租车普通出租车的人口工作学习由显著保证金外执行它的竞争对手。

当前网络欺凌检测的局限:评价标准、可重复性和数据稀缺

原文标题: Current Limitations in Cyberbullying Detection: on Evaluation Criteria, Reproducibility, and Data Scarcity

地址: http://arxiv.org/abs/1910.11922

作者: Chris Emmery, Ben Verhoeven, Guy De Pauw, Gilles Jacobs, Cynthia Van Hee, Els Lefever, Bart Desmet, Véronique Hoste, Walter Daelemans

摘要: 网上欺凌的检测已经看到了在社会重要性的增加,研究普及,并提供开放的数据。然而,尽管计算能力和资源的承受能力不断提高,对高品质的数据的访问限制,限制的国家的最先进技术的适用性。因此,许多最近的研究中使用小,异构数据集,而无需应用进行全面评估。在本文中,我们进一步说明这些问题,因为我们(我)这个任务评估许多公共可用的资源和演示数据收集困难。这些主要是产生小的数据集是无法捕捉所需要的复杂的社会动态,阻碍进步直接比较。我们(II)进行广泛的一系列指示普遍缺乏训练有素的这些来源分类的跨域泛化的实验,并公开提供这种框架来复制和扩展我们的评价标准。最后,我们(ⅲ)存在一种有效的方法,众包:在实验室设置模拟真实生活场景欺凌产生,可有效地用于富集真实数据合理的数据。这在很大程度上规避了对可收集的数据的限制,并提高分类器性能。我们相信,这些捐款可以提高在该领域未来研究的经验做法帮助。

复用效率指数:解密巴西航空运输多路网络

原文标题: The Multiplex Efficiency Index: unveiling the Brazilian Air Transportation Multiplex Network – BATMN

地址: http://arxiv.org/abs/1910.11974

作者: Izabela M. Oliveira, Laura C. Carpi, A.P.F. Atman

摘要: 现代社会越来越多的大量连接,反映了组织在复杂的网络社会,经济和技术结构的无所不在的趋势。近年来,随着所谓的多重网络的出现,新的概念是必要的,以便更好地理解这一现象,以及分析和量化这些系统的效率和全面性。多样性的多重网络的概念是这样的内在跨学科的努力,以更好地了解复杂的网络性质的一个突出的例子。在这项工作中,我们使用与巴西航空运输网络数据引入一个新的指数,复用效率指数,它允许量化多样性的时间演变,特别是当多重网络的层数随时间变化。我们通过多样性和多重效益的测量的组合展示为巴西航空运输网络已经岁月改变了,由于机场的私有化进程和航空公司在巴西的合并。除此之外,我们展示了多重效率指数是如何能够量化网络效率的波动在一个不带偏见的方式,因为它考虑到多重网络的层数。我们认为,提出的指标是很有价值的量化中的任何多重网络的效率,特别是,分析其时间演变,独立于层数的变化,以定量的方式。

人群计数Logistic模型

原文标题: Logistic model for crowd counting

地址: http://arxiv.org/abs/1910.11995

作者: Byung Mook Weon

摘要: 人群很可能会维持或在特定区域和时间的移动。由于人群流动,人群计数往往是一项艰巨的任务。这里建议基于逻辑模型的物理模型来解释人群流动性如何影响人群的大小。该模型揭示了人群流动性和增长速度在人群计数集体贡献光。这个模型提供了一个框架,了解静态和移动人群动态。

符号社会网络最大化对比意见

原文标题: Maximizing Contrasting Opinions in Signed Social Networks

地址: http://arxiv.org/abs/1910.12017

作者: Kaivalya Rawal, Arijit Khan

摘要: 经典的影响力最大化问题发现在社会网络使得网络用户的影响,以下的影响级联模型的预期数量,最大化影响力的种子用户的数量有限。该问题已研究了不同的设置,与所述图结构的进一步的概括,例如,边权重和极性,目标用户类别,等等。在本文中,我们介绍涉及人口分成两个不同的组的唯一的影响扩散场景与反对意见。我们的目标是寻找顶 ķ有影响力的种子节点,以便同时最大限度地采用两个不同的,对立的意见两组,分别。有效地找到这样有影响力的用户是在广泛的应用中非常必要,如增加选民的参与和投票,与有争议的观点的社会问题转向公共辩论和讨论。我们制定这部小说问题的选民模型来模拟舆论的扩散和动态,然后设计一个线性时间和详细的算法COSiNeMax,同时还调查了网络中的长期观点特性。我们与一些真实世界的数据集实验验证了该算法的有效性和效率,相对于各种基准。

理解图数据集同构偏差

原文标题: Understanding Isomorphism Bias in Graph Data Sets

地址: http://arxiv.org/abs/1910.12091

作者: Sergei Ivanov, Sergei Sviridov, Evgeny Burnaev

摘要: 近年来一直在对图结构化数据分类方法的快速增长。无论是在图内核和图神经网络,国家的最先进的成功模式的隐含假设之一是,结合图同构特征到架构带来更好的经验性能。然而,正如我们在这项工作中发现,常用的数据集图分类有重复的情况下,造成同构的偏见,即问题通过训练组记忆目标信息,人为地增加了模型的准确性。这可以防止的算法,公平竞争,提高了所得结果的有效性的问题。我们分析54个数据集,以前广泛用于图相关的任务,在同构存在偏差,给未来的实验,一组机器学习的建议从业者正确地设置他们的模型,以及开源的新的数据集。

CONNA:过程中名称消歧

原文标题: CONNA: Addressing Name Disambiguation on The Fly

地址: http://arxiv.org/abs/1910.12202

作者: Bo Chen, Jing Zhang, Jie Tang, Lingfan Cai, Zhaoyu Wang, Shu Zhao, Hong Chen, Cuiping Li

摘要: 名称消歧的关键,也是许多在线系统,如社会化搜索和学术搜索一个非常有手感的问题。尽管相当多的研究,还没有得到系统的研究的一个关键问题是消歧的飞行来完成实时消除歧义。这是非常具有挑战性的,因为消歧算法必须准确,高效和容错。在本文中,我们提出了一种新的框架CONNA训练的匹配部件和决策组件共同通过强化学习。匹配组件负责寻找顶部匹配候选人定的纸张,并判定组件负责决定在顶部匹配的人分配或创建一个新的人。这两个部件相互交织,可以通过共同训练自举。根据经验,我们评估CONNA上AMiner一个大型在线学术搜索系统。实验结果表明,该框架可以通过匹配和决定组成部分的联合训练实现对F1得分5.37%-19.84%的改善。所提出的CONNA已经成功部署在AMiner。

使用智能合约保护个人信息

原文标题: Protecting Personal Data using Smart Contracts

地址: http://arxiv.org/abs/1910.12298

作者: Mohsin Ur Rahman, Fabrizio Baiardi, Barbara Guidi, Laura Ricci

摘要: 分散的在线社会网络(DOSNs)已被提议作为一种替代解决目前集中在线社会网络(嗅觉神经元)。在线社会网络是基于集中式架构(例如Facebook,Twitter或Google+的),而DOSNs没有中央的权威和用户对其信息的更多控制作用服务提供商。在过去几年里几个DOSNs已经被提出。然而,OSN的下放需要保护用户的隐私,高效的解决方案,并评估用户之间的信任。 Blockchain代表已应用于多个领域,其中还向这些社会网络颠覆性的技术。在本文中,我们提出了利用blockchain技术DOSNs一个可管理的,用户驱动的,可审计的访问控制框架。在该方法中,blockchain用作隐私策略的定义支持。资源所有者使用主题的公钥来定义灵活的基于角色的访问控制策略,同时与主体的复仇账户相关联的私钥仅使用一次的访问权限的验证blockchain解密私人数据。我们评估通过利用Rinkeby复仇testnet部署智能合同,并对其性能进行评估我们的解决方案。实验结果表明,该方案在实现通过部署在Blockchain智能合同审计和用户驱动的访问控制的可行性。

使用用户生成内容的在线新闻媒体网站排名

原文标题: Online News Media Website Ranking Using User Generated Content

地址: http://arxiv.org/abs/1910.12441

作者: Samaneh Karimi, Azadeh Shakery, Rakesh Verma

摘要: 新闻媒体网站是已经绘制文本挖掘研究者的高度重视重要的在线资源。这项研究的主要目的是提出一个框架,从不同的观点排行在线新闻网站。新闻网站的排名是非常有用的信息,这可以受益很多新闻相关的任务,如新闻检索和新闻的建议。在拟议的框架,通过计算在介绍了基于用户生成内容的三项措施获得的新闻网站的排名。每个拟议的措施涉及从特定的角度看,包括新闻报道的完整性新闻网站的性能,活动的多样性是由网站和它的速度覆盖。在这个框架中使用的用户生成的内容,作为一个部分,公正的,实时的和在网络上低成本的内容区分,从文献中提出的新闻网站排名的框架。对于三位著名的新闻网站,BBC,CNN,纽约时报获得的结果,表明BBC在新闻的完整性和速度方面的最佳性能,以及纽约时报在与其他两个网站比较最佳的多样性。

迈向成功的社交媒体广告:预测商务推特的影响

原文标题: Towards Successful Social Media Advertising: Predicting the Influence of Commercial Tweets

地址: http://arxiv.org/abs/1910.12446

作者: Renhao Cui, Gagan Agrawal, Rajiv Ramnath

摘要: 企业通信使用Twitter的各种原因 - 以提高他们的品牌知名度,市场的新产品,对社会的意见作出回应,并有针对性地与他们的客户和潜在客户进行连接。为了有效地做到这一点的企业,他们需要了解哪些内容和结构元素有关的tweet,使其影响力,也就是广泛喜爱,其次,和转推。本文提出了分析商业微博,并预测他们的读者影响的系统方法。我们的模型,它使用的装饰和元功能的组合,优于基准模型的预测能力以及鸣叫嵌入模型。此外,为了展示一个实际使用这项工作,我们展示一个不成功的鸣叫是如何被设计(例如,改写),以增加其成功的可能性。

二模网络潜空间生成模型

原文标题: Latent space generative model for bipartite networks

地址: http://arxiv.org/abs/1910.12488

作者: Demival Vasques Filho, Dion R.J. O’Neale

摘要: 生成网络模型的理解,在网络形成操作和整个知识的几个领域被广泛使用的机制是非常有用的。然而,当涉及到双边的网络 - 一类网络在社会系统中经常遇到 - 生成模型实际上是不存在的。在这里,我们提出了双边网络的双曲线计划增长潜在空间中生成模型。这是先前提出的一个模式网络模型的扩展,基于最大熵方法。我们表明,通过再现二分的结构特性,如度分布和小周期,二分网络可以是更好的建模和一个模式投影网络属性可以自然地评估。

利用网络科学量化区域投入产出网络的经济扰动

原文标题: Using network science to quantify economic disruptions in regional input-output networks

地址: http://arxiv.org/abs/1910.12498

作者: Emily P. Harvey, Dion R.J. O’Neale

摘要: 输入输出(IO)表提供的看着在经济所有行业之间货币流量的标准方法。 IO表可以被认为是网络 - 与节点是不同的行业和边是它们之间的流动。我们开发了一个基于网络的分析,在一个国家内区域和次区域层面来考虑多区域IO网络。我们计算这两个传统的基于矩阵-IO的措施(例如“乘数”)和新的网络理论为基础的措施,在这个更高的空间分辨率。我们对比这些方法,以便证明,中介中心应用到相同的IO数据破坏模型的结果给出了经济混乱流动的一个很好的迹象,而特征向量型中心地位的措施给予效果媲美传统的IO multipliers.We也示出了在不同水平的空间聚集处理IO网络的影响。

单纯复形的谱维数:重整化群理论

原文标题: The spectral dimension of simplicial complexes: a renormalization group theory

地址: http://arxiv.org/abs/1910.12566

作者: Ginestra Bianconi, Sergey N. Dorogovtsev

摘要: 单纯复越来越多地用于研究复杂系统的结构和动力学,包括扩散,同步和疾病传播。图拉普拉斯算子的谱维数是已知的,以确定在长的时间尺度扩散特性。这里使用重整化群,我们计算两类非顺从 D 维单纯复合物的图拉普拉斯的谱维度:阿波罗网络和伪分形网络。我们分析的谱维度的尺度与 d个拓扑尺寸 D ,以 infty ,我们指出,随机性,如一个存在于网络几何与香精会降低这些结构的谱维度的价值。

基于BERT的迁移学习方法用于在线社交媒体仇恨言论检测

原文标题: A BERT-Based Transfer Learning Approach for Hate Speech Detection in Online Social Media

地址: http://arxiv.org/abs/1910.12574

作者: Marzieh Mozafari, Reza Farahbakhsh, Noel Crespi

摘要: 通过在社交媒体用户的部分产生仇恨和有毒含量上升的现象,感兴趣的研究者奉献巨大努力的仇恨内容识别的具有挑战性的方向。我们不仅需要基于先进的机器学习和自然语言处理的高效自动仇恨言论检测模型,而且还足够大的注解数据进行训练的模式。缺乏标记仇恨言论的数据足够量的,与现有的偏见以来,一直在研究这一领域的主要问题。为了满足这些需求,在这项研究中,我们介绍了基于所谓的BERT(来自变形金刚双向编码表示)现有的预训练的语言模型的一种新的传输学习方法。更具体地说,我们调查BERT在通过使用基于迁移学习新的微调方法捕获社交媒体内容内可恨方面的能力。为了评估我们所提出的方法,我们使用已注解为种族主义,性别歧视,仇恨,或在Twitter上攻击性内容的两个公开可用的数据集。结果表明,我们的解决方案获得相较于现有的方法在精度和召回而言这些数据集相当大的性能。因此,我们的模型可以捕获数据中的注释和收集过程中的一些偏见,并有可能使我们更准确的模型。

基于渗流理论的多源数据量化城市区域

原文标题: Quantifying urban areas with multi-source data based on percolation theory

地址: http://arxiv.org/abs/1910.12593

作者: Wenpu Cao, Lei Dong, Lun Wu, Yu Liu

摘要: 量化市区,是解决相关城市问题,如环境和可持续发展问题的关键。遥感数据,尤其是夜间灯光影像,已被广泛用于世界各地的划定城市化地区。与此同时,一些新兴城市的数据,如志愿地理信息(例如,OpenStreetMap的)和社会感知数据(例如,手机,社交媒体),也揭示城市边界和动态显示出巨大的潜力。然而,一致和稳健的方法来量化这些多源数据的城市地区仍然难以实现。在这里,我们提出了一个基于渗滤法提取这些多源数据的城市市区。我们考虑城市系统的支持下,渗流理论的关键性质推导出最佳城市/非城市的门槛。此外,我们应用三个开源数据集的方法 - 人口,道路,夜间光 - 到28个国家。我们表明,该方法捕获从多源数据的城市地区而言类似的城市特点,齐普夫定律在大多数国家,拥有良好。通过不同的数据集派生的市区展示与全球人居环境良好的层协议(GHSL),并且可以通过数据融合得到进一步改善。我们的研究不仅提供了一种有效的方法来量化市区与开源的数据,同时也加深了城市系统的认识,阐明了在地理领域的多源数据融合的一些情况。

网上造谣和维基百科的作用

原文标题: Online Disinformation and the Role of Wikipedia

地址: http://arxiv.org/abs/1910.12596

作者: Diego Saez-Trumper

摘要: 这项研究的目的是寻找研究的重点领域,可以是打击假打在维基百科上是有用的。为了解决这个问题,我们进行了文献综述试图回答三个主要问题:(一)什么是假? (二)什么是最流行的机制,传播虚假信息在网上? (三),这是目前正在使用的打击造谣对抗的机制?在所有这三个问题,我们先来了解一般的做法,考虑从不同的领域,如新闻传播学,社会学,哲学,信息和政治学的研究。并比较这些研究与维基百科生态系统的现状。我们的结论是,为了保持维基百科尽可能自由地从造谣,这是必要的,有助于巡逻,以早期发现造谣和评估的外部来源的可信度。需要更多的研究来开发使用先进设备,最先进的机器学习技术来检测潜在危险的内容的工具,赋予巡逻,以对付那些变得越来越复杂,复杂的攻击。

自杀想法检测:机器学习方法与应用研究综述

原文标题: Suicidal Ideation Detection: A Review of Machine Learning Methods and Applications

地址: http://arxiv.org/abs/1910.12611

作者: Shaoxiong Ji, Shirui Pan, Xue Li, Erik Cambria, Guodong Long, Zi Huang

摘要: 自杀是现代社会的一个关键问题。早期发现和预防自杀未遂的,应给救人的生命。目前的自杀意念的检测方法包括基于与功能的工程或深学习基础上的在线社交内容的社会工作者或专家和有针对性的个体,和机器学习技术之间的相互作用进行自动检测的临床方法。这是一个全面的介绍,并讨论了这些类别的方法的第一次调查。自杀意念检测特定领域的应用是根据其数据源还审查,即问卷,电子健康档案,自杀笔记,和在线用户的内容。为了便于进一步的研究,介绍了一些具体的任务和数据集。最后,我们总结了当前工作的限制,并提供进一步的研究方向进行了展望。

概率腐败的执法者和违法者群体的合作的演化动力学

原文标题: Evolutionary dynamics of cooperation in a population with probabilistic corrupt enforcers and violators

地址: http://arxiv.org/abs/1910.12629

作者: Linjie Liu, Xiaojie Chen, Attila Szolnoki

摘要: 亲社会惩罚是社会和谐稳定的关键驱动因素。然而,该机构是容易产生腐败,因为法律,违法者可通过行贿腐败执法人员避免制裁。因此,要了解如何行为的利他主义在一个腐败的环境生存是一个悬而未决的问题。在这里揭示可能的解释,我们引进腐败的执法者和违法者成公共品博弈带游泳池的处罚,并假定惩罚者,如腐败执法人员,可以选择投诚概率采取的贿赂,同时背叛者,是腐败违法者,可以选择惩罚者随机被损坏。通过数学分析的方法,我们的目标是研究合作的这类腐败环境演变的必要条件。我们发现,合作可以在人群中保持在两种不同的方式。首先,合作者,背叛者,并惩罚者可以通过所有保持人口的稳定部分共存。其次,这三种策略可以形成类似于岩石剪刀纸周期或异周期循环的主导地位。从理论上确定何时竞争策略在一个固定的方式共存的条件或他们主宰对方以循环的方式。这些预测数字的证实。

大脑反应时间。从个体到群体描述

原文标题: Brain Reaction Times. From Individual to Collective Description

地址: http://arxiv.org/abs/1910.12725

作者: Juan Carlos Castro-Palacio, Pedro Fernández de Córdoba, J. M. Isidro, Esperanza Navarro-Pardo

摘要: 个体的反应时间数据,以视觉刺激通常已经在实验心理学由一个前高斯函数(EGF)的平均值表示。在大多数以前的作品,研究人员主要针对有关心理现象找到了EGF的三个参数的含义。我们将重点放在解释一群人,而不是一个人的RT是相关的社会科学的不同情况的反应时间(RT)。在这样做时,同样的模型作为理想气体(IG)从实验反应时间数据出现。我们发现,领导一组人的实验RT法律是与管辖无生命系统的动态规律,即无相互作用粒子系统(IG)。这两种系统都通过这k_BT对颗粒的系统和我们所谓的大脑的系统寿命参数集体参数表征。两个系统的动力学是由相互作用与它们各自的恒温器,其中以颗粒的系统和通过恒温状实体的特征在于温度驱动,我们已经呼吁组个体的时间驱动。同样,我们遇到一个麦克斯韦 - 玻尔兹曼型分布大脑的系统,可以提供比以往任何之前提供的集体响应时间的更完整的表征。采取的另一个步骤是,现在我们能够了解一个人相对于它们所属的同时代组,并通过物理定律的应用程序的行为。这导致形成从执政的大脑系统中的物理定律浮现系统中个人的分类新的基于熵的方法。据我们所知,这是第一个工作,从人力RT实验数据的物理理论(IG)的出现报告。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20191029/