- 在线社交网络中信息与行为并发传播的社会影响;
- 学习阶级特定的词语表达在社交媒体中及早发现恶作剧;
- 跟踪网络动态:回顾距离和相似性度量;
- 社团对于影响力学习的重要性;
- 从基于随机游走的节点相似度学习网络;
- 活动驱动网络上的分布式协议;
- 网络仇恨分类:“其他”语言和段落嵌入;
- 阿隆索与城市概况的尺度;
在线社交网络中信息与行为并发传播的社会影响
原文标题: Social Influence in the Concurrent Diffusion of Information and Behaviors in Online Social Networks
地址: http://arxiv.org/abs/1508.04417
作者: Kang Zhao, Shiyao Wang, Ion B. Vasi, Qi Zhang
摘要: 在线社会网络的出现极大地促进了信息和行为的传播。虽然这两种传播过程往往是交织在一起的,但“谈话”并不一定意味着“谈话” - 分享行动信息的人可能并不真正参与其中。我们不知道信息和行为的传播是否相似,或者社会影响在这些过程中扮演着同样重要的角色。综合文本挖掘,社会网络分析和生存分析,本研究考察了Twitter上与冰桶挑战相关的信息和行为的同时传播。我们显示这两个过程遵循不同的模式。单边社会影响力有助于信息的传播,但不影响行为的传播;通过沟通过程传达的双边影响是行为传播的重要而积极的预测因素,而不是信息传播。这些结果对社会影响力,社会网络和传染病的理论有影响。
学习阶级特定的词语表达在社交媒体中及早发现恶作剧
原文标题: Learning Class-specific Word Representations for Early Detection of Hoaxes in Social Media
地址: http://arxiv.org/abs/1801.07311
作者: Arkaitz Zubiaga
摘要: 随着人们越来越多地使用社交媒体作为新闻消费的来源,它的未被塑造的性质使得恶作剧的传播成为可能,从而破坏了从社交媒体平台收集到的信息的可信度。为了缓解这个问题,我们研究了一个可以在早期区分真假报告的恶作剧检测系统。我们引入了半自动化的方法,利用维基数据库知识库构建大规模数据集进行准确性分类,使得我们可以创建一个包含超过1300万条推特(其中15%为假)的报告数量为4,007个。我们描述了一种使用词嵌入来学习类特定词表示的方法,我们称其为multiw2v。我们的方法能够在第一条推文发布10分钟内获得超过72%的F1分数,并超越其他基线。我们的数据集代表了一个真实的假想故事情节,我们发布这个假想故事作为未来研究的基准。
跟踪网络动态:距离和相似性度量综述
原文标题: Tracking Network Dynamics: a review of distances and similarity metrics
地址: http://arxiv.org/abs/1801.07351
作者: Claire Donnat, Susan Holmes
摘要: 从纵向生物医学研究到社会网络,图已经成为描述复杂系统中代理之间不断演变的交互作用的强大框架。在这样的研究中,数据通常由代表系统在不同时间点或空间的状态的一组图组成。系统动态的分析取决于选择合适的工具。具体来说,在指定表征各状态之间的相似性的特性之后,关键的一步在于选择能够反映这种相似性的距离。尽管文献提供了一些可以从中选择的距离,但是它们的性质几乎没有被研究过,没有提供关于这种距离选择的指导方针。然而,这些距离对网络结构扰动的敏感度以及识别重要变化的能力对分析至关重要,因此选择一个适当的度量标准是一个决定性的,但却是微妙的实际问题。本着Goldenberg,Zheng和Fienberg 2009年开创性的研究的精神,本文的目的是提供一个常用图距的概述,以及他们最能捕捉到的结构变化的明确表征。为了了解这些在真实情况下的翻译,我们将讨论这些距离应用于纵向微生物组学研究的分析 - 以及合成实例。揭示了一些传统距离的不足之处,我们还建议了替代的相似性度量标准,并在具体的分析场景中突出它们的相对优势。最重要的是,我们提供了在某些类型的应用中选择一个距离而不是另一个距离的指导。最后,我们展示了这些不同距离的应用程序从全球食谱创建的网络。
社团对于影响力学习的重要性
原文标题: The Importance of Communities for Learning to Influence
地址: http://arxiv.org/abs/1801.07355
作者: Eric Balkanski, Nicole Immorlica, Yaron Singer
摘要: 我们考虑社会网络中影响最大化的典型问题。自从Kempe,Kleinberg和Tardos的开创性工作以来,在这个问题上有两个很大的分歧。第一个研究与学习生成影响模型参数有关的问题。第二个重点是识别一组影响因子的算法挑战,假定生成模型的参数是已知的。最近的学习和优化结果意味着一般来说,如果生成模型不是已知的,而是从训练数据中学习的,则没有算法可以使用从任何分布中抽取的多项式多样本来产生常数因子近似保证。在本文中,我们设计了一个简单的启发式方法,通过利用社会网络的强大社区结构来克服实践中的负面结果。虽然通常我们的算法的逼近保证必然是无界的,但是我们证明了这个算法在实验上表现良好。为了证明它的性能,我们证明了我们的算法通过随机块模型生成的图获得了一个常数因子逼近保证,传统上用于模型具有社区结构的网络。
从基于随机游走的节点相似度学习网络
原文标题: Learning Networks from Random Walk-Based Node Similarities
地址: http://arxiv.org/abs/1801.07386
作者: Jeremy G. Hoskins, Cameron Musco, Christopher Musco, Charalampos E. Tsourakakis
摘要: 在线社交媒体的数字化存在意味着隐私风险。在这项工作中,我们考虑对社会网络的隐私威胁,在这个社会网络中,攻击者可以访问基于随机行走的节点相似性的一个子集,比如有效的抵抗力(即通勤时间)或者个性化的PageRank分数。使用这些相似性,攻击者的目标是尽可能多地推断底层网络的信息,包括任何剩余未知的成对节点的相似性和边。对于有效的阻力度量,我们显示,即使测量值很大时,攻击者也可以在社会网络中学习很大一部分边。我们还表明,有可能学习一个精确匹配所有其他有效电阻的底层网络的图。从数据挖掘的角度来看,第二个观察是有趣的,因为精确计算所有有效的阻力可能是昂贵的。作为替代方案,我们从近似有效电阻子集中学习到的图表可以用作广泛应用中的替代品,这些应用使用有效的电阻来探测图结构,包括图聚类,节点中心性评估和异常检测。我们通过数学形式化图学习目标,使用两个优化问题来获得我们的结果。一个公式是凸的,可以在多项式时间内证明。另一个不是,但我们用投影的梯度和坐标下降有效地解决它。我们展示了这些方法在从Facebook获得的许多社会网络上的有效性。我们还讨论了如何将我们的方法推广到其他基于随机行走的相似性,例如个性化PageRank。我们的代码可在https://github.com/cnmusco/graph-similarity-learning获得。
活动驱动网络上的分布式协议
原文标题: Distributed Agreement on Activity Driven Networks
地址: http://arxiv.org/abs/1801.07412
作者: Masaki Ogura, Junpei Tagawa, Naoki Masuda
摘要: 在本文中,我们研究了在一类称为活动驱动的网络的时间(即时变)网络中发生的共识协议的渐近性质。我们首先表明,一个标准的方法为我们提供了一个估计收敛速度的共识,就其矩阵的特征值而言,其计算成本在网络中的节点数快速增长。为了克服这个困难,我们可以推导出一个矩阵的特征值的可选边界,这个矩阵很容易计算。我们的分析涵盖了1)稀疏网络和2)快速交换网络的制度。我们通过数值模拟来证实我们的理论结果。
网络仇恨分类:“其他”语言和段落嵌入
原文标题: Cyber Hate Classification: ‘Othering’ Language And Paragraph Embedding
地址: http://arxiv.org/abs/1801.07495
作者: Wafa Alorainy, Pete Burnap, Han Liu, Matthew Williams
摘要: 通过万维网张贴并广泛传播的仇恨和攻击性语言(也称为仇恨言论或网络仇恨)可被视为与地区不稳定有关的个人和社会紧张的关键风险因素。自动化的基于网络的仇恨言语检测对于观察和理解社会紧张的趋势非常重要。在这项研究中,我们通过提出不同的数据挖掘特征提取方法来改进现有的研究。尽管以前的工作涉及使用词汇,词汇或概率分析方法(例如使用类型化依赖),但他们都遭受类似的问题,即仇恨言论通常是微妙的和间接的,并取决于单个词或短语可能会导致大量的错误否定。这个问题促使我们进行新的实验,以确定微妙的语言使用,如在一个可恶的背景下提到移民或工作繁荣。我们提出了一个新颖的“其他词典”来识别这些细微差别,我们把我们的词典与嵌入学习结合起来进行特征提取和随后的分类,使用神经网络方法。我们的方法首先探讨围绕语料库中其他术语的上下文,并确定与其他语境相关的语境模式。这些模式与其他代词和仇恨言语术语一起使用来构建我们的“其他词典”。嵌入算法具有类似词汇距离较近的优越特性,有利于在正负类别上训练分类器。为了进行验证,我们对不同类型的仇恨言论进行了多次实验,这些仇恨言论包括宗教,残疾,种族和性取向,以及通过应用我们的0.93,0.95,0.97和0.92模型获得的用于分类仇恨实例的F-measure分数。
阿隆索与城市概况的尺度
原文标题: Alonso and the Scaling of Urban Profiles
地址: http://arxiv.org/abs/1801.07512
作者: Justin Delloye, Rémi Lemoy, Geoffrey Caruso
摘要: 由于需要更好地理解城市致密化的挑战,城市特征随人口总量的扩大已经成为一个重要的研究领域。然而,城市规模研究在很大程度上与城市内部结构不相关。相比之下,阿隆索的单中心模型为城市密度剖面提供了一个以住宅选择为基础的理论。然而,关于这些概况如何随着人口规模的扩大而言是无声的,从而阻碍了经验比例研究在强大的微观经济理论中的锚定。本文通过在阿隆索模型中引入土地,收入和运输成本的权力法律来填补这一空白。从这个增广模型中,我们推导出平衡城市结构与最近关于城市土地规模和欧洲城市人口密度概况的实证结果相吻合的条件。我们发现,阿隆索模型在理论上与观测到的人口密度剖面尺度相符,并且能够令人满意地代表欧洲城市。然而,这种兼容性挑战了目前人口对工资和运输成本弹性的经验性理解,并且需要对所观察到的房屋土地剖面进行尺度。我们的结果要求重新审视土地开发和住房过程的理论以及集聚效益和运输成本的经验。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20180124/