Arxiv网络科学论文摘要9篇(2018-08-08)

  • 有向随机几何图;
  • 流平滑和去噪:边空间中的图信号处理;
  • 社会影响力的概率因果分析;
  • 社交媒体中的隐私:识别,适应和应用;
  • Erdos-Renyi随机图的模块性;
  • 集群网络中的可观察性转换;
  • 讨论是如何进行的:社交媒体对话中的话语行为分类;
  • 粘附诱导的不连续转变和社会网络分类;
  • 基于物理的行人成对交互建模和数据表示;

有向随机几何图

原文标题: Directed Random Geometric Graphs

地址: http://arxiv.org/abs/1808.02046

作者: Jesse Michel, Sushruth Reddy, Rikhav Shah, Sandeep Silwal, Ramis Movassagh

摘要: 许多现实世界的网络都是内在的指导。这样的网络包括基因的激活,互联网上的超链接,以及Twitter上的追随者网络以及许多其他网络。然而,挑战在于创建一个网络模型,该模型具有真实世界网络的许多属性,例如幂法度分布和小世界属性。为了应对这些挑战,我们引入了\ textit {Directed}随机几何图(DRGG)模型,它是随机几何图模型的扩展。我们证明它在无标度分布方面是无标度的,具有二项式出度分布,具有高聚类系数,边少且可能是小世界。这些是上述现实世界网络的一些主要特征。我们凭经验观察到词联想网络具有DRGG模型的许多理论属性。

流平滑和去噪:边空间中的图信号处理

原文标题: Flow Smoothing and Denoising: Graph Signal Processing in the Edge-Space

地址: http://arxiv.org/abs/1808.02111

作者: Michael T. Schaub, Santiago Segarra

摘要: 本文重点介绍如何设计图信号处理工具,以处理图边定义的数据。我们首先表明,来自图信号处理的传统工具可能不适合分析这些信号。更具体地说,我们讨论了在处理编码流动概念的边信号时,从拉普拉斯图(通常被认为是变体)继承的“平滑信号”的基本概念是如何不适合的。为了克服这个限制,我们引入了一类基于Edge-Laplacian的滤波器,这是Hodge-Laplacian的一种特殊情况,用于第一阶的单纯复形。我们演示了这种Edge-Laplacian如何导致低通滤波器在处理过的信号中强制执行(近似)流动守恒。此外,我们展示了这些新滤波器如何与线图上更经典的基于拉普拉斯算子的处理方法相结合。最后,我们通过对伦敦街道网络上的合成交通流进行去噪来说明所开发的工具。

社会影响力的概率因果分析

原文标题: Probabilistic Causal Analysis of Social Influence

地址: http://arxiv.org/abs/1808.02129

作者: Francesco Bonchi, Francesco Gullo, Bud Mishra, Daniele Ramazzotti

摘要: 掌握社会影响力的动态需要在信息传播轨迹数据库中分离真正的因果过程,包括时间相关性,同质性和其他虚假原因。然而,大多数研究表征社会影响,一般而言,大多数数据科学分析都侧重于相关性,统计独立性,条件独立性等;直到最近,人们对“因果数据科学”的兴趣再次兴起,例如,基于因果关系理论。在本文中,我们采用原则因果方法来分析来自信息传播数据的社会影响,其根源于概率因果理论。我们的方法围绕两个阶段发展。在第一步中,为了避免在数据跨越几种子类型的混合时错误解释因果关系的陷阱(“辛普森悖论”),我们将这组传播轨迹分组,这样每组都会少一些在信息传播的层次结构方面尽可能地矛盾。为了这个目标,我们从文献中借用了“痛苦”这个概念,并定义了痛苦限制的分区问题,我们证明这个问题很难,并且我们开发了两个有近似保证的有效算法。在第二步中,对于第一阶段的每个组,我们应用约束MLE方法来最终学习最小因果拓扑。对合成数据的实验表明,我们的方法能够检索真正的因果弧w.r.t.一个已知的地面真实生成模型。对实际数据的实验表明,通过仅关注提取的因果结构而不是整个社会网络,我们可以提高预测影响力传播的有效性。

社交媒体中的隐私:识别,适应和应用

原文标题: Privacy in Social Media: Identification, Mitigation and Applications

地址: http://arxiv.org/abs/1808.02191

作者: Ghazaleh Beigi, Huan Liu

摘要: 社交媒体的日益普及吸引了大量人们每天参加众多活动。这导致了大量丰富的用户生成数据。这些数据为研究人员和服务提供商提供了研究和更好地了解用户行为并进一步提高个性化服务质量的机会。发布用户生成的数据可能会暴露个人隐私。社交媒体中的用户隐私是一项新兴任务,近年来引起了越来越多的关注。这些作品从两个不同的角度研究社交媒体中的隐私问题:识别漏洞和减轻隐私风险。最近的研究表明,用户生成的数据易受两种一般类型的攻击,身份披露和属性泄露的影响。这些隐私问题要求社交媒体数据发布者通过在发布之前清理用户生成的数据来保护用户的隐私。因此,已经提出了各种保护技术来匿名化用户生成的社交媒体数据。从许多角度来看,社交媒体中有大量关于用户隐私的文献。在本次调查中,我们回顾了社交媒体中用户隐私的主要成就。特别是,我们在隐私泄漏攻击和匿名算法方面审查并比较了最先进的算法。我们从社交媒体的不同方面概述隐私风险,并将相关工作分为五组:1)图数据匿名化和去匿名化,2)作者识别,3)简档属性公开,4)用户位置和隐私,以及5)推荐系统和隐私问题。我们还讨论了社交媒体中用户隐私问题的未决问题和未来研究方向。

Erdos-Renyi随机图的模块性

原文标题: Modularity of Erd\H{o}s-R\‘enyi random graphs

地址: http://arxiv.org/abs/1808.02243

作者: Colin McDiarmid, Fiona Skerman

摘要: 对于给定的图$ G $,顶点的每个分区都具有模块性分数,并且采用更高的值来指示分区更好地捕获$ G $中的社区结构。图$ G $的模块性$ q *(G)$(其中$ 0 \ leq q *(G)\ leq 1 $)被定义为模块化分数的所有顶点分区的最大值。模块化是最流行的社区检测算法的核心,因此它是数学上理解的重要图参数。特别是,我们可能想要了解具有$ n $顶点和边概率$ p $的Erd \ H {o} s-R \‘enyi随机图$ G_ {n,p} $的模块性行为。我们发现的两个关键特性是模块化为$ 1 + o(1)$,具有高概率(whp),$ np $ $ 1 + o(1)$(并且没有进一步);当$ np \ geq 1 $和$ p $限制在1以下时,它的订单为$(np)^ { - 12} $ whp,符合Reichardt和Bornholdt在2006年的推测(并反驳了另一个猜想)来自物理学文献)。

集群网络中的可观察性转换

原文标题: Observability transitions in clustered networks

地址: http://arxiv.org/abs/1808.02255

作者: Takehisa Hasegawa, Yuta Iwase

摘要: 我们研究了聚类对网络可观察性转换的影响。在Yang,Wang和Motter [物理学家]介绍的可观测性模型中。莱特牧师。 109,258701(2012)],随机选择给定部分的节点,并且它们和那些邻居被认为是可观察的,而其他节点是不可观察的。使用此模型,我们检查可观察节点和随机聚类网络中不可观察节点的连通组件,这些组件概括了随机图以包含三角形。我们使用生成函数来导出最大可观察组件(LOC)和最大不可观察组件(LUC)的标准化大小,显示它们都受到网络聚类的影响:更高集群的网络具有更低的关键节点分数,用于形成宏观LOC和LUC,但这种影响很小,除非平均程度很小,否则几乎可以忽略不计。我们还评估了这些关键点的界限,以确认聚类对网络可观察性转换的微弱或可忽略的影响。蒙特卡罗模拟证实了我们的分析处理的准确性。

讨论是如何进行的:社交媒体对话中的话语行为分类

原文标题: How did the discussion go: Discourse act classification in social media conversations

地址: http://arxiv.org/abs/1808.02290

作者: Subhabrata Dutta, Tanmoy Chakraborty, Dipankar Das

摘要: 我们提出了一种新的基于注意力的分层LSTM模型,用于在社交媒体对话中对话语行为序列进行分类,旨在使用超出句子级别的文本含义从在线讨论中挖掘数据。这项任务的独特之处在于对非正式文本讨论中可能的语用角色的完全分类,与提取问题 - 答案,站姿检测或讽刺识别相反,这些都是特定于角色的任务。早期的尝试是在Reddit讨论数据集上进行的。我们在相同的数据上训练我们的模型,并在两个不同的数据集上呈现测试结果,一个来自Reddit,一个来自Facebook。我们提出的模型在域独立性方面优于前一个模型;在不使用平台相关结构特征的情况下,我们的分层LSTM与单词相关注意机制分别实现了71%和66%的F1分数,以预测Reddit和Facebook讨论中评论的话语角色。通过不同的单词和注释嵌入方案,已经呈现和分析了循环和卷积体系结构的效率,以便学习相同任务的话语表示。我们的注意机制使我们能够根据他们在话语中的角色来探究文本片段的相关性排序。我们提出了一个人类注释器实验来揭示关于建模和数据注释的重要观察。通过我们基于文本的话语识别模型,我们探讨异构的非文本特征如位置,时间,信息倾向等在Facebook的在线讨论中扮演的角色。

粘附诱导的不连续转变和社会网络分类

原文标题: Adhesion-induced Discontinuous Transitions and Classifying Social Networks

地址: http://arxiv.org/abs/1808.02362

作者: Nora Molkenthin, Malte Schröder, Marc Timme

摘要: 转折点标志着大型复杂系统的宏观属性的质变。最近在网络增长过程中发现了爆炸性转变,表现出连续和不连续相变的特性。真实的网络不仅会增长,而且往往也会重组,但常见的网络重组过程,例如小型世界重连,不会出现相变。在这里,我们发现了由\ emph {adhesion}控制的网络重组过程中出现的一类本质上不连续的转换 - 所选链路的优先级保持与其终端节点的连接。推导出时间网络演化的主方程并求出解析解,我们在非增长网络中识别真正不连续的转换,将定性不同的相分离为单调和峰值度分布。有趣的是,我们对启发式数据的分析表明,区分抽象和面对面社会网络的相同两种形式的学位分布形式之间存在分离。

基于物理的行人成对交互建模和数据表示

原文标题: Physics-based modeling and data representation of pedestrian pairwise interactions

地址: http://arxiv.org/abs/1808.02466

作者: Alessandro Corbetta, Jasper Meeusen, Chung-min Lee, Roberto Benzi, Federico Toschi

摘要: 理解和定量地模拟在人群中行走的行人之间的相互作用的物理学的可能性具有令人信服的相关应用,例如,与民用基础设施的设计和安全有关。在这项工作中,我们从稀释人群中的观察实验数据中研究行人与行人的相互作用。在行动中,行人会调整行走路径,以保持相互舒适的距离并避免碰撞。在数学模型中,这种行为通常通过“社交”交互力来建模。利用高质量,高统计数据集 - 由最先进的观测实验获得的数百万现实轨迹组成 - 我们开发了一种能够解决二元碰撞避免情况下的相互作用的定量模型。我们根据长距离和短距离力模拟相互作用,我们将其叠加到我们的Langevin模型中,用于非相互作用的行人运动[Corbetta et al。 Phys.Rev.E 95,032316,2017]。我们在这里提出的新模型具有Langevin动力学,其具有“快速”随机速度波动,其叠加到隐藏模型变量的“慢”动力学:“预期”行走路径。该模型能够再现碰撞避免运动的相关统计数据,例如侧位移和通过速度的统计。也很少发生撞击事件。此外,与现实生活轨道的大型数据集相比,涉及迄今为止忽略的另一个挑战:在包含非常不同的条件的数据库中仅识别对应于二元避免交互的相关事件。为了应对这一挑战,我们提出了一种基于行人轨迹图表示的新方法,它允许我们降低复杂度以实现有效的数据选择。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20180808/