Arxiv网络科学论文摘要9篇(2017-05-19)

  • 在线博弈:一种探索部分信息如何影响人类随机搜索的新颖方法;
  • 度校正随机块模型的非回溯谱;
  • 隐私保护社交媒体数据出版;
  • 城市邻里经济状况合作动态;
  • 大脑功能连接网络的图分析和模块化:寻找最佳阈值;
  • 熵选择文档相似性网络中的概念;
  • 假的,直到你做到:钓鱼为鲶鱼;
  • 社会媒体推荐对立内容的因素;
  • 分析抑制谣言的真相传播策略的有效性;

在线博弈:一种探索部分信息如何影响人类随机搜索的新颖方法

地址: http://arxiv.org/abs/1606.06850

作者: Ricardo Martinez-Garcia, Justin M. Calabrese, Cristobal Lopez

摘要: 许多自然过程依赖于优化搜索过程的成功率。我们使用一个由一个简单的在线博弈组成的实验设备,玩家必须找到一个隐藏在棋盘上的目标,来调查这些轮次如何被线索的检测所影响。我们专注于搜索持续时间和董事会追踪轨迹的统计。实验数据由一系列随机步行模型和概率分析近似解释。如果没有向玩家提供初始信息,则针对涵盖中间空间尺度的线索优化搜索。此外,关于提示的延伸的初始信息通常在更快的搜索中得到。最后,知情的球员使用的策略变成非平稳过程,其中每个位移的长度发展到显示在非知情搜索中找不到的明确的特征量表。

度校正随机块模型的非回溯谱

地址: http://arxiv.org/abs/1609.02487

作者: Lennart Gulikers, Marc Lelarge, Laurent Massoulié

摘要: 受社区检测的驱动,我们在Degree-Corrected Stochastic Block Model中描述了非回溯矩阵$ B $的谱。具体来说,我们考虑将$ n $顶点上的一个随机图划分成两个相等大小的集群。顶点有i.i.d.权重$ \ {\ phi_u } _ {u = 1} ^ n $ with second moment $ \ Phi ^ {(2)} $。顶点$ u $和$ v $的群内连接概率为$ \ frac {\ phi_u \ phi_v} {n} a $,群间连接概率为$ \ frac {\ phi_u \ phi_v} {n} b $。我们以很高的概率表明,以下成立:非回溯矩阵$ B $的主要特征值是渐近到$ \ rho = \ frac {a + b} {2} \ Phi ^ {(2)} $。当$ \ mu_2 ^ 2> \ rho $时,第二个特征值渐近为$ \ mu_2 = \ frac {ab} {2} \ Phi ^ {(2)} $,但渐近地由$ \ sqrt {\ rho} $当$ \ mu_2 ^ 2 \ leq \ rho $。所有剩余的特征值都由$ \ sqrt {\ rho} $渐近界定。因此,可以基于$ \ $ $ $ $ $ \ $ \ $ \ $ \ $ \ $的$ B $的第二个特征向量获得与真实社区正相关的聚类。在以前的工作中,我们获得了该检测是不可能的$ \ mu_2 ^ 2 <\ rho,$表示在度数校正随机块模型的稀疏状态中发生相变。作为一个必然结果,我们得到渐近的Erd \ H {o} s-R \‘enyi图渐近地满足Riemann假设,即准Ramanujan属性。我们证明的副产品是对于度数校正随机块模型的局部功能的大量的弱法则,这可能是独立的。

隐私保护社交媒体数据出版

地址: http://arxiv.org/abs/1701.01900

作者: Jinxue Zhang, Jingchao Sun, Rui Zhang, Yanchao Zhang, Xia Hu

摘要: 用户生成的社交媒体数据正在蓬勃发展,公共和私营部门的需求也很大。完整和完整的社交媒体数据的披露加剧了用户隐私的威胁。在本文中,我们首先确定基于文本的用户联动攻击当前社交媒体数据发布实践,其中可以根据用户的未受保护的文本数据精确定位已发布数据集中的匿名ID的真实用户。然后,我们首次在文献中提出了一个用于区别性隐私保护社交媒体数据发布的框架。在我们的框架内,社交媒体数据服务提供商可以发布扰动数据集,为社交媒体用户提供差异隐私,同时为社交媒体数据消费者提供高数据效用。我们的差异隐私机制是基于一个新颖的$ \ epsilon $ text文本不可区分性的概念,我们建议挫败基于文本的用户链接攻击。对现实世界和模拟数据集的广泛实验证实,我们的框架可以同时实现高级差分隐私保护和高数据效用。

城市邻里经济状况合作动态

地址: http://arxiv.org/abs/1701.03061

作者: Anand Sahasranaman, Henrik Jeldtoft Jensen

摘要: 我们大大扩展了我们早期的Schelling模型,包含一个邻域潜力函数以及一个代理财富增长函数来研究城市社区经济状况的长期演变。我们发现,该模型模拟的邻里相对经济状况(RES)的长期模式合理地复制了美国城市的经验观察模式。具体来说,我们发现,富裕和贫困社区的较大部分往往平均比上中下层财富社区保持更长的地位。使用衡量社区的相对财富作为代理人财富增长和代理人移动基础的潜在功能,对于解释邻居RES的这些紧急模式至关重要。这也表明经验观察的RES模式确实是普遍的,我们期望看到世界各地的城市都重复了这些模式。在更长的时间内观察RES行为,该模型预测,较差的社区保持状态的一部分在长时间内几乎保持不变,而中等财富和富裕社区保留状态的分数随时间而显着减少,趋于零。

大脑功能连接网络的图分析和模块化:寻找最佳阈值

地址: http://arxiv.org/abs/1705.06481

作者: Cécile Bordier, Carlo Nicolini, Angelo Bifone

摘要: 神经影像学数据可以表示为捕获脑连通性的拓扑组织的节点和边网络。图理论提供了一个总体而强大的框架来研究这些网络及其各种规模的结构。例如,社区检测方法被广泛应用于调查许多自然网络的模块化结构,包括脑功能连接网络。通常使用稀化程序来去除受实验噪声影响最大的最弱边,并降低图的密度,从而使其在理论上和计算上更易于处理。然而,薄弱环节也可能包含重要的结构性信息,识别最佳权衡的程序是积极研究的主题。在这里,我们探索使用渗透分析,一种基于统计物理学的方法,以确定大脑连通网络中社区检测的最佳稀疏阈值。通过使用具有典型的人脑功能连接网络的地面真实模块结构和现实拓扑特征的合成网络,我们表明渗滤分析可以应用于识别网络社区结构信息最大化的最优稀疏阈值。我们使用广泛应用于大脑连接网络分析的三种不同的社区检测方法验证此方法:纽曼的模块化,InfoMap和渐近惊喜。重要的是,我们测试噪声和数据变异性的影响,这是确定最佳阈值的关键因素。这种数据驱动的方法应该在分析以不同连通性为特征的群体中的脑网络的社区结构(例如患者和对照)中特别有用。

熵选择文档相似性网络中的概念

地址: http://arxiv.org/abs/1705.06510

作者: Andrea Martini, Alessio Cardillo, Paolo De Los Rios

摘要: 科学家们通过利用科学文献标题/摘要中包含的文本信息,花了大量的精力研究科学的组织和演变。然而,只有少数研究侧重于对文件全文的分析。相反,使用整个文件的文本可以使用基于其可以提取的特征概念的文章之间的相似网络来揭示科学知识的组织,例如通过ScienceWISE平台来提取。然而,这种网络具有非常高的链路密度(36%),阻碍了文档组与给定主题的关联,因为并不是所有的概念对于区分文章而言都是同等的信息和有用的。 “通用概念”的存在在系统中产生大量的虚假连接。为了识别/消除这些概念,我们引入了一种根据信息理论方法来衡量其相关性的方法。概念$ c $的意义是由最大熵,$ S _ {\ max} $和观察到的$ S_c $之间的距离编码的。在从最大限度的一定距离内删除概念后,我们重新构建了相似性网络并分析了其主题结构。修剪概念的后果有两个方面:链接的数量减少,以及文章之间相似之处的噪音。因此,过滤的网络显示更精细的社区结构,每个社区都包含与特定主题相关的文章。最后,该方法可以应用于其他类型的文档,也可以以粗粒度模式工作,允许研究不同尺度的语料库。

假的,直到你做到:钓鱼为鲶鱼

地址: http://arxiv.org/abs/1705.06530

作者: Walid Magdy, Yehia Elkhatib, Gareth Tyson, Sagar Joglekar, Nishanth Sastry

摘要: 许多成人内容网站包含社交网络功能。虽然这些是受欢迎的,但它们提出了巨大的挑战,包括潜在的用户“鲶鱼”,即创建假轮廓来欺骗其他用户。本文对自动鲶鱼检测采取了初步的步骤。我们探索不同年龄和性别群体的特征,确定一些区别。通过这一点,我们将根据用户个人资料和意见,通过特别验证的个人资料的基本原则来训练模型。应用我们的模型对年龄和性别估计未验证的个人资料,我们确定38%的可能说谎年龄的个人资料,25%的男性可能在说谎。我们发现妇女比鲶鱼更倾向于鲶鱼。而且,从我们的工作对这些在线社交网络的运营商以及可能担心与鲶鱼互动的用户有显着的影响。

社会媒体推荐对立内容的因素

地址: http://arxiv.org/abs/1705.06597

作者: Kiran Garimella, Gianmarco De Francisci Morales, Aristides Gionis, Michael Mathioudakis

摘要: 极化是一个令人不安的现象,可能导致社会分裂,损害民主进程。因此,重要的是开发减少它的方法。我们提出了一种降低极化问题的算法解决方案。核心思想是让用户面对挑战自己观点的内容,希望扩大观点,从而降低其极性。我们的方法考虑了问题的几个方面,例如用户的估计极性,接受推荐的可能性,内容的极性以及推荐内容的普及程度。我们通过大量用户研究评估我们的建议,Twitter用户积极参与了美国选举结果的讨论。结果表明,在大多数情况下,建议中考虑的因素会影响用户的预期,从而捕捉到问题的基本特征。

分析抑制谣言的真相传播策略的有效性

地址: http://arxiv.org/abs/1705.06604

作者: Lu-Xing Yang, Pengdeng Li, Xiaofan Yang, Yingbo Wu, Yuan Yan Tang

摘要: 传播真相被认为是抑制谣言的可行战略。本文致力于评估真实传播策略的有效性。推导出一个个人级的谣言传播模型(通用URTU模型)。在这个模式下,提出了终止谣言的两个标准。这些标准捕捉了网络结构对真实传播策略的有效性的影响。广泛的模拟表明,当谣言或真相终止时,简化的URTU模型(线性URTU模型)的动力学与实际的谣言真相相互作用过程很吻合。因此,通用的URTU模型是评估限制谣言的真相传播策略的有效性的理论依据。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20170519/