Arxiv网络科学论文摘要7篇(2017-06-01)

  • EIGENREC:一种高效和可扩展的潜在因子家族,用于Top-N推荐;
  • 社会和生物传染的广义模型;
  • 一个公式上演:派对gerrymandering和效率差距;
  • 龙王的自组织;
  • 时间阻止了事情立即发生:考虑传播时间的影响最大化;
  • 知识创造社会过程中自组织关键性的机制;
  • 根据大数据预测;

EIGENREC:一种高效和可扩展的潜在因子家族,用于Top-N推荐

地址: http://arxiv.org/abs/1511.06033

作者: Athanasios N. Nikolakopoulos, Vassilis Kalantzis, John D. Garofalakis

摘要: 稀疏性是协同过滤的主要挑战之一。已知基于图的方法来减轻其影响,但是它们的使用通常在计算上是不可行的;另一方面,潜在因素方法提出了一种合理可行的替代方案。本文介绍了EigenRec;一个多功能和有效的潜在因素框架,用于Top-N建议书,其概括了众所周知的PureSVD算法(a)提供关于其内部结构的直观性,(b)为提高其功效铺平道路,同时( c)降低其复杂性。我们在这项工作中的中心目标之一是确保我们的方法适用于现实的大数据场景。为此,我们提出使用基于计算的高效Lanczos程序构建我们的模型,我们讨论了在分布式计算环境中的并行实现,并且我们使用实际数据集来验证其有利的性能。此外,从定性的角度来看,基于广泛应用的性能指标的MovieLens和Yahoo!R2Music数据集的综合实验表明,EigenRec在标准和长期方面优于几种最先进的算法 - 即使在最极端的表现 - 冷启动问题中,引导精度低,表现出对稀疏性的低敏感性。

社会和生物传染的广义模型

地址: http://arxiv.org/abs/1705.10783

作者: Peter Sheridan Dodds, Duncan J. Watts

摘要: 我们提出了一个传播模式,统一和概括了社会影响和微生物感染传播的现有模式。我们的模型包含暴露于传染性实体(例如谣言或疾病),可变暴露量(剂量大小)和个体易感性异质性的个人记忆。通过分析和模拟,我们详细研究了个人可能从感染中恢复,然后立即变得敏感(类似于所谓的SIS模型)的情况。我们确定了三种基本类型的传染性模型,我们称之为\ textit {epidemic threshold},\ textit {vanishing critical mass}和\ textit {critical mass}类,其中每个类别的模型对应于不同的预防或促进策略。我们发现特定传染性模型属于这三类之一的条件仅依赖于记忆长度和被一次和两次暴露感染的可能性。这些参数原则上可衡量真实的传染性影响或实体,从而为我们的模型产生实证意义。我们还研究一旦个人获得永久免疫力的情况,发现流行病不可避免地会死亡,但是当个人拥有记忆时,可能会令人惊讶地持续。

一个公式上演:派对gerrymandering和效率差距

地址: http://arxiv.org/abs/1705.10812

作者: Mira Bernstein, Moon Duchin

摘要: 最近,提出了一个提出了一个简单的公式称为效率差距来检测违宪党派流氓行为的提案。效率差距现在正在向最高法院提出具有里程碑意义的案例中。鉴于以下事实,本文探讨了其一些数学属性,即与票数成正比的比较。虽然我们提供了几个批评,但我们评估,EG仍然可以成为法庭分析的有用组成部分。但是,一个着名的公式可以承担起自己的生活,这个需要密切关注。

龙王的自组织

地址: http://arxiv.org/abs/1705.10831

作者: Yuansheng Lin, Keith Burghardt, Martin Rohden, Pierre-André Noël, Raissa M. D’Souza

摘要: 许多复杂的系统都看到了分布尾部的惊人的常见异常值,被称为“龙王”。有人认为,龙王在自组织系统中的一般条件是高系统耦合和低异质性。在这封信中,我们通过讨论两个紧密相关的程式化级联故障模型,介绍龙王的新机制。虽然第一个变体(基于简单的传染传播和接种)表现出良好的自组织临界性,第二个(基于简单和复杂的传染传播)在故障大小分布中创建了自组织的龙王。接下来,我们通过将初始级联的概率映射到广义生日问题,开始了解这些龙王的机制起因,这有助于证明龙王级联是由于初始故障,其大小超过了与网络的大小。我们使用这个发现,只使用逻辑回归来高精度地预测龙王的发生。最后,我们制定了一个简单的控制策略,可以将龙王的频率降低一个数量级。我们最后总结了两种模型对自然和工程系统的适用性。

时间阻止了事情立即发生:考虑传播时间的影响最大化

地址: http://arxiv.org/abs/1705.10977

作者: Hui Li, Sourav S Bhowmick, Jiangtao Cui, Jianfeng Ma

摘要: Kempe等人的创新论文定义的影响最大化(IM)问题。受到各研究界的广泛关注,导致了各种解决方案的设计。不幸的是,这种经典的IM问题忽略了这样一个事实:影响传播达到最大范围的时间在现实社会网络中可能是重要的,在此期间,底层网络本身可能已经演变。这种现象可能对所选种子的质量产生相当大的不利影响,因此所有使用这种古典定义作为其构建块的现有技术产生具有次优影响传播的种子。在本文中,我们回顾了经典的IM问题,并提出了一个更现实的版本,称为PROTEUS-IM(传播时间意识影响最大化),通过解决上述限制来替代它。具体来说,由于影响传播可能需要时间,我们假设潜在的社交网络在影响传播过程中可能会发生变化。因此,PROTEUSIM旨在在当前网络中选择种子,以在影响传播过程结束时在网络的未来实例中最大限度地发挥影响,而不对未来网络进行完整的拓扑知识。我们分别提出了一种贪婪和可反向(RR)集合的算法,称为PROTEUS-GENIE和PROTEUS-SEER,以解决这个问题。我们的算法利用最先进的森林火灾模型,在影响传播过程中对网络演化进行建模,以找到优质的种子。对实际和综合社会网络的实验研究表明,我们提出的算法在种子集质量方面始终优于最先进的经典IM算法。

知识创造社会过程中自组织关键性的机制

地址: http://arxiv.org/abs/1705.10982

作者: Bosiljka Tadic, Marija Mitrovic Dankulov, Roderick Melnik

摘要: 在在线社会动态中,强大的扩展行为似乎是许多协作努力的关键特征,导致了新的社会价值。因此,潜在的经验数据提供了一个独特的机会来研究社会系统中自组织关键性的起源。与实验室中的物理系统相反,演员的各种人物属性与传播的人工制品的内容(认知,情感)一起起着至关重要的作用。作为一个原型的例子,我们考虑通过问题\ \&答案(Q \&A)进行知识创造的社会努力。使用这样一个Q&A站点的大型经验数据集和理论建模,我们检查所有尺度的时间相关性和认知内容对知识创造过程雪崩的作用。我们的分析表明,远程相关性和事件聚类主要取决于普遍的社会动态,通过新用户的到来提供系统的外部驱动。虽然所涉及的认知内容(在数据中系统地注释并在模型中观察到)对于开发知识网络的精细结构至关重要,但它们仅影响尺度指数的值和大雪崩的几何形状并且形成多重分形谱。此外,我们发现共享知识的社区的活动水平与创新率的波动有关,这意味着创新的增加可能成为自组织的积极原则。为了确定相关参数,揭示了所考虑的社会系统过程中网络演化的作用,我们将社会雪崩与在无序固体的现场驱动物理模型中发生的雪崩序列进行比较。

根据大数据预测

地址: http://arxiv.org/abs/1705.11186

作者: Hykel Hosni, Angelo Vulpiani

摘要: 预测系统的未来状态一直是科学和实际应用的自然动力。从概念的角度来看,这个话题超出了其明显的技术和社会相关性,也是有趣的。这归因于预测适用于两个同样激进但又相反的方法。基于第一原则的还原论者,和基于数据的天真的感性主义者。后一种观点近来受到前所未有的数据量和越来越复杂的算法分析技术的应用的关注。本说明的目的是批判性地评估大数据在重塑预测的关键方面的作用,特别是声称更大的数据导致更好的预测。利用天气预报的代表性例子,我们认为,情况并非如此。我们的结论是,建议和定量分析之间的聪明和上下文相关的折中是理查森和冯·诺依曼预测的最佳预测策略。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20170601/