Arxiv网络科学论文摘要9篇(2017-05-17)

  • 在线到达时间的马尔可夫建模;
  • 复杂网络新组合曲率的系统评估;
  • 铜供应网络社区结构独立评估公元前七千年巴尔干地区的考古记录;
  • 姓氏的复杂社会网络:巴西与葡萄牙之间的比较;
  • 在复杂网络中边缘统治的数据聚类;
  • 通过低秩不对称投影学习边表示;
  • 基于社会媒体的物质使用预测;
  • 拓扑揭示了网络比较的通用特性;
  • 基于主体的人类语言尺度起源的模式;

在线到达时间的马尔可夫建模

地址: http://arxiv.org/abs/1509.04857

作者: Corentin Vande Kerckhove, Balázs Gerencsér, Julien M. Hendrickx, Vincent D. Blondel

摘要: 网络人性化的流行研究课题之一是了解人们如何互动和沟通。学者们调查出现的沟通模式,特别是单个用户发生的一系列事件。分离两个连续事件的等待时间的分布(也由事件间分布表示)是众所周知的,密度拟合幂律。然而,辩论仍然存在于解释观察到的分布的基础模型的性质,以及模型是否应该包含事件间依赖性。本研究的目的是将连续等待时间的依赖性整合到幂律模型中。可以观察到社交媒体行为的特点是长时间不活动而分离的强化活动。我们提出一个直观的解释,以了解观察到的后续等待时间的依赖性。这导致我们创建一个结合内存的模型。我们的贡献是双重的。第一个想法包括将长时间的等待时间短于幂律分布的范围。通过引入两状态马尔可夫过程来并入内存来进一步增强该模型。这两个贡献显示了在Twitter和Reddit上对模拟评论事件的显着改进。

复杂网络新组合曲率的系统评估

地址: http://arxiv.org/abs/1610.01507

作者: R.P. Sreejith, Jürgen Jost, Emil Saucan, Areejit Samal

摘要: 我们最近引进了Forman对Ricci曲率的离散化到复杂网络的领域。 Forman曲率是基于边缘的度量,其数学定义优雅地将节点和边缘的权重封装在复杂网络中。在这个贡献中,我们用不同模型和实际网络中的边缘,嵌入和色散之类的其他边缘度量来进行Forman曲率的比较分析。我们发现,与嵌入性或分散性相比,Forman曲率是复杂网络大规模连接的边缘重要性的更好的指标。基于边界的Forman曲率的定义,定义网络中节点的Forman曲率有两种自然的方式。在这个贡献中,我们还研究了在不同模型和实际网络中节点的Forman曲率的这两个可能的定义。根据我们的经验分析,我们发现在实践中,选择组合节点权重的节点的Forman曲率的非规范化定义是复杂网络中节点重要性的更好的指标。

铜供应网络社区结构独立评估公元前七千年巴尔干地区的考古记录

地址: http://arxiv.org/abs/1705.05406

作者: Miljana Radivojevic, Jelena Grujic

摘要: 许多物理,生物和社会现象的复杂网络分析显示出显着的结构规律,但它们在研究人类过去互动中的应用仍然不发达。在这里,我们提出了一种创新的方法,用于确定考古记录中的社区结构,允许对巴尔干地区使用铜的社会进行独立评估,c。 6200到c。公元前3200年。我们通过在3000多年内探索这些社会的网络系统的模块化来实现这一目标。我们采用来自79个考古遗址的铜基物体的化学数据作为独立变量,用模块化最大化方法检测最密集的节点集合。我们的研究结果显示了整个时期的三个主要模块化结构,具有很强的空间和时间意义。我们将史前社会中铜供应的模式反映为社会关系,与物理接近度同样重要。虽然设计了一个从任何考古和时空信息中分离的变量,我们的方法提供了考古学和时空上有意义的结果。它产生人类互动与合作的模式,可以独立于既定的考古系统进行评估,可以从考古和历史记录的任何定量数据中广泛应用。

姓氏的复杂社会网络:巴西与葡萄牙之间的比较

地址: http://arxiv.org/abs/1705.05449

作者: G. D. Ferreira, G. M. Viswanathan, L. R. da Silva, H. J. Herrmann

摘要: 我们根据对巴西和葡萄牙姓氏(姓氏)的分析,对社交网络进行研究。我们构建网络,其节点是家族名称,其边缘表示两个家庭之间的父母关系。从这些网络中,我们提取连通性分布,聚类系数,最短路径和中心性。我们发现连接分布遵循近似幂定律。我们把中心的数量,中心性和熵与两国社会中的错误程度联系起来。我们的结果表明,葡萄牙社会的歧视程度高于巴西社会。分析的所有网络导致了度数分布中的近似反平方幂定律。我们得出结论,对于小型网络(3或4千个节点)达到了热力学极限。所有网络的分类混合是负的,表明更多的连接顶点连接到具有较低连接性的顶点。最后,姓氏网络呈现出一些小世界特征。

在复杂网络中边缘统治的数据聚类

地址: http://arxiv.org/abs/1705.05494

作者: Paulo Roberto Urio, Zhao Liang

摘要: 本文提出了一个动态系统的模型,其中粒子主导复杂网络中的边缘。然后将拟议的动力系统扩展到社区检测和数据聚类问题的应用。在数据聚类问题的情况下,在10个不同的数据集上模拟了6种不同的技术,以便与所提出的技术进行比较。结果表明,提出的算法在算法知道簇的数量的知识的情况下表现良好。

通过低秩不对称投影学习边表示

地址: http://arxiv.org/abs/1705.05615

作者: Sami Abu-El-Haija, Bryan Perozzi, Rami Al-Rfou

摘要: 我们提出了一种用于学习图的连续空间向量表示的方法,其保留了有向边缘信息。以前在学习结构保留图嵌入中的工作每个节点学习一个嵌入向量。除了学习节点嵌入之外,我们还将有向边框建模为节点嵌入的可学习函数,这使我们能够学习更加简洁的表示,更好地保留图结构。我们执行我们的方法的内在和外在评估,从社会网络,蛋白质相互作用和电子商务的各种图表上呈现结果。我们的研究结果表明,通过我们的方法学习的联合表达显着改善了链接预测任务的最新状态,分别在有向和无向图上显示了高达69%和36%的错误减少,同时使用16每个节点的维度更小。

基于社会媒体的物质使用预测

地址: http://arxiv.org/abs/1705.05633

作者: Tao Ding, Warren K. Bickel, Shimei Pan

摘要: 在本文中,我们演示了如何使用最先进的机器学习和文本挖掘技术来构建有效的基于社交媒体的物质使用检测系统。由于物质使用地面实况难以大规模获取,为了最大限度地发挥系统绩效,我们探索了不同的特征学习方法,以利用大量无监督的社交媒体数据。我们还展示了使用多视图无监督功能学习来组合异类用户信息(如Facebook“”喜欢“和”状态更新“)的优势,以提高系统性能。根据我们的评估,我们最好的模型实现了86%的AUC用于预测烟草使用,81%的酒精使用和84%的药物使用,所有这些都显着优于现有的方法。我们的调查也发现了用户的社交媒体行为(例如,词汇使用)和物质使用之间的有趣关系。

拓扑揭示了网络比较的通用特性

地址: http://arxiv.org/abs/1705.05677

作者: Pierre-André G. Maugis, Sofia C. Olhede, Patrick J. Wolfe

摘要: 任何复杂系统的拓扑结构都是理解其结构和功能的关键。从根本上说,代数拓扑保证了网络所代表的任何系统都可以通过其封闭的路径来理解。每个路径的长度提供了一个规模的概念,这在表征系统行为的主要模式方面至关重要。在这里,通过将拓扑与规模结合在一起,我们证明存在显示任何网络的主要尺度的通用特征。我们使用这些功能来比较通过分享谣言,泄漏和其他消息而演变的社交媒体讨论中的几种规范网络类型。我们的分析能够首次普遍了解网络规模之间的循环和树状结构之间的平衡,并评估如何平衡与在线信息的传播。最重要的是,我们的结果使得网络能够以纯无模型的方式进行量化和比较,这种方式在理论上是完全自动化的,并且具有固有的可扩展性。

基于主体的人类语言尺度起源的模式

地址: http://arxiv.org/abs/1705.05762

作者: Javier Vera, Felipe Urbina

摘要: 背景/简介:Zipf的定律确定,如果一个(大)文本的单词通过降低频率排序,则频率与秩之间的关系降低,其幂指数接近-1。以前的工作强调,这种模式来自于沟通参与者的利益冲突:发言者和听众。方法:这里的挑战是定义一组代理人的计算语言博弈,主要根据测量相对参与者兴趣的参数玩博弈。结果:数值模拟表明,在参数的关键值下,似乎出现了具有尺度属性的类似人的词汇。结论:在参数的一些临界值处出现频率的中间分布表明,在人造剂的群体上,尺度的出现部分地作为仅由代理之间的局部相互作用的自组织过程产生。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20170517/