Arxiv网络科学论文摘要16篇(2018-11-30)

  • 加权网络的巨正则系综;
  • 推荐系统评述:从情境感知到基于社会;
  • 分析紧急用户的短信数据并探索其优势;
  • 手机指标及其与城市社会经济组织的关系;
  • 利用多层图的深度嵌入改进社区检测;
  • 异构信息网络的通用网络表示;
  • 链路预测中的系统偏差:比较基于启发式和图嵌入的方法;
  • 基于多源学习的大规模蛋白质相互作用网络中的并行蛋白质群落检测;
  • 基于有效抗性的种子集合萌发的群落检测;
  • 嵌入有向图的对称化;
  • 基于图的熵指标检测有解释力的市场变化方向;
  • 使用异构信息网络预测不良媒体风险;
  • 使用社交媒体数据预测阿片类药物成瘾复发;
  • 使用涵盖更好的种子集的基于流的局部图聚类;
  • 反应式探索者解开网络拓扑;
  • 用可解释的新闻馈送算法打击假新闻;

加权网络的巨正则系综

原文标题: The Grand Canonical ensemble of weighted networks

地址: http://arxiv.org/abs/1811.11805

作者: Andrea Gabrielli, Rossana Mastrandrea, Guido Caldarelli, Giulio Cimini

摘要: 复杂网络统计力学的基本认知是:链接(而不是节点)是系统的有效粒子。在这里,我们制定了加权网络和格气模型之间的映射,将加权链接解释为具有广义坐标的粒子的概念性步骤。这导出了加权复杂网络的巨正则系综的定义。我们得到了配分函数和热力学量的精确表达式,在全局和局部(即各个节点)对粒子的密度和平均能量的约束的情况下。我们进一步表明,在对网络的实际情况进行建模时,可以解开整体的二元和加权统计,从而为一系列实际应用提供简化的框架。

推荐系统评述:从情境感知到基于社会

原文标题: A Review on Recommendation Systems: Context-aware to Social-based

地址: http://arxiv.org/abs/1811.11866

作者: S.M. Mahdi Seyednezhad, Kailey Nobuko Cozart, John Anthony Bowllan, Anthony O. Smith

摘要: 互联网用户的数量迅速增长,促使公司和合作人员充分利用推荐基础设施。因此,在线广告公司出现,以帮助我们存在众多项目和用户。即使作为用户,您可能会发现自己被淹没在一组您认为可能需要的项目中,但您不确定是否应该尝试它们。这些物品可以是在线服务,产品,地方甚至是友谊的人。因此,我们需要推荐系统铺平道路并帮助我们做出正确的决策。本文对传统推荐系统,推荐系统评估和指标,情境感知推荐系统和基于社会的推荐系统进行了审查。虽然很难将所有信息都包含在简短的评论文章中,但我们会尝试对推荐系统的基本要素进行介绍性审查。有关每章的更多详细信息,请参见相应的参考资料。为了以不同的方式解释概念,我们在https://www.slideshare.net/MahdiSeyednejad/recommender-systems-97094937上提供了幻灯片。

分析紧急用户的短信数据并探索其优势

原文标题: Analysing Emergent Users’ Text Messages Data and Exploring its Benefits

地址: http://arxiv.org/abs/1811.11983

作者: Anas Bilal, Aimal Rextin, Ahmad Kakakhail, Mehwish Nasim

摘要: 虽然发达国家的用户可以选择采用适合他们需求的技术,但新兴用户无法承受这种奢侈品,因此,他们适应了现有的技术。当设计技术时,例如移动电话技术,隐含的假设是它将在适当的时候被新兴用户采用。然而,这些用户组具有不同的需求,并且与来自发达国家的用户相比,它们遵循不同的使用模式。在这项工作中,我们针对一个新兴的用户群,即来自巴基斯坦大学的用户,并分析他们在手机上的短信行为。我们看到有趣的结果,例如,在缺乏合理的乌尔都语键盘的情况下用户的长期语言适应性,罗马乌尔都语中的公开偏好以及与文本交互相关的社会力量。我们还提供了两个案例研究,分析单个数据集如何有效地帮助了解新兴用户,提高某些任务的可用性,并帮助用户轻松执行以前的困难任务。

手机指标及其与城市社会经济组织的关系

原文标题: Mobile phone indicators and their relation to the socioeconomic organisation of cities

地址: http://arxiv.org/abs/1811.12015

作者: Clementine Cottineau, Maarten Vanhoof

摘要: 由于在计算社会科学研究中使用地理定位的大数据,人类活动的空间和时间异质性越来越多地被揭示出来。与更小和更传统的数据相结合,这开辟了了解人们如何行动和移动的新方法,以及这些运动如何结合到人口普查所观察到的结构模式中。在本文中,我们将探讨移动电话数据与法国城市人口普查中更为经典的社会经济数据的融合。我们从六个月的呼叫详细记录(CDR)数据中提取移动电话指标,而人口普查和行政数据用于表征法国城市的社会经济组织。我们讨论各种城市定义,并研究它们如何影响手机指标之间的关系,例如呼叫次数或访问过的蜂窝塔的熵,以及基于人口普查数据的经济组织衡量标准,例如剥夺程度,不平等程度和隔离。我们的研究结果表明,一些手机指标与城市的不同社会经济组织有显著的相关性。但是,我们发现发现的关系对城市定义和界定的方式很敏感。在一些情况下,不同的城市定义描述可以改变重要性甚至发现相关性的迹象。一般而言,以限制方式划定的城市(仅限中心核心)表现出人类活动的痕迹,与城市地区和分散的城市地区划定的城市相比,与社会经济组织的关系较少。

利用多层图的深度嵌入改进社区检测

原文标题: Improved Community Detection using Deep Embeddings from Multilayer Graphs

地址: http://arxiv.org/abs/1811.12156

作者: Huan Song, Jayaraman J. Thiagarajan

摘要: 在挖掘大规模图结构化数据时,社区检测是一个具有挑战性但至关重要的问题。大多数现有方法通过将节点映射到向量空间并利用所得到的嵌入来执行无监督学习来解决该问题。如果节点集存在多种类型的连接模式(通常建模为多层图),则需要新的策略来模拟层间依赖关系以执行有效的推理。在本文中,我们专注于通过神经建模技术学习多层图的每个节点的嵌入,这样复杂的依赖关系可以简明地编码成低维表示。这些表示被称为多层图嵌入,可以用于以可伸缩的方式发现社区结构,即使具有大量层。此外,为了确保在网络中持续较长范围的语义得到很好的建模,我们建议通过代理群集丢失和图模块化度量来细化多层嵌入。使用真实数据集,我们证明该算法可生成可扩展且强大的表示,并优于现有的多层社区检测方法。

异构信息网络的通用网络表示

原文标题: Universal Network Representation for Heterogeneous Information Networks

地址: http://arxiv.org/abs/1811.12157

作者: Ruiqi Hu, Celina Ping Yu, Sai-Fu Fung, Shirui Pan, Haishuai Wang, Guodong Long

摘要: 网络表示旨在将网络中的节点表示为连续且紧凑的向量,并且由于其捕获网络内复杂结构关系的能力,近年来引起了很多关注。然而,现有的网络表示方法通常被设计用于同构信息网络,其中网络的所有节点(实体)是相同类型的,例如引用网络中的纸张。在本文中,我们提出了一种通用网络表示方法(UNRA),它表示连续和公共向量空间中异构信息网络中的不同类型的节点。 UNRA建立在我们最新的相互更新的神经语言模块之上,该模块同时捕获同构节点之间的相互关系和节点内容相关性。不同类型的节点之间的关系也在统一的框架中组装和学习。实验证明,与其他六种最先进的算法相比,UNRA在节点表示,节点分类和网络可视化方面实现了出色的性能。在节点分类中,UNRA在准确性方面实现了3%到132%的性能提升。

链路预测中的系统偏差:比较基于启发式和图嵌入的方法

原文标题: Systematic Biases in Link Prediction: comparing heuristic and graph embedding based methods

地址: http://arxiv.org/abs/1811.12159

作者: Aakash Sinha, Rémy Cazabet (NII), Rémi Vaudaine (LOMA)

摘要: 链路预测是网络分析中的热门研究课题。在过去几年中,基于图嵌入的新技术已成为启发式的强大替代方法。在本文中,我们研究了预测中系统偏差的问题,并且表明基于图嵌入的一些方法提供的偏差结果比基于启发式的方法更少,尽管根据通常的质量分数得分较低。我们在滤波器气泡问题和推荐系统的算法公平性的背景下讨论了这一发现的相关性。

基于多源学习的大规模蛋白质相互作用网络中的并行蛋白质群落检测

原文标题: Parallel Protein Community Detection in Large-scale PPI Networks Based on Multi-source Learning

地址: http://arxiv.org/abs/1811.12160

作者: Jianguo Chen, Kenli Li, Kashif Bilal, Ahmed A. Metwally, Keqin Li, Philip S. Yu

摘要: 蛋白质相互作用构成了几乎所有生命活动的基本组成部分。从蛋白质 - 蛋白质相互作用(PPI)网络中识别蛋白质群落对于理解细胞组织的原理和探索各种疾病的原因至关重要。整合多种数据资源以识别具有生物学意义的可靠蛋白质群落并提高大规模PPI网络的群落检测方法的性能至关重要。在本文中,我们提出了一种基于多源学习的蛋白质群落检测(MLPCD)算法,它通过使用云计算技术整合基因表达数据(GED)和MLPCD的并行解决方案。为了有效发现参与不同细胞过程的蛋白质的生物学功能,将不同条件下的GED与原始PPI网络整合,以重建加权PPI(WPPI)网络。为了灵活地鉴定不同规模的蛋白质群落,我们使用凝聚方法定义群落模块性和功能性内聚力测量并从WPPI检测蛋白质群落。此外,我们分别将检测到的群落与已知的蛋白质复合物进行比较,并使用基因本体论注释评估蛋白质功能模块的功能富集。此外,我们在Apache Spark平台上实现了MLPCD算法的并行版本,以增强大规模逼真PPI网络算法的性能。广泛的实验结果表明MLPCD算法在准确性和性能方面优于相关算法的优势和显著优势。

基于有效抗性的种子集合萌发的群落检测

原文标题: Effective Resistance-based Germination of Seed Sets for Community Detection

地址: http://arxiv.org/abs/1811.12162

作者: Jonathan Eskreis-Winkler, Risi Kondor

摘要: 社区检测的核心是尝试将可解释的功能附加到其他难以理解的形式。标记社区的重要性对于识别社会网络中的集群具有明显的意义,但它在产品推荐,生物系统和许多形式的分类中具有许多同样相关的应用。局部各种社区检测从一小组标记的种子节点开始,旨在估计包含这些节点的社区。最普遍的方法之一 - 由于其简单性和高效性 - 是个性化的PageRank。成功部署这种形式的PageRank最明显的瓶颈是种子的质量。我们为这些种子引入“萌发”阶段,其中使用有效的基于抗性的方法来提高检测到群落的种子的质量和数量。通过将种子集扩展分为两个步骤,我们的目标是在他们擅长的制度中利用两种不同的随机游走方法。在合成和真实网络数据中,与PageRank相结合的简单,贪婪算法最小化有效电阻直径,通过独立的PageRank过程实现了精确度和召回率的明显提高。

嵌入有向图的对称化

原文标题: Symmetrization for Embedding Directed Graphs

地址: http://arxiv.org/abs/1811.12164

作者: Jiankai Sun, Srinivasan Parthasarathy

摘要: 最近,人们已经看到对开发这种方法的兴趣激增,包括用于学习(无向)图的这种表示(同时保留重要特性)的方法。然而,迄今为止关于嵌入图的大部分工作都针对了无向网络,而很少关注嵌入有向网络的棘手问题。在本文中,我们建议通过两阶段方法来解决有向图嵌入问题:在第一阶段,图以几种可能的方式之一对称,而在第二阶段,如此获得的对称图是使用任何最先进的(无向)图嵌入算法嵌入。请注意,本文的目的不是提出一种新的(无向)图嵌入算法或讨论现有图的嵌入算法的优点和缺点;我们所说的是无论哪种是合适的图嵌入算法,它都适合上面提出的对称化框架。

基于图的熵指标检测有解释力的市场变化方向

原文标题: Graph based Entropy for Detecting Explanatory Signs of Changes in Market

地址: http://arxiv.org/abs/1811.12165

作者: Yukio Ohsawa

摘要: 基于图的熵是对共现图的部分分布的事件多样性的指数,被提出用于检测数据中结构变化的符号,其在解释消费者行为的潜在动态中提供信息。为了获得基于图的熵,首先从数据中项的共现图获得连通的子图。然后,将数据中的事件中发生的项目分布到这些子图中,反映在基于图的熵的值上。对于销售地点的数据,该值的变化被视为消费者利益的出现,分离,消失或统一的标志。这些现象被视为消费者行为动态变化的迹象,可能是外部事件和信息的影响。实验表明,基于图的熵优于可用于变化检测的基线方法,用于解释消费者对超市商店中物品偏好的实质性变化及其体征。

使用异构信息网络预测不良媒体风险

原文标题: Predicting Adverse Media Risk using a Heterogeneous Information Network

地址: http://arxiv.org/abs/1811.12166

作者: Ryohei Hisano, Didier Sornette, Takayuki Mizuno

摘要: 媒体在监督有权力的机构和识别任何有损公共利益的活动方面发挥着核心作用。在由全球证券交易所46,583家正式上市的国内公司组成的投资领域,人们越来越关注“做正确的事”,即向公司施加压力,以改善其环境,社会和政府(ESG)实践。但是,如何克服来自非报告公司的ESG数据的稀疏性,以及如何在这个大型宇宙的年度报告中识别相关信息?在这里,我们构建了一个庞大的异构信息网络,涵盖了每个公司的必要信息,这些信息使用七个专业策划的数据集和两个开放数据集进行组合,总共产生了约5000万个节点和4亿个边。利用这种异构信息网络,我们提出了一个模型,可以从过去的不良媒体报道模式中学习,并预测未来不良媒体报道事件在整个公司范围内的发生。我们的方法使用2012年1月至2018年5月期间全球超过35,000家公司的不良媒体报道数据进行测试。与使用和不使用网络的最新方法相比,我们表明使用时预测准确性大大提高异构信息网络。这项工作提出了巩固大数据中包含的分散信息的新方法,以便在全球范围内监控主导机构,从而实现更具社会责任感的投资,更好的风险管理以及对强大机构的监督。

使用社交媒体数据预测阿片类药物成瘾复发

原文标题: Predicting Opioid Relapse Using Social Media Data

地址: http://arxiv.org/abs/1811.12169

作者: Zhou Yang, Long Nguyen, Fang Jin

摘要: 阿片类药物成瘾是美国严重的公共卫生威胁,造成大量死亡和许多社会问题。准确的复发预测对于恢复患者具有实际重要性,因为复发预测可以促进及时复发预防,从而帮助患者保持清洁。在本文中,我们引入了生成性对抗网络(GAN)模型来预测基于情感图像和社会影响的成瘾复发。来自Reddit.com的真实社交媒体数据的实验结果表明,GAN模型比同类替代技术提供更好的性能。模型生成的情感图像表明复发与两种情绪“喜悦”和“消极”密切相关。这项工作是使用大量社交媒体数据和生成对抗网络预测复发的首批尝试之一。所提出的方法与社交媒体挖掘知识相结合,有可能彻底改变阿片类药物成瘾预防和治疗的实践。

使用涵盖更好的种子集的基于流的局部图聚类

原文标题: Flow-Based Local Graph Clustering with Better Seed Set Inclusion

地址: http://arxiv.org/abs/1811.12280

作者: Nate Veldt, Christine Klymko, David Gleich

摘要: 用于局部图聚类的基于流的方法最近受到了理论上的切割改进和运行时保证的重要关注。在这项工作中,我们提出了在现实世界半监督聚类问题中使用基于流量的方法的两项改进。我们的第一个贡献是广义目标函数,允许从业者对从输出集中排除特定种子节点进行严格和软惩罚。此功能允许我们避免以前基于流的方法经常表现出的将大型种子集合收缩到不包含所有或甚至大多数种子节点的一小组节点的趋势。我们的第二个贡献是基于用于计算预流的push-relabel算法的变体,用于最小化我们的广义目标函数的快速算法。我们通过实施全局重新启动启发式并采用热启动程序快速解决相关的切割问题,使我们的方法在实践中非常快速。在实践中,我们的算法比先前相关的基于流的方法更快,并且在检测图中的地面实况目标区域方面也更加稳健,这归功于其更好地结合关于目标聚类的半监督信息的能力。

反应式探索者解开网络拓扑

原文标题: Reactive explorers to unravel network topology

地址: http://arxiv.org/abs/1811.12284

作者: Ihusan Adam, Duccio Fanelli, Timoteo Carletti, Giacomo Innocenti

摘要: 通过对由反应探索者组成的集合的动态采样,开发并测试过程以恢复先验未知网络的连通性分布。反应和重新定位之间的相对权重由标量控制参数测量,可以随意调整。根据外部施加的调制,系统获得不同的平衡,并反映反应和扩散项之间的相互作用。在观察节点上收集的信息用于通过直接实现着名的异构平均场(HMF)近似来预测由系统显示的静止密度。该知识转化为线性问题,可以解决该问题以返回所寻求分布的条目。然后考虑该模型的变体,其包括假设其中注入反应性成分的局部源,其速率可以作为时间的逐步函数进行调整。在此设置中操作时获得的线性问题允许人们恢复对基础系统大小的公平估计。进行数值实验以挑战该理论的预测能力。

用可解释的新闻馈送算法打击假新闻

原文标题: Combating Fake News with Interpretable News Feed Algorithm

地址: http://arxiv.org/abs/1811.12349

作者: Sina Mohseni, Eric Ragan

摘要: 如今,人工智能算法被用于大规模的目标和个性化内容分发,作为数字媒体环境中激烈竞争的一部分。不幸的是,有针对性的信息传播可能导致智力孤立和歧视。此外,正如美国和欧盟最近的政治事件所证明的那样,恶意机器人和社交媒体用户可以创建和传播不同形式的有针对性的“假新闻”内容,以获得政治利益。从另一个方向来看,假新闻检测算法试图通过识别错误信息和欺诈性用户简档来解决这些问题。本文回顾了常见的新闻提要算法以及假新闻检测方法,并讨论了如何滥用新闻提要算法来推广伪造内容,影响新闻多样性或影响可信度。我们回顾新闻提要算法和推荐引擎如何能够确认偏见,将用户隔离到某些新闻来源并影响对现实的感知。作为提高用户对如何选择或排序内容的意识的潜在解决方案,我们主张使用可解释和可解释的新闻提要算法。我们讨论了提高用户意识和系统透明度如何减轻社交媒体中回声室和气泡过滤器的不必要结果。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20181130/