- 易压缩的社区检测方法的实证研究;
- 在结构健康监测中使用图信号处理和图神经网络对复杂传感器网络数据建模的计算框架;
- 见微知著:使用图池化进行图聚类的节点选择;
- 用于自监督图表示学习的多尺度对比Siamese网络;
- 使用多层网络的知识图谱的主题推荐;
- 通过研究在线新闻中的品牌重要性来预测选举结果;
- 语义品牌分数;
- 使用社会网络分析防止洗钱;
- 自私驾驶员的熵产生:对城市运动的效率和可预测性的影响;
易压缩的社区检测方法的实证研究
原文标题: An Empirical Study of Compression-friendly Community Detection Methods
地址: http://arxiv.org/abs/2105.05273
作者: Muhammad Irfan Yousuf, Izza Anwer, Muhammad Abid
摘要: 现实世界中的图非常庞大,我们需要大量的空间来存储它们。图压缩允许我们压缩图,以便每个链接需要更少的位数来存储它。在压缩图的许多技术中,一种典型的方法是在图中找到类似派系的穴居人或传统社区,并对这些派系进行编码以压缩图。另一方面,另一种方法是将图视为连接辐条的集线器的集合,并利用它来排列节点,以便可以更有效地压缩图的结果邻接矩阵。我们对这两种方法进行了实证比较,结果表明这两种方法在有利的条件下都可以产生良好的结果。我们在十个现实世界的图上进行实验,并定义两个成本函数来展示我们的发现。
在结构健康监测中使用图信号处理和图神经网络对复杂传感器网络数据建模的计算框架
原文标题: A Computational Framework for Modeling Complex Sensor Network Data Using Graph Signal Processing and Graph Neural Networks in Structural Health Monitoring
地址: http://arxiv.org/abs/2105.05316
作者: Stefan Bloemheuvel, Jurgen van den Hoogen, Martin Atzmueller
摘要: 复杂的网络有助于进行多维数据的建模,例如关系和/或时间数据。特别是,当需要对此类复杂数据及其固有关系进行形式化定义时,复杂的网络建模及其生成的图表示形式可提供多种强大的选择。在本文中,我们针对此目标-连接到图上的特定机器学习方法,以用于从分析和预测(维护)角度进行结构健康监控。具体来说,我们提出了一个基于复杂网络建模的框架,该框架集成了图信号处理(GSP)和图神经网络(GNN)方法。我们在结构健康监测(SHM)的目标应用领域中演示了此框架。特别是,我们专注于一个突出的现实世界结构健康监控用例,即对荷兰一座大桥梁的传感器数据(应变,振动)进行建模和分析。在我们的实验中,我们表明GSP可以识别最重要的传感器,为此我们研究了一组搜索和优化方法。此外,GSP可以检测特定的图信号模式(模式形状),刻画所应用的复杂网络中传感器的物理功能特性。另外,我们展示了在这类数据上应用GNN进行应变预测的功效。
见微知著:使用图池化进行图聚类的节点选择
原文标题: Seeing All From a Few: Nodes Selection Using Graph Pooling for Graph Clustering
地址: http://arxiv.org/abs/2105.05320
作者: Yiming Wang, Dongxia Chang, Zhiqian Fu, Yao Zhao
摘要: 近年来,旨在利用图信息获得数据分区的图聚类受到了相当大的关注。但是,图中的嘈杂边和节点可能会使聚类结果变差。在本文中,我们提出了一种新颖的双重图嵌入网络(DGEN),以提高图聚类到嘈杂的节点和边的鲁棒性。 DGEN被设计为由图池层连接的两步图编码器,该层可学习所选节点的图嵌入。基于一个节点及其最近的邻居应该属于同一群集的假设,我们设计了一个邻居群集池(NCPool),以根据节点及其最近的邻居的群集分配来选择信息最多的顶点子集。这可以有效地减轻噪声边对聚类的影响。在获得所选节点的聚类分配之后,使用这些所选节点训练分类器,并且可以通过该分类器获得所有节点的最终聚类分配。在三个基准图数据集上进行的实验证明了与几种最新算法相比的优越性。
用于自监督图表示学习的多尺度对比Siamese网络
原文标题: Multi-Scale Contrastive Siamese Networks for Self-Supervised Graph Representation Learning
地址: http://arxiv.org/abs/2105.05682
作者: Ming Jin, Yizhen Zheng, Yuan-Fang Li, Chen Gong, Chuan Zhou, Shirui Pan
摘要: 图表示学习在处理图结构数据中起着至关重要的作用。但是,关于图表示学习的现有技术严重依赖于标签信息。为了克服这个问题,受图对比学习和Siamese网络在视觉表示学习方面最近成功的启发,我们提出一种新颖的自我监督方法,通过使用多尺度对比学习增强Siamese自提炼来学习节点表示。具体来说,我们首先基于局部和全局视角从输入图生成两个扩充视图。然后,我们采用了称为跨视图和跨网络对比的两个目标,以最大化跨不同视图和网络的节点表示之间的一致性。为了证明我们方法的有效性,我们对五个真实世界的数据集进行了实证实验。我们的方法不仅获得了最新的技术成果,而且还大大超过了一些半监督的同行。
使用多层网络的知识图谱的主题推荐
原文标题: Thematic recommendations on knowledge graphs using multilayer networks
地址: http://arxiv.org/abs/2105.05733
作者: Mariano Beguerisse-Díaz, Dimitrios Korkinof, Till Hoffmann
摘要: 我们提出了一个框架,用于基于知识图(KG)的多层网络表示来生成和评估主题建议。在此表示形式中,每一层在KG中编码不同类型的关系,并且有向层间耦合以不同的角色连接同一实体。直观的显著性矩阵可以刻画不同类型连接的相对重要性,该显著性矩阵可以从数据中进行估算,进行调整以合并域知识,解决不同的用例或尊重业务逻辑。我们将个性化PageRank算法的改编应用于KG的多层模型,以生成项目建议。这些建议反映了我们掌握的内容知识,适用于主题和/或冷启动建议设置。通过用户数据评估主题推荐提出了独特的挑战,我们将通过开发一种方法来解决依赖于用户项目评级的推荐,同时又要尊重其主题性质。我们还表明,显著性矩阵可以从用户数据中估算出来。我们通过在AB测试中显著改善消耗指标来证明我们的方法的实用性,在该测试中协作过滤可提供低于标准的性能。我们还将使用公开可用的数据将方法应用于电影推荐中,以确保结果的可重复性。我们证明了我们的方法优于现有的主题推荐方法,甚至在协作过滤方法方面也具有竞争力。
通过研究在线新闻中的品牌重要性来预测选举结果
原文标题: Forecasting election results by studying brand importance in online news
地址: http://arxiv.org/abs/2105.05762
作者: A. Fronzetti Colladon
摘要: 这项研究使用语义品牌评分(一种在大文本数据中衡量品牌重要性的新颖方法)来预测基于在线新闻的选举。通过将社会网络分析和文本挖掘中的方法和工具相结合,将大约35,000个在线新闻文章转换为共同出现的单词网络并进行了分析。对意大利四次投票活动所做的预测在不同的投票系统中提供了一致的结果:大选,公民投票和两轮市政选举。这项工作的重点是基于在线大数据的预测,从而为选举预测研究做出了贡献;它通过相对快速且易于应用的方法,为在线新闻的文本分析提供了新的视角。这项研究还表明,政治候选人和政党的品牌重要性与选举结果之间存在联系。
语义品牌分数
原文标题: The Semantic Brand Score
地址: http://arxiv.org/abs/2105.05781
作者: A Fronzetti Colladon
摘要: 语义品牌评分(SBS)是一种根据文本数据计算出的品牌重要性的新指标,结合了社会网络和语义分析方法。此度量标准很灵活,因为它可以在不同的上下文中以及跨产品,市场和语言使用。它不仅适用于品牌,而且适用于多组单词。 SBS及其品牌流行度,多样性和连通性的三个方面一起描述,对品牌资产和词共现网络的研究做出了贡献。它可以用来支持公司内部的决策过程;例如,它可以用于预测公司的股价或评估品牌相对于竞争对手的重要性。一方面,SBS与熟悉的品牌资产结构相关,另一方面,它为大数据时代的品牌有效战略管理提供了新的视角。
使用社会网络分析防止洗钱
原文标题: Using social network analysis to prevent money laundering
地址: http://arxiv.org/abs/2105.05793
作者: A. Fronzetti Colladon, E. Remondi
摘要: 这项研究探索了应用网络分析技术来防止洗钱的机会。我们通过分析一家主要在意大利运营的保理公司的中央数据库,在19个月的时间内处理了真实世界的数据。该数据库包含链接到保理业务的财务操作,以及有关公司客户的其他有用信息。我们提出了一种新的方法来对关系数据进行分类和映射,并基于网络指标提出预测模型,以评估参与保理业务的客户的风险状况。我们发现可以通过使用社会网络指标来预测风险状况。在我们的数据集中,最危险的社会行为者处理更大或更频繁的金融业务。它们在交易网络中更为外围;他们调解不同经济部门之间的交易,并在风险较高的国家或意大利地区开展业务。最后,为了发现潜在的犯罪分子群,我们建议对共享相同所有者或代表的不同公司之间存在的默认链接进行可视化分析。我们的发现表明,在寻找可疑的金融业务和潜在的犯罪分子时,使用基于网络的方法非常重要。
自私驾驶员的熵产生:对城市运动的效率和可预测性的影响
原文标题: Entropy production of selfish drivers: Implications for efficiency and predictability of movements in a city
地址: http://arxiv.org/abs/2105.05839
作者: Indaco Biazzo, Mohsen Ghasemi Nezhadhaghighi, Abolfazl Ramezanpour
摘要: 表征运动的效率对于更好地管理城市非常重要。更具体地说,运输过程的效率和不确定性(熵)产生之间的联系尚未建立。在这项研究中,我们考虑自私驾驶员从家(原籍)到工作地点(目的地)的运动,以理解运动中的相互作用和随机性如何影响效率和熵产生的度量(目的地时间间隔中的不确定性)过程。我们采用人口分布和流动规律的现实模型来模拟运动过程,其中相互作用是通过当地旅行时间对当地流量的依赖来建模的。我们观察到,某些级别的信息(旅行时间)共享可以增强过程中可预测性的度量,而无需任何协调。此外,对于相同的模型参数和人口密度,较大的城市显示的效率较低,这限制了高效城市的规模。我们发现,熵产生是区分低和高拥挤阶段的良好顺序参数。在前一阶段,熵产生随随机运动的概率单调增长,而在拥挤阶段则表现出最小值。这就是运动的随机性可以减少目标时间间隔中的不确定性。这些发现凸显了熵产生在诸如城市之类的复杂系统中类似过程的效率和可预测性研究中的作用。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20210513/