- 主成分聚类方法进行社区检测;
- F-FADE:频率分解用于边流中异常检测;
- COVID-19模型中的数据预测及其在美国、韩国、巴西、印度、俄罗斯和意大利的应用;
- 存在强烈用户偏见的竞争性影响力传播和虚假新闻缓解;
- 在GitHub中获得人气;
- GitHub问题评论的对话行为分类的迁移学习方法;
- 基于历史拥堵图和共识日识别的交通拥堵和出行时间预测;
- 多重性和多样性:分析完全符号图上相关聚类问题的最优解空间;
- 非个性化推荐中的两面公平;
主成分聚类方法进行社区检测
原文标题: Community Detection by Principal Components Clustering Methods
地址: http://arxiv.org/abs/2011.04377
作者: Huan Qing, Jingli Wang
摘要: 基于用于网络社区检测问题的经典度校正随机块模型(DCSBM)模型,我们提出了两种新颖的方法:主成分聚类(PCC)和归一化主成分聚类(NPCC)。由于无需估计任何参数,因此PCC方法易于实现。在温和的条件下,我们显示PCC产生一致的社区检测。 NPCC是基于PCC和RSC方法的组合而设计的(Qin&Rohe 2013)。 NPCC的种群分析表明,对于DCSBM下的理想情况,NPCC返回了理想的聚类。 PCC和NPCC通过合成和真实数据集进行了说明。数值结果表明,与PCC和RSC相比,NPCC提供了显著的改进。此外,NPCC继承了PCC和RSC的优良特性,因此NPCC对要聚类的特征向量的数量和调整参数的选择不敏感。当处理两个弱信号网络Simmons和Caltech时,通过考虑一个以上的特征向量进行聚类,我们分别提供了PCC和NPCC的两个改进PCC +和NPCC +。与原始算法相比,这两种改进算法均提供了改进的性能。尤其是,NPCC +在Simmons和Caltech上提供令人满意的性能,错误率分别为121/1137和96/590。
F-FADE:频率分解用于边流中异常检测
原文标题: F-FADE: Frequency Factorization for Anomaly Detection in Edge Streams
地址: http://arxiv.org/abs/2011.04723
作者: Yen-Yu Chang, Pan Li, Rok Sosic, M. H. Afifi, Marco Schweighauser, Jure Leskovec
摘要: 边流通常用于刻画动态网络(例如电子邮件,社会网络或计算机网络)中的交互。检测边流中的异常或稀有事件的问题具有广泛的应用。然而,由于缺乏标签,交互的高度动态性以及网络中时间和结构变化的纠缠,它提出了许多挑战。当前方法解决上述挑战以及有效处理大量交互的能力有限。在这里,我们提出F-FADE,这是一种用于检测边流中异常的新方法,它使用一种新颖的频率分解技术来有效地建模节点对之间交互频率的时间演化分布。然后基于观察到的每个传入交互的频率的可能性来确定异常。 F-FADE能够在在线流处理中处理随时间和结构变化而引起的各种异常,同时仅需要恒定的内存。我们在一个合成的和六个真实的动态网络上进行的实验表明,F-FADE可以达到最先进的性能,并且可以检测到以前方法无法找到的异常。
COVID-19模型中的数据预测及其在美国、韩国、巴西、印度、俄罗斯和意大利的应用
原文标题: The Data Forecast in COVID-19 Model with Applications to US, South Korea, Brazil, India, Russia and Italy
地址: http://arxiv.org/abs/2011.04738
作者: Bo-Cyuan Lin, Yen-Jia Chen, Yi-Cheng Hung, Chun-sheng Chen, Han-Chun Wang, Jann-Long Chern
摘要: 在本文中,我们首先提出SQIARD和SIARD模型,以研究COVID-19在检疫,感染和无症状感染下的传播,并讨论各自基本繁殖数 R_0,R_Q 与平衡点稳定性的关系。模型。其次,在训练了相关的数据参数之后,在数值模拟中,我们分别对美国,韩国,巴西,印度,俄罗斯和意大利的数据进行了预测,并预测了每个国家的流行情况。此外,我们应用美国数据将SQIARD与SIARD进行比较,并显示预测的效果。
存在强烈用户偏见的竞争性影响力传播和虚假新闻缓解
原文标题: Competitive Influence Propagation and Fake News Mitigation in the Presence of Strong User Bias
地址: http://arxiv.org/abs/2011.04857
作者: Akrati Saxena, Harsh Saxena, Ralucca Gera
摘要: 由于社会网络在社交媒体中的广泛作用,人们共享新闻变得容易,并且新闻传播比以往任何时候都快。这些平台也已被利用来共享谣言或虚假信息,这对社会构成威胁。减少伪造信息影响的一种方法是使人们基于硬证据来理解正确的信息。在这项工作中,首先,我们提出一种传播模型,即具有用户偏见的竞争性独立级联模型(CICMB),该模型考虑了用户对不同意见,信念或政党的强烈偏见。我们进一步提出一种称为 k-TruthScore 的方法,用于从给定的一组预期真相活动者中识别出一组最佳的真相活动者,以最大程度地减少谣言传播者对网络的影响。我们将 k-TruthScore 与最先进的方法进行比较,并将它们的性能衡量为所保存的节点(在没有真相竞选者的情况下本来会相信假新闻的节点)的百分比。我们在一些真实世界的网络上展示了这些结果,结果表明 k-TruthScore 方法的性能优于基线方法。
在GitHub中获得人气
原文标题: Scoring Popularity in GitHub
地址: http://arxiv.org/abs/2011.04865
作者: Abduljaleel Al-Rubaye, Gita Sukthankar
摘要: 人气和参与度是社交媒体平台的货币,是使用户保持在线状态的强大增强机制。诸如GitHub之类的社交编码平台具有双重目的:它们是实用的工具,可促进软件开发人员之间的异步,分布式协作,同时还支持被动的社交媒体样式交互。在GitHub上有多种“喜欢”内容的机制:1)分叉存储库以复制其内容2)监视存储库以通知更新,以及3)出示表达同意的信息。本文提出了对GitHub受欢迎程度的研究,并研究了这三种量化的受欢迎程度度量之间的关系。我们引入了一个基于权重的受欢迎程度评分(WTPS),该评分是从其他受欢迎程度指标的历史记录中提取的。
GitHub问题评论的对话行为分类的迁移学习方法
原文标题: A Transfer Learning Approach for Dialogue Act Classification of GitHub Issue Comments
地址: http://arxiv.org/abs/2011.04867
作者: Ayesha Enayet, Gita Sukthankar
摘要: 社交代码平台(例如GitHub)充当研究开放源代码软件开发中的协作问题解决方案的实验室;关键功能是他们支持问题报告的能力,团队可以使用此能力来讨论任务和想法。如问题评论中所述,分析团队成员之间的对话可以得出有关虚拟团队绩效的重要见解。本文提出了一种对问题评论进行对话行为分类的转移学习方法。由于不存在带有标签的大型GitHub问题注释语料库,因此采用转移学习使我们能够利用标准的对话行为数据集和我们自己的GitHub注释数据集。我们比较了几种单词和句子级别编码模型的性能,包括单词表示的全局向量(GloVe),通用句子编码器(USE)和来自变压器的双向编码器表示(BERT)。能够将问题评论映射到对话行为,是理解认知团队过程的有用垫脚石。
基于历史拥堵图和共识日识别的交通拥堵和出行时间预测
原文标题: Traffic congestion and travel time prediction based on historical congestion maps and identification of consensual days
地址: http://arxiv.org/abs/2011.05073
作者: Nicolas Chiabaut ‘and” Rémi Faitout
摘要: 本文介绍了一种用于公路交通状况和行驶时间的实时估计的新的,随时可操作的方法。首先,在进行主成分分析之后,将历史数据集的观察天聚在一起。比较了两种不同的方法:高斯混合模型和k-means算法。聚类结果表明,同一组中的日子的拥堵图在交通状况和动态方面具有很大的相似性。这样的地图是高速公路拥堵传播的二进制可视化,对交通动态更为重视。其次,根据拥塞图,在每个群集中将共识日确定为社区中最具代表性的一天。第三,从历史数据中获得的此信息用于预测交通拥堵的传播和行驶时间。因此,使用新一天的首次测量来确定哪个共识日期最接近该新一天。然后,将在同意日期记录的过去观察结果用于预测未来的交通状况和旅行时间。使用在法国高速公路上收集的10个月的数据对该方法进行了测试,结果显示出令人鼓舞的结果。
多重性和多样性:分析完全符号图上相关聚类问题的最优解空间
原文标题: Multiplicity and Diversity: Analyzing the Optimal Solution Space of the Correlation Clustering Problem on Complete Signed Graphs
地址: http://arxiv.org/abs/2011.05196
作者: Nejat Arinik (LIA), Rosa Figueiredo, Vincent Labatut
摘要: 为了研究现实世界的系统,许多应用作品都通过带符号的图(即边标记为正或负的图)对它们进行建模。如果可以将这样的图划分为多个模块,从而使正(分别为负)边位于模块内部(分别位于其间),则该图在结构上是平衡的。如果不是这种情况,那么作者会寻找与这种平衡最接近的分区,这个问题称为“相关性聚类(CC)”。由于CC问题的复杂性,即使可能存在其他最佳或高评分解决方案,标准方法也是找到一个最佳分区并坚持下去。在这项工作中,我们在合成完整图的集合上研究CC问题的最优解的空间。我们凭经验表明,在某些条件下,有符号图可能有许多最佳分区。其中一些是非常不同的,因此在系统上提供了不同的观点,如一个小的实际图所示。这是一个重要的结果,因为它暗示着可能必须找到CC问题的几个(即使不是全部)最优解,以便正确地研究所考虑的系统。
非个性化推荐中的两面公平
原文标题: Two-Sided Fairness in Non-Personalised Recommendations
地址: http://arxiv.org/abs/2011.05287
作者: Aadi Swadipto Mondal, Rakesh Bal, Sayan Sinha, Gourab K Patro
摘要: 推荐系统是几个在线平台上使用最广泛的服务之一,可以向最终用户建议潜在的物品。这些服务通常使用不同的机器学习技术,因此公平性是一个值得关注的因素,尤其是当下游服务具有引起社会后果的能力时。因此,我们重点关注新闻媒体平台上的非个性化(全球)建议(例如,Twitter上的top-k热门话题,新闻平台上的top-k新闻等),我们一起讨论了两个具体的公平性关注点(传统上分别研究)-用户公平和组织公平。尽管用户公平捕捉了在全局推荐的情况下代表所有单个用户的选择的想法,但是组织公平试图确保在政治/思想上平衡的推荐集。这使得用户公平性成为用户端需求,而组织公平性则成为平台端需求。为了提高用户公平性,我们使用社会选择理论的方法进行测试,即各种已知的投票规则可以更好地代表用户选择结果。即使将投票规则应用到推荐设置中,我们也观察到很高的用户满意度得分。现在出于组织公平性考虑,我们提出了一种偏见度量标准,用于衡量推荐的一组项目(文章)的总体意识形态偏见。分析从基于投票规则的推荐中获得的结果,我们发现,虽然众所周知的投票规则从用户角度来看更好,但它们显示出较高的偏见值,显然不适合平台的组织要求。因此,需要通过凝聚地桥接用户公平和组织公平的思想来建立一种包容机制。在本摘要文件中,我们打算将基本思想与这种机制的要求背后的明确动机结合在一起。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20201111/