- 智能社交机器人揭示了用户偏好与新闻消费多样性之间的联系;
- 随机、Ramanujan和大周长不规则图的向量着色;
- 小说人物网络的提取与分析:综述;
- 使用Google趋势和注意力seq2seq模型预测流感患病率;
- 网络嵌入:压缩和学习;
智能社交机器人揭示了用户偏好与新闻消费多样性之间的联系
原文标题: Intelligent social bots uncover the link between user preference and diversity of news consumption
地址: http://arxiv.org/abs/1907.02703
作者: Yong Min, Tingjun Jiang, Cheng Jin, Qu Li, Xiaogang Jin
摘要: 在线社交媒体和微博平台的繁荣迅速改变了我们消费新闻和交换意见的方式。尽管相当大的努力试图向用户推荐各种内容,但信息多样性的丧失和利益集团的两极化仍然是工业界和学术界的巨大挑战。在这里,我们利用良性社交机器人在微博(中国最大的微博平台)上设计一个受控实验。这些软件机器人可以表现出类似人类的行为(例如,更喜欢特定内容)并且在两个公认的社会学假设(即,同音和三元闭合)下模拟个人社会网络和新闻消费的形成。我们在微博上部署了68个机器人,每个机器人运行至少2个月,然后跟踪100到120个账户。总共,我们观察了5,318个用户并记录了大约630,000个暴露给这些机器人的消息。我们的研究结果表明,即使选择行为相同,喜欢娱乐内容的机器人也更有可能与同龄人形成极化社区,其中约80%的信息属于同一类型,这对于机器人来说是一个显著的差异更喜欢科技含量。结果表明,与两个众所周知的驱动程序(自选和预选)相比,用户偏好在限制自己访问各种内容方面发挥了更为关键的作用。此外,我们的结果揭示了特定内容与其在同一社会网络中传播的子结构之间的巧妙联系。在微博网络中,娱乐新闻倾向于单向星形子结构,而科技新闻则在双向聚类子结构上传播。这种联系可以放大用户偏好的多样性效应。该发现可能对扩散动力学研究和推荐系统设计具有重要意义。
随机、Ramanujan和大周长不规则图的向量着色
原文标题: Vector Colorings of Random, Ramanujan, and Large-Girth Irregular Graphs
地址: http://arxiv.org/abs/1907.02539
作者: Jess Banks, Luca Trevisan
摘要: 我们证明了在平均度 d 的稀疏Erd H o sR ‘e nyi图中,矢量色数(来自Lova sz theta函数的色数的弛豫)是通常 tfrac 1 2 sqrt d + od(1)。这符合一个长期存在的猜想,即关于稀疏Erd H o sR ‘n nyi图的 k -color的各种反驳和假设检验问题在“Kesten-Stigum阈值”之下变得难以计算。 d KS,k =(k-1)^ 2 。在此过程中,我们使用着名的Ihara-Bass身份和精心构造的非回溯随机游走来证明独立兴趣的两个确定性结果:使用谱的矢量色数(以及色数)的下限。非回溯步行矩阵,上限仅依赖于周长和通用覆盖。我们的上界可以等价地看作是对不规则图的Alon-Boppana定理的推广
小说人物网络的提取与分析:综述
原文标题: Extraction and Analysis of Fictional Character Networks: A Survey
地址: http://arxiv.org/abs/1907.02704
作者: Vincent Labatut (LIA), Xavier Bost (LIA)
摘要: 角色网络是从叙述中提取的图,其中顶点表示角色,边对应于它们之间的交互。通过对角色网络的分析,例如摘要,分类或角色检测,可以自动解决许多与叙述相关的问题。在考虑小说作品(例如小说,戏剧,电影,电视剧)时,角色网络尤为重要,因为它们的开发允许开发信息检索和推荐系统。然而,小说作品具有特定属性,使这些任务更难。本调查旨在展示和组织与从小说作品中提取人物网络相关的科学文献,以及他们的分析。我们首先以通用的方式描述提取过程,并根据叙述的媒介,网络分析的目标和其他因素解释其构成步骤在实践中如何实施。然后,我们将回顾用于表征角色网络的描述性工具,重点关注它们在此上下文中的解释方式。我们通过提供对从其分析中得出的应用程序的回顾来说明角色网络的相关性。最后,我们确定了现有方法的局限性和最有希望的观点。
使用Google趋势和注意力seq2seq模型预测流感患病率
原文标题: Sequence to Sequence with Attention for Influenza Prevalence Prediction using Google Trends
地址: http://arxiv.org/abs/1907.02786
作者: Kenjiro Kondo, Akihiko Ishikawa, Masashi Kimura
摘要: 早期预测流感的流行会降低其影响。已经进行了各种研究来预测感染流感的人的数量。然而,这些研究并不是非常准确,特别是在遥远的未来,例如超过一个月。为了解决这个问题,我们使用Google趋势数据调查序列(Seq2Seq)和注意模型,以评估和预测多周内感染流感的人数。 Google趋势数据有助于补偿包括统计数据在内的黑暗数据并提高预测准确性。我们证明了注意机制对于提高预测精度和实现最新结果非常有效,Pearson相关和均方根误差分别为0.996和0.67。然而,流感疫情高峰期的预测准确性还不够,需要进一步研究以克服这一问题。
网络嵌入:压缩和学习
原文标题: Network Embedding: on Compression and Learning
地址: http://arxiv.org/abs/1907.02811
作者: Esra Akbas, Mehmet Aktas
摘要: 最近,将图的结构信息编码到矢量空间中的网络嵌入已经变得流行用于网络分析。尽管最近的方法对于各种应用表现出有希望的性能,但是巨大的图尺寸可能妨碍将现有网络嵌入方法直接应用于它们。本文介绍了NECL,一种具有两个目标的新型高效网络嵌入方法。 1)是否存在理想的网络压缩? 2)网络的压缩是否会显著提升网络的代表性?对于第一个问题,我们提出了一种基于邻域相似性的图压缩方法,该方法压缩输入图以获得较小的图,而不会丢失关于图的全局结构和图中顶点的局部接近度的任何/大量信息。对于第二个问题,我们使用压缩图进行网络嵌入而不是原始大图来降低嵌入成本。 NECL是一种通用的元策略,用于提高基于随机游走的所有最先进的图嵌入算法(包括DeepWalk和Node2vec)的效率,而不会失去其有效性。在大型真实世界网络上进行的大量实验验证了NECL方法的效率,该方法平均提高了23-57%的嵌入时间,包括步行和学习时间,而不会降低分类准确性,因为在现实世界中对单标签和多标签分类任务进行评估DBLP,BlogCatalog,Cora和Wiki等图表。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20190708/