最近几周不在国内,更新或有延迟。
- 人类流动与社会互动关系揭示一般活动模式;
- 我们是否真的需要全部抓住它们?一种新的用户引导式社交媒体抓取方法;
- 主动中介基数:算法与应用;
- 在线社会网络的成本效益种子选择;
- 具有惯性的Kuramoto振子的多路网络诱发爆炸同步;
- 使用有监督的学习方法组织行为分类;
- 异构信息网络嵌入推荐;
- 无标度网络的表示学习;
- 利用社交媒体上的对话结构来识别潜在的有影响力的用户;
- 用谱图论解构学术促进和任期决策中的异常现象;
- 理解宗教原教旨强度的分析框架;
- 连续时间事件动态网络的块点过程模型;
- 女性在学术研讨会上的知名度:女性比男性提出更少的问题;
人类流动与社会互动关系揭示一般活动模式
原文标题: Correlations Between Human Mobility and Social Interaction Reveal General Activity Patterns
地址: http://arxiv.org/abs/1611.08262
作者: Anders Mollgaard, Sune Lehmann, Joachim Mathiesen
摘要: 一个人一天的生活涉及到很多人都很常见的活动。超越昼夜周期,一个中心问题是:个人在多大程度上按照全民共享的模式行事?在这里,我们通过分析从分布在638个人中的智能手机收集的数据来调查不同活动类型之间的相互作用,即通信,运动和物理接近度。我们探讨两个中心问题:哪些基本原则支配活动模式的形成?这些模式是特定于每个人还是在整个人群中共享的?我们发现,整个人口的统计数据使我们能够成功地预测71%的活动和85%的不活动所涉及的沟通,流动性和物理接近度。令人惊讶的是,个人层面的统计数据只会导致更好的预测,表明大多数活动模式是在我们的样本人口中共享的。最后,我们使用广义线性模型预测短期活动模式,这表明一个简单的线性描述可能足以解释广泛的行为,无论它们是社会性的还是物理性的。
我们是否真的需要全部抓住它们?一种新的用户引导式社交媒体抓取方法
原文标题: Do we really need to catch them all? A new User-guided Social Media Crawling method
地址: http://arxiv.org/abs/1612.01734
作者: Fredrik Erlandsson, Piotr Bródka, Martin Boldt, Henric Johnson
摘要: 随着Facebook和Twitter等流行的社交媒体服务的使用日益增多,从网络收集所有内容而无需访问核心基础架构或付费,这是一项挑战。因此,如果不能收集所有的内容,就必须考虑哪些数据是最重要的。在这项工作中,我们提出了一种新颖的用户引导式社交媒体抓取方法(USMC),它能够从社交媒体收集数据,利用人群的智慧来决定用户生成的内容的收集顺序,以覆盖用户互动尽可能。 USMC通过抓取160个公共Facebook页面进行验证,其中包含3.68亿用户的内容,包括13亿次互动,并与其他两种抓取方法进行比较。结果显示,通过抽取20%的帖子,可以覆盖Facebook页面上大约75%的交互,同时将爬行时间缩短53%。另外,从20%的样本构建的社会网络,与所有帖子创建的社会网络相比,包含了75%以上的用户和边,具有相似的程度分布。
主动中介基数:算法与应用
原文标题: Active Betweenness Cardinality: Algorithms and Applications
地址: http://arxiv.org/abs/1711.10634
作者: Yusuf Ozkaya, A. Erdem Sariyuce, Umit V. Catalyurek, Ali Pinar
摘要: 诸如度数,亲密度,中介数,卡茨(Katz),PageRank等的中心等级通常用于识别图中的关键节点。这些方法基于两个限制其更广泛适用性的假设。首先,他们假定网络的确切拓扑是可用的。其次,他们不考虑网络上的活动,只依赖于拓扑结构。然而,在很多应用中,网络是自治的,广泛的,分布式的,很难收集到精确的拓扑结构。同时,节点对之间的潜在成对活动并不统一,节点的关键性强烈依赖于底层网络上的活动。在本文中,我们提出主动中介基数作为一种新的方法,其中节点临界点不是基于静态结构,而是基于网络的活动。我们展示了如何通过仅使用给定节点的本地信息来有效地计算这个度量,以及如何从少数几个节点开始找到最关键的节点。我们还展示了如何使用这个度量来监视网络和识别失败的节点。我们通过测量系统中几个节点的活动中介性基数来证明失效节点是如何被识别的,从而展示实验结果以显示有效性。
在线社会网络的成本效益种子选择
原文标题: Cost-Effective Seed Selection in Online Social Networks
地址: http://arxiv.org/abs/1711.10665
作者: Kai Han, Yuntian He, Shaojie Tang, He Huang, Chaoting Xu
摘要: 我们研究在线社会网络中的最小成本种子选择问题,其中目标是选择具有最小总成本的种子节点集合,使得网络中受影响的节点的预期数量超过预定义的阈值。我们提出了几种算法,比理论近似比和实验性能都优于以前的研究。在节点具有不同成本的情况下,我们的算法是第一个使用多项式运行时间和可证明的对数性能边界的双标准近似算法,其使用一般感染模型。在用户成本一致的情况下,我们的算法实现的对数逼近比和可证明的时间复杂度比现有算法小几个数量级。我们用真实的社会网络进行广泛的实验。实验结果表明,我们的算法在总成本和运行时间方面都明显优于现有的算法,并且规模也达到了十亿级网络。
具有惯性的Kuramoto振子的多路网络诱发爆炸同步
原文标题: Multiplexing induced explosive synchronization in Kuramoto oscillators with inertia
地址: http://arxiv.org/abs/1711.10679
作者: Ajay Deep Kachhvah, Sarika Jalan
摘要: 示出了网络上的耦合振荡器的爆炸同步(ES)源于振荡器的自然频率与相应节点的度数之间的相关性的存在。在这里,我们证明ES是二阶Kuramoto振荡器的多重网络的一般特征,并且可以在没有频度相关性的情况下存在。已知具有均匀(不均匀)度分布的二阶Kuramoto振荡器的单脉冲网络显示一阶(二阶)到同步的转换。我们报告说,具有均匀度分布的两个这样的网络的复用支持两个层中的一阶过渡,从而促进ES。更有意思的是将具有异质度分布的层与具有均匀度分布的另一层进行复用,这导致异质层中的一阶(ES)转换,其在隔离中不能显示出相同的性质。此外,我们报告说,这种在多路复用网络异构层中引起的ES跃迁可以通过改变层间和层内耦合强度来控制。我们的研究结果强调了复用的重要性或一层对其他具有固有多路或多级体系结构的系统的动态演化的影响。
使用有监督的学习方法组织行为分类
原文标题: Organized Behavior Classification of Tweet Sets using Supervised Learning Methods
地址: http://arxiv.org/abs/1711.10720
作者: Erdem Beğenilmiş, Suzan Üsküdarlı
摘要: 在2016年美国大选期间,Twitter通过机器人和雇佣人员的合作,经历了前所未有的宣传和假新闻,其分歧仍在争论中。这项工作提出了一种方法来识别微博中组织行为的存在。随机森林,支持向量机和Logistic回归算法分别用于训练一个模型,其中包含850条记录的数据集,其中包含2016年美国总统大选期间收集的来自推特的299个特征。这些特征表示用户和时间同步特征来捕捉协调的行为。这些模型经过训练,将类别中的鸣叫分类:有机vs有组织的,政治的vs非政治的,亲Trump vs亲Hillary vs都不是。随机森林算法执行得更好,每个类别的平均精确度和f-measure分数大于95%。分类的最有价值的特征被标识为基于用户的特征,媒介使用和标记推特被认为是最主要的特征。
异构信息网络嵌入推荐
原文标题: Heterogeneous Information Network Embedding for Recommendation
地址: http://arxiv.org/abs/1711.10730
作者: Chuan Shi, Binbin Hu, Wayne Xin Zhao, Philip S. Yu
摘要: 由于数据异构性建模的灵活性,异构信息网络(HIN)被用来描述推荐系统中复杂和异构的辅助数据,称为基于HIN的推荐。从HIN提取和利用信息开发基于HIN的推荐的有效方法是具有挑战性的。大多数基于HIN的推荐方法依赖于基于路径的相似度,不能充分挖掘用户和项目的潜在结构特征。在本文中,我们提出了一种新颖的基于HIN的推荐的异构网络嵌入方法,称为HERec。为了嵌入HIN,我们设计了一个基于元路径的随机游走策略,为网络嵌入生成有意义的节点序列。学习节点嵌入首先被一组融合函数转换,然后被整合到扩展矩阵分解(MF)模型中。将扩展的MF模型与融合函数一起针对评估预测任务进行联合优化。在三个真实世界的数据集上的大量实验证明了HERec模型的有效性。此外,我们还展示了HERec模型在冷启动问题上的能力,揭示了HINs的变换嵌入信息可以提高推荐性能。
无标度网络的表示学习
原文标题: Representation Learning for Scale-free Networks
地址: http://arxiv.org/abs/1711.10755
作者: Rui Feng, Yang Yang, Wenjie Hu, Fei Wu, Yueting Zhuang
摘要: 网络嵌入旨在学习网络中顶点的低维表示,同时保留网络的结构和固有特性。现有的网络嵌入工作主要集中在保持微观结构上,如顶点的一阶和二阶接近,而宏观无标度性则在很大程度上被忽略。无标度属性描绘了顶点度遵循重尾分布(即,只有少数顶点具有高度度)并且是现实世界网络(例如社会网络)的关键属性的事实。在本文中,我们研究无标度网络的学习表示问题。我们首先从理论上分析了在欧几里德空间嵌入和重建一个无标度网络的困难,把我们的问题转化为球体的包装问题。然后,提出了设计无标度特性的网络嵌入算法的“度惩罚”原则:惩罚高度顶点之间的接近度。我们分别利用谱技术和跳跃模型来介绍我们的原理的两个实现。在六个数据集上的大量实验表明,我们的算法不仅可以重建重尾分布的分布,而且还可以胜任各种网络挖掘任务(如顶点分类和链路预测)中最先进的嵌入模型。
利用社交媒体上的对话结构来识别潜在的有影响力的用户
原文标题: Leveraging Conversation Structure on Social Media to Identify Potentially Influential Users
地址: http://arxiv.org/abs/1711.10768
作者: Dario De Nart, Dante Degl’Innocenti, Marco Pavan
摘要: 社会网络有一个社区提供意见反馈,以便确定意见领袖和不喜欢的职位的用户。其他平台不支持这样的工具。了解社区对发布内容的反应是一个不小的问题。在这项工作中,我们提出了一种使用抽象论证框架和机器学习来描述用户之间交互的新颖方法。我们的实验提供的证据表明,与AAF的原语对话的流程建模可以支持识别产生持续欣赏的内容而不模拟这种内容的用户。
用谱图论解构学术促进和任期决策中的异常现象
原文标题: Deconstructing Anomalies in Academic Promotion & Tenure Decisions Using Spectral Graph Theory
地址: http://arxiv.org/abs/1711.10866
作者: Sanjoy Das
摘要: 一直以来都是有争议的。本文提出了一个基于主体的决策过程模型,使用谱图论,其中投票代理是图的顶点,根据代理之间的协同研究的程度以及它们的估计水平来确定边权重的社交互动。该模型假设研究生产力较低的代理倾向于更频繁地相互作用。利用图论理论谱,提出了一个二维影响图,将投票代理映射到一个二维网格上的点,其中可能相互影响的代理间距较近。接下来,解决了动态模型,其中投票是基于非常小的随机分配的初始值确定的,以及决策过程中的相互作用。该模型能够准确地再现由研究型大学的一个部门进行的已知的促进决策,其中涉及相当数量的具有低研究成果的投票代理人。
理解宗教原教旨强度的分析框架
原文标题: An Analytical Framework for Understanding the Intensity of Religious Fundamentalism
地址: http://arxiv.org/abs/1711.10883
作者: Navonil Bhattacharya, Arabinda Bhattacharya
摘要: 本文通过发展参数考察了宗教原教旨主义的产生过程。因此,这项研究工作反映了一个分析性的讨论,如何可以解释的经济,政治行政和法律参数,如GDP,就业人口比例,政府有效性,声音和问责制,法治(世界正义项目报告)和法治(治理指标)。
连续时间事件动态网络的块点过程模型
原文标题: The Block Point Process Model for Continuous-Time Event-Based Dynamic Networks
地址: http://arxiv.org/abs/1711.10967
作者: Ruthwik R. Junuthula, Maysam Haghdan, Kevin S. Xu, Vijay K. Devabhaktuni
摘要: 许多应用程序设置涉及对一组实体之间的时间戳关系或事件的分析,例如,在线社会网络的用户之间的消息。在这些设置中,静态和离散时间网络模型通常用作分析工具;但是,他们通过聚合事件来形成网络快照,从而丢弃大量的信息。在本文中,我们引入了一个以不规则时间间隔的事件形式连续时间演化的动态网络的块点过程模型(BPPM)。 BPPM受启发于静态网络的着名的随机块模型(SBM)的启发,是最近提出的霍克斯无限关系模型(IRM)的一个简单版本。我们显示由BPPM生成的网络遵循SBM中越来越多的节点数量的限制,并利用此属性为BPPM开发一个有效的推理过程。我们将BPPM用于多个实际的网络数据集,其中包括一个拥有超过3500个节点和130,000个事件的Facebook网络,比Hawkes IRM和其他现有的点过程网络模型大几个数量级。
女性在学术研讨会上的知名度:女性比男性提出更少的问题
原文标题: Women’s visibility in academic seminars: women ask fewer questions than men
地址: http://arxiv.org/abs/1711.10985
作者: Alecia Carter, Alyssa Croft, Dieter Lukas, Gillian Sandstrom
摘要: 在学术职业中女性的流失是一个主要的问题,特别是在科学,技术,工程和数学科目。造成这种减员的一个因素是在学术界缺乏明显的女性榜样。在早期的职业生涯阶段,当地社区的行为可能在确定团体中的榜样方面起到形成性的作用,塑造女性对于他们是否能在学术界取得成功的印象。观察榜样的一个常见和形成的环境是地方部门的学术研讨会,演讲或演讲。因此,我们通过使用观察和在线调查在研讨会上询问学者的问题来量化妇女的知名度。根据20个国家600多名学者的调查结果,我们发现,与男性相比,研讨会后女性报告的问题更少。这个印象得到了来自10个国家近250个研讨会的观察性数据的支持:女性观众成员比男性观众提出的问题绝对数量和比例要求更少。男性和女性的重要性不同,归因于不同的因素,阻止他们提出问题,女性将内部因素(例如,没有起到神经作用)评价为比男性更重要。此外,我们的观察表明,第一个提出问题的人的性别预测了随后问题中的性别不平衡,当一个男人第一个提出问题时,女性提出的问题比例较少。问题时间越长,失衡就越少,但试图控制两个部门问题的时间并不成功。我们提出了另外一些建议来提高妇女在这些事件中的知名度,并建议我们的结果最好的解释是内在化的关于自信的性别角色刻板印象。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20171130/