- 合作会更好吗?检验多个作者,机构和部门之间的科学合作;
- 传染性增强了Twitter中病毒级联的预测;
- 异构信息网络的元路径和元图联合嵌入;
- 语言文化演变中的规范变化动力学;
- NNCP:基于深度神经网络学习技术的引用数预测方法;
- 图高斯过程的贝叶斯半监督学习;
- 最大化社会网络中的曝光多样性;
- 简单性创造了不公平:对公平,刻板印象和可解释性的影响;
合作会更好吗?检验多个作者,机构和部门之间的科学合作
原文标题: Is together better? Examining scientific collaborations across multiple authors, institutions, and departments
地址: http://arxiv.org/abs/1809.04093
作者: Lovenoor Aulck, Kishore Vasan, Jevin West
摘要: 合作是科学研究和出版的一个组成部分。过去,访问大型语料库限制了可以调查合作问题的方式。然而,随着数据/元数据质量和访问的改进,有可能以超出传统多重作者定义的方式探索研究协作的想法。在本文中,我们通过三种不同的合作视角来检验科学作品:跨多个作者,多个机构和多个部门。我们认为这是对多个部门合作的第一次看法,因为我们采用广泛的数据管理来消除作者对近7万篇科学论文的部门关联。然后,我们比较了不同协作定义中的引文指标,发现定义为协作的论文比非协作论文更频繁被引用,无论使用的协作定义如何。我们还通过分析类似领域(由共同引用确定)在作品上合作的程度(由共同作者确定)来分析共同引用和共同作者之间关系的初步结果。这些初步结果揭示了在机构间合作方面的分割趋势,并显示了扩大的承诺。
传染性增强了Twitter中病毒级联的预测
原文标题: Infectivity Enhances Prediction of Viral Cascades in Twitter
地址: http://arxiv.org/abs/1809.04104
作者: Weihua Li, Skyler J. Cranmer, Zhiming Zheng, Peter J. Mucha
摘要: 最初为传染病开发的传染动力学模型已经证明与在线社会系统中的信息,新闻和政治观点的研究相关。建模扩散过程和预测病毒信息级联是网络科学中的重要问题。然而,许多信息级联研究忽视了不同信息之间的传染性变化。在这里,我们采用在线级联的早期观察来估计不同信息的传染性。使用来自真实世界Twitter转发的模拟和数据,我们证明这些估计的感染性可用于改进对信息级联的病毒性的预测。开发我们的模拟模拟现实世界的数据,我们考虑有限的有效时间对级联传输的影响,并证明一个简单的模型,缓慢但不可忽略的传染性衰减捕获转推分布的基本属性。这些结果证明了推文的内在感染性与其扩散的复杂网络环境之间的相互作用,强烈影响了成为病毒级联的可能性。
异构信息网络的元路径和元图联合嵌入
原文标题: Joint Embedding of Meta-Path and Meta-Graph for Heterogeneous Information Networks
地址: http://arxiv.org/abs/1809.04110
作者: Lichao Sun, Lifang He, Zhipeng Huang, Bokai Cao, Congying Xia, Xiaokai Wei, Philip S. Yu
摘要: 元图是当前异构信息网络上相似性搜索的最强大工具,其中元图是捕获复杂结构信息的元路径的组合。然而,基于元图的当前相关性计算仅考虑复杂的结构信息,而忽略其嵌入的元路径信息。为了解决这个问题,我们提出了基于META-GrAph的网络嵌入模型,分别称为MEGA和MEGA ++。 MEGA模型使用归一化的相关性或相似性度量,这些度量是从元图及其在节点之间的嵌入式元路径同时导出的,然后利用张量分解方法来执行节点嵌入。 MEGA ++进一步促进了耦合张量矩阵分解方法的使用,以获得节点的联合嵌入,同时考虑元图的所有元信息的隐藏关系。对两个真实数据集的广泛实验表明,MAGA和MEGA ++更有效比最先进的方法。
语言文化演变中的规范变化动力学
原文标题: The Dynamics of Norm Change in the Cultural Evolution of Language
地址: http://arxiv.org/abs/1809.04328
作者: Roberta Amato, Lucas Lacasa, Albert Díaz-Guilera, Andrea Baronchelli
摘要: 当一个新的社会习俗取代旧的会议时会发生什么?虽然很长一段时间以来已经确定了有利于规范变化的可能力量 - 例如机构或承诺的积极分子 - 但由于难以找到有代表性的数据,人们很少知道人们如何采用新的公约。在这里,我们通过分析1800年到2008年间出版的大量书籍,对英语和西班牙语中的2,541个正字法和词汇规范进行了更改,从而解决了这个问题。我们根据是否在数据中检测到三种截然不同的模式。行为改变源于正式制度,非正式权威或不受管制的演化的自发过程。我们提出了一个简单的演化模型,能够捕获所有观察到的行为,并且我们证明它可以定量地再现经验数据。这项工作确定了规范变化的一般机制,我们预计研究语言的文化演变以及更广泛的人类集体行为的研究人员会感兴趣。
NNCP:基于深度神经网络学习技术的引用数预测方法
原文标题: NNCP: A citation count prediction methodology based on deep neural network learning techniques
地址: http://arxiv.org/abs/1809.04365
作者: Ali Abrishami, Sadegh Aliakbary
摘要: 随着世界范围内发表的科学论文数量不断增加,对研究论文的评估和质量评估方法的需求也在增加。科学计量学,信息计量学和文献计量学等科学领域为科学论文建立了量化分析方法和测量。在这方面,一个重要的问题是预测已发表论文的未来影响力。特别是,有影响力的论文和无足轻重的论文之间的早期歧视可能会找到重要的应用。在这方面,最重要的指标之一是论文的引用次数,因为该指标在科学出版物的评估中被广泛使用,而且,它还作为许多其他指标(如h-index)的基础。在本文中,我们提出了一种新方法,用于根据出版后最初几年中引文的数量来预测论文的长期引用。为了训练引文预测模型,我们采用了人工神经网络,这是一种功能强大的机器学习工具,最近在包括图像和文本处理在内的许多领域都有不断增长的应用。经验实验表明,我们提出的方法在引用次数的年度和总预测中都超过了预测准确性方面的最新方法。
图高斯过程的贝叶斯半监督学习
原文标题: Bayesian Semi-supervised Learning with Graph Gaussian Processes
地址: http://arxiv.org/abs/1809.04379
作者: Yin Cheng Ng, Ricardo Silva
摘要: 我们提出了一种基于数据的高斯过程贝叶斯方法来处理图上的半监督学习问题。与半监督学习基准实验中最先进的图神经网络相比,所提出的模型显示出极具竞争力的性能,并且在标签稀缺的主动学习实验中优于神经网络。此外,该模型不需要用于早期停止的验证数据集来控制过度拟合。我们的模型可以看作是通过网络连接在本地加权的经验分布回归的一个实例。我们通过贝叶斯线性模型解释进一步激发模型的直观构造,其中节点特征由与拉普拉斯图相关的算子过滤。通过为高斯过程调整现成的可扩展变分推理算法,可以容易地实现该方法。
最大化社会网络中的曝光多样性
原文标题: Maximizing the Diversity of Exposure in a Social Network
地址: http://arxiv.org/abs/1809.04393
作者: Cigdem Aslay, Antonis Matakos, Esther Galbrun, Aristides Gionis
摘要: 社交媒体平台为公民提供了保持信息和参与公共辩论的新方法。然而,为了建立一个健康的信息共享,社会审议和意见形成的环境,公民需要接触到充分多样化的观点,这些观点挑战他们的假设,而不是被困在过滤泡沫中。在本文中,我们朝这个方向迈出了一步,并提出了一种新方法,以最大化社会网络中的曝光多样性。我们在信息传播的背景下制定问题,作为向选定用户推荐少量新闻文章的任务。我们提出了一个现实的设置,我们会考虑内容和用户倾向,以及进一步分享文章的可能性。此设置使我们能够在最大化信息传播和确保用户接触不同观点之间取得平衡。产生的问题可以被转换为最大化单调和子模块函数,受制于对用户分配文章的拟阵约束。这是影响最大化问题的一个具有挑战性的概括。然而,我们能够通过引入随机反向可达集概念的新扩展来设计可伸缩近似算法。我们通过实验证明了算法在几个真实数据集上的效率和可扩展性。
简单性创造了不公平:对公平,刻板印象和可解释性的影响
原文标题: Simplicity Creates Inequity: Implications for Fairness, Stereotypes, and Interpretability
地址: http://arxiv.org/abs/1809.04578
作者: Jon Kleinberg, Sendhil Mullainathan
摘要: 算法预测越来越多地用于帮助或在某些情况下取代人类决策,这种发展对机器学习过程的输出提出了新的要求。为了促进人类交互,我们希望它们输出以某种方式简单或可解释的预测函数。而且因为它们会影响相应的决策,我们也需要公平的预测功能,这些功能的分配有利于(或至少不会伤害)弱势群体。我们开发了一个正式模型来探索简单与公平之间的关系。虽然这两个概念似乎是由定性不同的目标驱动的,但我们的主要结果显示它们之间存在根本的不一致。具体来说,我们形成了一个生成简单预测函数的通用框架,在这个框架中,我们表明每个简单的预测函数都是严格改进的:存在一个更复杂的预测函数,它既严格更高效又更严格地更公平。换句话说,使用简单的预测功能既可以降低弱势群体的效用,又可以降低整体福利。我们的结果不仅与算法有关,而且与任何产生简单模型的过程有关,因此与刻板印象的心理学和早期关于统计歧视的经济学文献有关。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20180913/