- 社会和通信网络中弱连接的注意力;
- 截断选择和扩散随机图;
- 复杂网络的凸骨架;
- 节点链接和矩阵表示的再次实验比较;
- “取得”发生:社会和语言背景对词汇创新成功的影响;
- 电子邮件附件值得一千个字,是么?;
- 绘制没有时间片的动态图;
- 用夏普特征向量偏差估计混合成员;
社会和通信网络中弱连接的注意力
地址: http://arxiv.org/abs/1505.02399
作者: Lilian Weng, Márton Karsai, Nicola Perra, Filippo Menczer, Alessandro Flammini
摘要: Granovetter的弱连接社会网络理论是建立在两个中心假设之上的。第一个说强社会关系承载了绝大多数互动事件;第二个观点认为,弱社会关系虽然较不活跃,但往往与交换特别重要的信息有关(例如Granovetter研究中潜在的新工作)。虽然一些实证研究为第一个假设提供了支持,但第二个问题却是受到的关注不大。一个可能的原因是它涉及到难以量化和测量的信息的性质和重要性的概念,特别是在大规模研究中。在这里,我们搜索Granovetter假设的经验验证。我们发现了明确的实证支持假设一。我们也提供了假设二的实证证据和定量解释。我们发现,使用专门用于特定社会关系的互动比例作为注意力度量时,弱连接得分很高,这可能反映了这种连接的假定信息目的,不过这种现象也出现在强连接上。来自在线社交媒体和移动通信的数据在平台的典型用途的基础上,揭示了这两种效应的依赖网络的相关混合。我们的研究结果在社会关系的注意力、重要性和强度之间建立了明确的关系,并可能实现改进算法来优化社交媒体内容。
截断选择和扩散随机图
地址: http://arxiv.org/abs/1709.00073
作者: Bryce Morsky, Chris T. Bauch
摘要: 文献中已经广泛研究了图上的两个策略进化博弈。已经探索了各种图结构,图动力学程度和复制器的行为。这些模式主要是在促进合作的框架下进行了研究,而且很多优秀的工作揭示了这一领域的研究。然而,由于大多数模型采用比例选择(让人联想到复制者方程式)或“模仿最好”,所以截断选择几乎没有得到注意。这里我们系统地探索随机图上的截断选择,其中淘汰低于适应度阈值的复制者,并且所有幸存者的再现概率相等。我们采用这种方法的两种变体:独立截断,其中阈值是固定的;和依赖截断,这是“模仿最好的”的概括。此外,我们在以下操作顺序中探讨扩散对网络的影响:扩散战斗后代(DCO)和战斗扩散后代(CDO)。对于独立截断,我们发现由适应度阈值确定的三个方案:合作随着提高阈值而减小;合作开始上升,提高门槛,存在促进合作的最优门槛;整个人口灭绝。我们发现依赖截断对博弈的影响不同;较低的水平降低了鹰鹰博弈的合作,并增加了猎鹰,更高的水平产生了相反的效果。 DCO减少静态情况下的合作。然而,CDO与静态情况大致相同或更多的合作。
复杂网络的凸骨架
地址: http://arxiv.org/abs/1709.00255
作者: Lovro Šubelj
摘要: 凸网络可以被定义为其中每个连接的诱导子图包括其节点之间的所有最短路径。因此,完全凸网络将是在树上拼接在一起的集合。在本文中,我们研究了通过去除最少数量的边获得的经验网络的最大高凸度部分,我们称之为凸骨架。凸骨架是网络生成树的概括,其中每个边可以被任意大小的团替代。我们提出了不同的提取凸骨架的方法,并将其应用于社会协作和蛋白质相互作用网络,自主系统图和食物网。我们提取的凸骨架保留度数分布,聚类,连通性以及节点之间的距离,同时使得节点之间的最短路径唯一。此外,在斯洛文尼亚计算机科学家共同着作网络中,一个凸骨架保留了作者之间最强的联系,与生成树或高中骨架和高突出骨架不同。因此,一个凸骨架代表了一个网络主干的简单定义,在共同着作和其他社会协作网络中有应用。
节点链接和矩阵表示的再次实验比较
地址: http://arxiv.org/abs/1709.00293
作者: Mershack Okoe, Radu Jianu, Stephen Kobourov
摘要: 可视化网络数据适用于生物学,工程学和社会科学等领域。我们报告一项研究的结果,比较了显示网络数据的两种主要技术的有效性:节点链接图和邻接矩阵。具体来说,大量在线参与者的评估显示了两种可视化之间的统计学显着性差异。我们的工作以多种方式增加了现有研究。首先,我们探索广泛的网络任务,其中许多网络任务以前没有被评估过。其次,我们的研究使用了一个大型数据集,这是很多现代生活网络的典型代表,并没有被以前的研究所探讨。第三,我们利用众包来评估许多参与者的许多任务。
“取得”发生:社会和语言背景对词汇创新成功的影响
地址: http://arxiv.org/abs/1709.00345
作者: Ian Stewart, Jacob Eisenstein
摘要: 在线社区,新词来来去去:今天的“哈哈”可能会被明天的“lulz”所取代。在线写作的变化通常被研究为一个社会过程,词汇创新通过个人网络在一个言语界传播。但与其他类型的创新不同,语言变化的形式和制度受制于其中。为了调查语言变化中的社会和结构因素之间的联系,我们对在线社区Reddit中的词汇创新进行了大规模的分析。我们发现,跨越许多语言环境的传播是成功的标志:出现在更多语言背景下的词语增长速度更快,寿命更长。此外,社会和情境传播是互补的。通过结合它们,可以预测哪些创新将会坚持,并预测其他人何时开始下降。
电子邮件附件值得一千个字,是么?
地址: http://arxiv.org/abs/1709.00362
作者: Gregory Tsipenyuk, Jon Crowcroft
摘要: 社会网络分析(SNA)基于电子邮件档案的广泛研究。分析中使用的网络通常通过捕获From,To,Cc和Bcc电子邮件标题字段中的电子邮件通信或电子邮件中包含的实体来提取。在后一种情况下,实体可以是例如一个单词,URL,名称,电话等等。它还可以包括附件的文本内容,例如Microsoft Word文档,excel电子表格或Adobe pdf。该网络中的节点表示用户和实体。边表示用户之间的通信和与实体的关系。我们建议采取不同的方式来网络提取和使用用户之间共享的附件作为边。这个动机是双重的。首先,附件代表了关系力量的“亲密”表现。第二,我们收集的私人电子邮件档案和安然电子邮件语料库的统计分析显示,附件对归档的磁盘空间使用率平均约为80-90%,这意味着目前大多数数据在SNA中被忽略电子邮件档案。因此,我们假设这种方法可能会更深入地了解电子邮件归档的社会结构。我们从Enron电子邮件语料库中提取通信和共享附件网络。我们进一步分析两个网络的程度,介数中心性,亲密度和特征向量中心度量,并对差异进行了分析,并从中了解了这些差异。我们使用最近邻算法为五个安然员工生成相似组。这些组织与安然公司的组织结构图一致,证明了我们的方法。
绘制没有时间片的动态图
地址: http://arxiv.org/abs/1709.00372
作者: Paolo Simonetto, Daniel Archambault, Stephen Kobourov
摘要: 时间片通常用于绘制和可视化动态图。虽然时间片是一种思考动态图的自然方法,但它们通常被用于连续数据。通常,不清楚选择多少次次数:太少的次数可能会错过时间特征,如因果关系或甚至图结构,而太多的次数会减慢绘图计算。我们提出一个不基于时间片的动态图模型,以及动态图绘制算法DynNoSlice,用于在该模型中绘制图。在我们的评估中,我们展示了这种方法在连续数据集上的优势。
用夏普特征向量偏差估计混合成员
地址: http://arxiv.org/abs/1709.00407
作者: Xueyu Mao, Purnamrita Sarkar, Deepayan Chakrabarti
摘要: 现实世界网络通常具有属于多个社区的节点。虽然传统的社区检测方法侧重于不重叠的社区(一个节点可以属于一个社区),但最近却引起了重叠社区的问题。虽然存在可靠一致的算法,但是他们或者对难以检查的人口进行假设[citang {zhang2014detecting}),或者计算量太大\ citep {MMSBAnandkumar2014}。我们考虑在流行的混合成员随机块模型(MMSB)\ cite {airoldi2008混合}下检测重叠社区。使用该模型的固有几何,我们将重叠社区的推论与在噪声旋转和尺度单纯形中找到角的问题联系起来,对于该模型,一致的算法存在\ citep {gillis2014fast}。我们使用它作为我们的算法的构建块来推断每个节点的社区成员资格,并证明其一致性。作为我们分析的副产品,我们得出了清晰的行方向特征向量偏差界限,并提供了清理步骤,为稀疏网络提高了性能。我们还提出了模型可识别性的必要条件和充分条件,而现有的方法通常为所涉及模型的可识别性提供足够的条件。我们的方法的经验性能使用模拟和真实数据集显示,最多可以扩展到100,000个节点。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客 https://netsci.complexly.cn 进行更新,并提供RSS订阅。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20170904/