- tau轻粒子分支比是否服从本福德定律?;
- 书面文本句子长度的稳健性;
- 奥运比赛的引力模型;
- SURREAL:子图稳健的表示学习;
- 分层网络和网络的网络的渗流;
- 局部疫苗接种和疫苗数量有限情况时流行病传播中的多次爆发;
- 当政治家谈论政治:识别巴西国会议员的政治推文;
tau轻粒子分支比是否服从本福德定律?
原文标题: Do tau lepton branching fractions obey Benford’s law?
地址: http://arxiv.org/abs/1709.09823
作者: Aisha Dantuluri, Shantanu Desai
摘要: 根据本福德定律,许多数据集中最重要的数字不是均匀分布的,而是服从一个明确定义的幂律分布,而更小的数字更经常出现。在众多可用的粒子物理数据集之一中,我们发现$ \ tau $ lepton分支分数的前十进制数字与Benford分布预期的对数行为显示边界不一致。我们使用对二项数据有效的$ \ chi ^ 2 $函数来量化与Benford定律的偏差,并且获得九个自由度的16.9的$ \ chi ^ 2 $值,其给出$ p $ -value约5 %,对应于1.6 $ \ sigma $分歧。我们还检查了在扩大分支比例的情况下分歧依然存在,并且通过用基数不同于10的数字系统重新进行分析。在所有数字中,“9”表示最大差异超过4美元/西格玛$。这种差异是因为对于三组不同的相关模式重复数字“9”,每组有两或三个频率,导致重复计数。如果我们只计算一组相关模式一次,这个数字的差异也会消失,并且我们会与本福德分布得到原始的一致。
书面文本句子长度的稳健性
原文标题: Robustness of sentence length measures in written texts
地址: http://arxiv.org/abs/1805.01460
作者: Denner S. Vieira, Sergio Picoli, Renio S. Mendes
摘要: 书面文本中的隐藏结构模式在过去几十年中一直是相当大的研究课题。特别是,将文本映射为句子长度的时间序列是调查文本结构的一种自然方式。通常,通过使用基于单词数量和字符数量的量度来对句子长度进行量化,但是其他变体也是可能的。为了量化不同句子长度量度的稳健性,我们分析了一个包含约五百本英文书籍的数据库。对于每本书,我们提取了六种不同的句子长度度量,包括字数和字符数(考虑到词形和停用词的删除)。我们通过使用i)Pearson系数来调查每一本书的这六个度量来调查线性相关性; ii)Kolmogorov - Smirnov检验比较分布;和iii)去趋势波动分析(DFA)来量化自相关。我们发现,所有六个措施都表现出非常相似的行为,这表明句子长度是与文本结构有关的强有力措施。
奥运比赛的引力模型
原文标题: Gravity model for dyadic Olympic competitions
地址: http://arxiv.org/abs/1805.01488
作者: Hyeseung Choi, Hyungsoo Woo, Ji-Hyun Kim, Jae-Suk Yang
摘要: 在奥运会上,代表国家的专业运动员不分经济,政治和文化差异而竞争。在这项研究中,我们应用引力模型来观察特征,以夏季奥运期间直接相互竞争的国家之间的距离来表示。我们使用由1952年至2016年奥运会奖牌获胜国组成的二元数据。为了比较冷战期间和之后的动态变化,我们将数据分为两个时间段(1952-1988年和1992-2016年)。我们的研究与以往的研究有所不同,我们在观察奥运动态时重新引入了引力模型的应用。我们的研究结果表明,在整个研究期间,参加奥运会决赛比赛的国家在经济规模上趋于相似。冷战后,更频繁竞争的国家对往往在遗传起源上相似。
SURREAL:子图稳健的表示学习
原文标题: SURREAL: SUbgraph Robust REpresentAtion Learning
地址: http://arxiv.org/abs/1805.01509
作者: Saba A. Al-Sayouri, Danai Koutra, Evangelos E. Papalexakis, Sarah S. Lam
摘要: 图嵌入或节点表示学习在各种下游任务(如节点分类,链路预测和推荐系统)中的成功导致其近年来受到欢迎。表示学习算法旨在通过识别节点邻域概念来保持局部和全局网络结构。然而,许多现有的算法生成的嵌入不能适当地保留网络结构,或者导致由于随机过程(例如随机游走产生上下文)而导致不稳定的表示,并且因此不能产生多图问题。在本文中,我们提出了一个使用连接子图算法的稳健图嵌入算法,题为SURREAL,一种新颖的稳定图嵌入算法框架。 SURREAL通过使用图与电路的类比来学习使用连接子图的图表示。它保留了本地和全球连接模式,并解决了高度节点的问题。此外,它利用弱基线和被基线忽略的元数据的优势。实验表明,SURREAL在多标签分类问题上的性能优于最新算法,最高可达36.85%。此外,与基线相反,SURREAL是确定性的,是完全稳定的。
分层网络和网络的网络的渗流
原文标题: Percolation of Hierarchical Networks and Networks of Networks
地址: http://arxiv.org/abs/1805.01522
作者: Louis M. Shekhtman, Shlomo Havlin
摘要: 许多工作致力于在不同程度的故障下研究网络和互相依赖的网络的渗透。研究人员已经考虑了许多不同的现实网络结构,但迄今为止还没有研究将许多网络的分层结构结合起来。例如,跨城市的基础设施可能会被分配,使得节点在小型社区内紧密连接,整个城市的连接稍差,并且城市之间的连接更少。此外,虽然以前的工作确定了互联节点,但是这些节点与邻近区域之外的链接更容易受到攻击,这里我们有各种级别的互连(邻居之间,城市之间等等)。我们认为最高级别互连的节点最有可能受到攻击,其次是那些互连级别较高的节点,等等。我们为这种结构的单个和相互依赖的网络开发了一个分析解决方案,并通过仿真来验证我们的理论。我们发现,根据层次结构中层次的数量,巨型组件(互连节点的一部分)中可能存在多个转换,因为网络在各个层次分离。我们的结果表明,这些多跳是分层网络的一个特征,并且可能会影响基础架构网络的脆弱性。
局部疫苗接种和疫苗数量有限情况时流行病传播中的多次爆发
原文标题: Multiple outbreaks in epidemic spreading with local vaccination and limited vaccines
地址: http://arxiv.org/abs/1805.01564
作者: M. A. Di Muro, L. G. Alvarez-Zuzek, S. Havlin, L. A. Braunstein
摘要: 如何预防人类疾病的传播对科学界来说是一个巨大的挑战,迄今为止已有许多研究开发了免疫策略。然而,这些策略通常不认为医疗机构可能有限的疫苗资源。在这份手稿中,我们探讨了采用局部动态疫苗接种的易感染 - 感染复原(SIR)模型,并考虑了有限的疫苗。在这个模型中,与感染者接触的易感者以概率$ \ omega $接种疫苗,然后以概率$ \ beta $感染。但是,当免疫个体的部分达到阈值$ V_L $时,接种停止,之后只有感染是可能的。在稳定状态下,除了临界点$ \ beta_c $和$ \ omega_c $,它们将非流行病与流行病相区分开来以外,我们还发现了另一个$Vβ$的变化点$ \ beta ^ *> \ beta_c $和$ \ omega ^ * <\ omega_c $,这对应于一种新颖的不连续相变。这个临界值将疫苗数量充足的阶段与疾病强度足以用尽所有疫苗接种单位的阶段分开。对于固定$ \ beta $的疾病,可以控制疫苗接种概率$ \ omega $,以便大幅度减少受感染个体的数量,从而有效利用可用疫苗。此外,系统的时间演变接近$ \ beta ^ * $或$ \ omega ^ * $,表明在感染高峰后,系统进入准静止状态,只有少数感染病例。但是如果没有更多的疫苗,这些少数感染者可能会发起第二次爆发,以第二次感染高峰为代表。这种明显的冷静状态可能是危险的,因为它可能导致误导性的结论并放弃控制疾病的策略。
当政治家谈论政治:识别巴西国会议员的政治推文
原文标题: When Politicians Talk About Politics: Identifying Political Tweets of Brazilian Congressmen
地址: http://arxiv.org/abs/1805.01589
作者: Lucas S. Oliveira, Pedro O. S. Vaz de Melo, Marcelo S. Amaral, José Antônio. G. Pinho
摘要: 自2013年6月,当巴西面临一代人中最大规模和最重要的群体抗议活动时,政治危机正在发生。在这场危机中,巴西政客利用社交媒体与选民沟通,以保留或增加其政治资本。问题在于许多有争议的话题正在过程中,议员可能更愿意在他们的信息中避免这些主题。为了表征这种行为,我们提出了一种方法,可以准确识别发布它的代理商和发布时间的政治和非政治推文。此外,我们收集了所有在Twitter上活跃并在2013年10月至2017年10月期间在巴西议会工作的议员的推文。为了评估我们的方法,我们使用了词云和主题模型来确定主要的政治和非政治潜在主题在议会的推文。这两个结果都表明我们的提案能够准确区分政治和非政治推文。此外,我们的分析显示了一个显著的事实:巴西代表发布的信息中超过一半是非政治性的。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20180507/