- 计算实验成功预测了超高频股票收益中自相关的出现;
- “你不是肯尼迪”:媒体评选总统辩论焦点;
- 用于识别NHL选秀中特殊球员的模型树;
- GraphRNN:图的深度生成模型;
- 多阶段通过社会网络传播信息的有效性;
- 初始条件对复杂网络极化的重要性;
- N-GCN:半监督节点分类的多尺度图卷积;
- 存在群间抑制的创新扩散模型;
- 流行病在含时活动驱动网络上的最优遏制;
- 解读高频率出生率的波动;
- 我会回来的:关于移动活动跟踪应用程序用户的多元生活;
- 建模相互依赖的和周期性的实际行为序列;
- 有内部和外部噪声的网络中的罕见事件;
- 复杂网络中通过自学获取知识的动态;
- 呼叫中心服务时间是对数正态分布。福克-普朗克描述;
- 空间演化博弈模型中的环境政策规制与企业合规性;
计算实验成功预测了超高频股票收益中自相关的出现
原文标题: Computational experiments successfully predict the emergence of autocorrelations in ultra-high-frequency stock returns
地址: http://arxiv.org/abs/1404.1051
作者: Jian Zhou (ECUST), Gao-Feng Gu (ECUST), Zhi-Qiang Jiang (ECUST), Xiong Xiong (TJU), Wei Chen (SZSE), Wei Zhang (TJU), Wei-Xing Zhou (ECUST)
摘要: 社会和经济系统是复杂的适应系统,其中异质因子以自组织的方式相互作用和发展,宏观法则从微观属性中出现。为了理解复杂系统的行为,基于物理和数学模型的计算实验提供了一个有用的工具。在这里,我们使用称为改进的迈克 - 法默(MMF)的现象学订单驱动模型进行计算实验,以预测订单流对超高频回报中自相关的影响,由Hurst指数$ H_r $进行量化。研究了MMF模型中嵌入的三种可能的决定因素,包括订单方向的Hurst指数$ H_s $,Hurst指数$ H_x $和所下定单相对价格的幂律尾部指数$ \ alpha_x $。计算实验预测$ H_r $与$ \ alpha_x $和$ H_x $负相关,与$ H_s $正相关。此外,$ \ alpha_x $和$ H_x $的值对$ H_r $的影响可以忽略不计,而$ H_s $对$ H_r $有显著的影响。通过从43份中国股票的订单流数据得到的实证结果,验证了MMF模型对$ H_r $对$ H_s $和$ H_x $的依赖性的预测。
“你不是肯尼迪”:媒体评选总统辩论焦点
原文标题: “You are no Jack Kennedy”: On Media Selection of Highlights from Presidential Debates
地址: http://arxiv.org/abs/1802.08690
作者: Chenhao Tan, Hao Peng, Noah A. Smith
摘要: 政治演讲和辩论在塑造政治家形象方面起着重要作用,而公众通常依靠媒体从大量话语中选择一些政治信息。了解哪些因素会影响选择过程是一个重要的研究问题。为了定量探讨选拔过程,我们建立了一个三十年的总统辩论记录和辩论后报道数据集。我们首先检查措辞的效果,并提出一个二元分类框架,控制说话人和辩论情况。我们发现,在这项任务中,众包工作者只能达到60%的准确率,这表明媒体选择并不完全明显。我们的分类器平均胜过众包工,主要是在初级辩论中。我们还将众包工人自由形式解释中的重要因素与数据驱动方法中的重要因素进行比较,并找出有趣的差异。很少有听众提到“语境很重要”,而我们的数据表明,同一位发言者的引语句比先前的话更加不同于引用较少引号的句子。最后,我们研究媒体偏好对不同字眼的总体影响,以了解媒体分散的程度。通过分析根据我们的数据引用行为构建的二部图,我们观察到两党覆盖率呈下降趋势。
用于识别NHL选秀中特殊球员的模型树
原文标题: Model Trees for Identifying Exceptional Players in the NHL Draft
地址: http://arxiv.org/abs/1802.08765
作者: Oliver Schulte, Yejia Liu, Chao Li
摘要: 起草强壮的球员对球队的成功至关重要。我们描述了一种新的数据驱动可解释的方法来评估国家冰球联盟的选秀前景。先前成功的方法已经基于玩家特征建立了预测模型,或者根据队列中可比较玩家的观察到的表现推导出性能预测。本文开发了模型树学习,它融合了基于模型和基于队列的方法的优势。模型树根据离散要素的值或连续要素的学习阈值来划分特征空间。树中的每个叶节点都定义了一组球员,这些球员很容易用曲棍球专家来描述,并带有自己的组群回归模型。与单一模型相比,模型树形成了一个增加预测能力的整体。与基于群组的方法相比,可比数据组是从数据中发现的,而不需要相似性度量。模型树的性能预测与最先进的方法相竞争,这些方法凭经验验证了我们的模型。我们在案例研究中表明,模型树玩家排名可以用来突出玩家的强弱点。
GraphRNN:图的深度生成模型
原文标题: GraphRNN: A Deep Generative Model for Graphs
地址: http://arxiv.org/abs/1802.08773
作者: Jiaxuan You, Rex Ying, Xiang Ren, William L. Hamilton, Jure Leskovec
摘要: 建模和生成图是研究生物学,工程学和社会科学网络的基础。然而,由于图的非唯一性,高维性以及给定图中边之间存在复杂的非局部依赖关系,因此对图上的复杂分布进行建模并从这些分布有效地采样是具有挑战性的。在这里我们提出GraphRNN,这是一个深度自回归模型,可以解决上述挑战,并且可以用最小的假设来近似任何图的分布。 GraphRNN学习通过对代表性图集进行训练来生成图,并将图生成过程分解为节点和边形成序列,并以迄今为止生成的图结构为条件。为了定量评估GraphRNN的性能,我们引入了基于最大平均偏差的数据集,基线和新颖评估度量的基准套件,这些度量衡量了多组图之间的距离。我们的实验显示GraphRNN明显优于所有基线,学习生成与目标集合的结构特征相匹配的不同图,同时还将比以前深度模型大50倍的图尺度。
多阶段通过社会网络传播信息的有效性
原文标题: Effectiveness of Diffusing Information through a Social Network in Multiple Phases
地址: http://arxiv.org/abs/1802.08869
作者: Swapnil Dhamal
摘要: 我们研究使用多个阶段的有效性,通过社会网络最大限度地扩大信息传播的范围,并在考虑各个方面的同时提供见解。具体而言,我们关注独立级联模型,根据前一阶段的观测扩散情况自适应地选择多个阶段的种子节点,并对现实世界网络数据集和各种播种预算值进行详细的模拟研究。我们首先提出一个否定的结果,即更多的阶段不能保证更好的传播,然而更多阶段的适应性优势通常会导致在实践中更好的传播,就像在现实世界的数据集上观察到的那样。我们研究多个阶段的扩散如何影响代表扩散程度的分布的均值和标准差。然后,我们研究阶段的数量如何影响多阶段扩散的有效性,扩散如何逐步进行,以及什么是分阶段的全部播种预算的最佳方式。我们的实验表明,当我们从单相转变为两相时收益显著,当我们进一步转向三个阶段时,我们的实验获得了可观的收益,但此后的边际收益通常不是很显著。我们的主要结论是,考虑到阶段的数量,在不同阶段划分预算的最佳方法是,每个阶段受影响的节点数量几乎相同。
初始条件对复杂网络极化的重要性
原文标题: Importance of initial conditions in the polarization of complex networks
地址: http://arxiv.org/abs/1802.08885
作者: Snehal M. Shekatkar, Sukratu Barve
摘要: 大多数现有的意见形成模式使用随机初始条件。事实上,除了一小部分人口之外,社会网络中的大多数人最初都没有意识到或漠不关心这个有争议的问题。为了探索这些特定初始条件的后果,我们研究了当两个不同的种子节点上出现冲突的想法然后根据多数规则进行传播时社会网络的极化。我们发现这些初始条件产生的结果与用随机初始条件得到的结果大不相同。我们进一步表明,一个潜在的社区结构和一个胖尾部程度分布相互竞争,以决定网络是否会极化。我们的工作表明,现有的意见动态模型应该重新评估,以纳入初始条件依赖。
N-GCN:半监督节点分类的多尺度图卷积
原文标题: N-GCN: Multi-scale Graph Convolution for Semi-supervised Node Classification
地址: http://arxiv.org/abs/1802.08888
作者: Sami Abu-El-Haija, Amol Kapoor, Bryan Perozzi, Joonseok Lee
摘要: 图卷积网络(GCNs)在图结构数据的半监督学习方面显示出显著的改进。同时,图嵌入的无监督学习受益于随机游走中包含的信息。在本文中,我们提出了一个模型:GCNs网络(N-GCN),它结合了这两个工作。 N-GCN的核心是在随机行走中在不同距离发现的节点对上训练多个GCN实例,并学习优化分类目标的实例输出组合。我们的实验表明,我们提出的N-GCN模型改进了我们考虑的所有具有挑战性的节点分类任务的最新基线:Cora,Citeseer,Pubmed和PPI。此外,我们提出的方法还具有其他所需的特性,包括对最近提出的半监督学习方法(如GraphSAGE)的推广,使我们能够提出N-SAGE,以及抵御敌对输入扰动的韧性。
存在群间抑制的创新扩散模型
原文标题: A Model for Innovation Diffusion with Intergroup Suppression
地址: http://arxiv.org/abs/1802.08943
作者: Anirban Chakraborti, Syed S. Husain, Joseph Whitmeyer
摘要: 我们提出了一种创新扩散的新模式。在这里,人口被分割成不同的群体。特定群体对一些文化产品的采用可能会被大量已经采用的自己的成员所抑制,特别是另一个采用的群体的成员也会受到阻碍。组间迁移也是允许的。我们确定平衡点并对两组人口的模型进行稳定性分析。我们还模拟了模型的离散时间版本。最后,我们介绍2012-2016年8个国家使用平板电脑的数据,并显示“25岁以下”年龄组和“55岁以上”年龄组之间的使用关系符合该模型。
流行病在含时活动驱动网络上的最优遏制
原文标题: Optimal Containment of Epidemics over Temporal Activity-Driven Networks
地址: http://arxiv.org/abs/1802.08961
作者: Masaki Ogura, Victor M. Preciado, Naoki Masuda
摘要: 在本文中,我们研究在时间和自适应网络中发生的流行病动态。基于活动驱动的网络模型,我们提出了一个自适应流行病模型,其中网络拓扑由于外部因素独立于流行动态以及个体采用的内源性预防措施而动态地改变,感染。使用马尔可夫过程对模型进行直接分析涉及转移概率矩阵的谱分析,转移概率矩阵的大小随着节点数目呈指数增长。为了克服这个限制,我们根据$ 2 \ times 2 $矩阵的特征值导出受感染节点数量的衰减率的上限。利用这个上限,我们提出了一种有效的算法来调整描述内源性预防措施的参数,以便随时间推移抑制流行病。我们通过数值模拟来证实我们的理论结果。
解读高频率出生率的波动
原文标题: Deciphering the fluctuations of high frequency birth rates
地址: http://arxiv.org/abs/1802.08966
作者: Claudiu Herteliu, Peter Richmond, Bertrand M. Roehner
摘要: 这里的术语“高频率”是指每天,每周或每月的出生数据。每日出生数的波动表现出一系列的尖峰和洼地,至少乍看之下,看起来几乎与白噪声一样随机。然而,最近几次研究发表了,包括本作者,这些研究更好地洞察了外生因素如何影响出生。其中之一涉及到不利条件(如饥荒,疾病,地震,热浪)暂时影响人口受孕能力的方式,从而在死亡波浪后9个月出生率下降。此外,宗教间断(例如在四旬期间)导致概念减少。这些以及其他影响带来了希望,我们很快就能够“读”和解释出生率模式,就像埃及学家让 - 弗朗索瓦尚普利奥设法破译许多(尽管不是全部)象形文字一样。
我会回来的:关于移动活动跟踪应用程序用户的多元生活
原文标题: I’ll Be Back: On the Multiple Lives of Users of a Mobile Activity Tracking Application
地址: http://arxiv.org/abs/1802.08972
作者: Zhiyuan Lin, Tim Althoff, Jure Leskovec
摘要: 追踪活动(如锻炼,睡眠和饮食)的移动健康应用程序正在得到广泛使用。虽然这些活动跟踪应用程序有潜力改善我们的健康状况,但用户参与度和保留率是他们成功的关键因素。但是,实际活动跟踪应用程序中的长期用户参与模式尚未得到很好的理解。在这里,我们研究了移动身体活动跟踪应用程序中的用户参与模式,该应用程序包括超过31个月超过一百万用户采取的1.15亿次记录活动。具体而言,我们表明,超过75%的用户在长时间不活动后返回并重新与应用程序进行交互,无论持续时间不活动。我们发现了一个令人惊讶的结果,即再次参与使用模式与初始参与阶段开始时的使用模式相似,而不是初始参与阶段结束时的简单延续。这种证据指向用户参与的多种生活的概念模型,扩展了用户活动的流行单一生活观点。我们证明发生这些多重生命是因为用户具有各种不同的主要意图或使用该应用程序的目标。我们发现,一旦用户达到主要目的或目标(例如体重减轻),用户更可能停止使用应用程序。然而,这些用户可能会返回一次他们原来的意图重现(例如,想要失去新增重量)。基于本研究中提出的见解,包括改善主要意图表现的标志,我们的预测模型达到71%ROC AUC。总体而言,我们的研究对建模用户重新参与健康活动跟踪应用程序建模具有影响,并对通知,推荐以及博弈化如何用于增加参与度产生影响。
建模相互依赖的和周期性的实际行为序列
原文标题: Modeling Interdependent and Periodic Real-World Action Sequences
地址: http://arxiv.org/abs/1802.09148
作者: Takeshi Kurashima, Tim Althoff, Jure Leskovec
摘要: 移动健康应用程序,包括跟踪运动,睡眠和饮食等活动的应用程序正在得到广泛应用。准确预测人类行为对于有针对性的建议是必不可少的,这些建议可以改善我们的健康和个性化这些应用。然而,由于人类行为的复杂性,做出这样的预测是非常困难的,其中包括大量随时间变化的潜在行为,相互依赖并且是周期性的。以前的工作还没有共同模拟这些动态,主要集中在物品消费模式,而不是更广泛的行为类型,如进食,上下班或锻炼。在这项工作中,我们开发了一个新颖的时变,相互依存和周期性动作序列的统计模型。我们的方法基于个性化的多变量时间点过程,通过混合高斯强度对时变动作倾向进行建模。我们的模型通过霍克斯基于过程的自激励来捕捉行为之间的短期和长期的周期性相互依赖关系。我们评估了两种活动日志数据集的方法,其中包括超过17个月的2万名用户采取的1200万次行动。我们证明,我们的方法使我们能够成功预测未来的用户行为及其时机。具体而言,我们的模型改进了对多个数据集的现有方法的行动及其时间的预测,分别高达156%和37%。对于比较罕见和周期性的行为,如步行和骑自行车,性能改进尤其大,对基线的改善高达256%。这表明,对现实世界行为的依赖性和周期性的显式建模可以成功预测未来的行为,并对建模人类行为,应用程序个性化和健康干预的目标造成影响。
有内部和外部噪声的网络中的罕见事件
原文标题: Rare events in networks with internal and external noise
地址: http://arxiv.org/abs/1802.09320
作者: J. Hindes, I. B. Schwartz
摘要: 我们研究具有内部和外部噪声的网络中的罕见事件,并发展一种通用形式来分析结对淬火技术和大偏差理论的罕见事件。作为例证,在易感染 - 易感染模型中详细考虑了罕见事件的概率分布,形状和时间尺度以用于灭绝。我们发现当存在两种类型的噪声时,随着网络规模的增加,存在交叉区域,其中大偏差的概率指数不再随网络大小线性增加。我们证明交叉的形式取决于流行状态是否位于流行阈值附近。
复杂网络中通过自学获取知识的动力学
原文标题: The Dynamics of Knowledge Acquisition via Self-Learning in Complex Networks
地址: http://arxiv.org/abs/1802.09337
作者: Thales S. Lima, Henrique F. de Arruda, Filipi N. Silva, Cesar H. Comin, Diego R. Amancio, Luciano da F. Costa
摘要: 有关知识组织和获取的研究对于理解与科学和技术相关的领域具有重要意义。模拟不同概念之间关系的常用方法是通过复杂的网络。在这样的表示中,网络的节点存储知识并且边表示它们的关系。一些考虑这种类型的结构和知识获取动态的研究采用一个或多个代理通过在网络上行走来发现节点概念。在这项研究中,我们研究了考虑单个节点作为“网络大脑”的不同类型的动力学。这样的大脑代表了一系列真实的系统,例如一个人获得并存储在大脑中的环境信息。要将发现的信息存储在特定节点中,代理将在网络上行走并返回大脑。我们提出了三种不同的动态,并在几种网络模型和真实系统上进行测试,这些系统由期刊文章及其各自的引用形成。 {令人惊讶的是,结果显示,根据所采用的步行模式,自我知识获取的效率对网络大脑的拓扑结构,搜索策略和本地化的依赖性较弱。
呼叫中心服务时间是对数正态分布。福克-普朗克描述
原文标题: Call center service times are lognormal. A Fokker–Planck description
地址: http://arxiv.org/abs/1802.09398
作者: Stefano Gualandi, Giuseppe Toscani
摘要: 呼叫中心是代理商提供电话服务的服务网络。呼叫中心运营的一个重要部分是服务时间。在最近对实际数据的统计分析中,已经注意到服务时间的分布显示出与对数正态分布的显著拟合。在本文中,我们通过采用多智能体系统的统计力学的经典方法来讨论这种行为的可能来源。根据Kahneman和Twersky的前景理论的精神,建立了导致具有对数正态平衡密度的线性动力学方程的微观服役时间变化作为决策的主要标准,其为合适的值函数。
空间演化博弈模型中的环境政策规制与企业合规性
原文标题: Environmental Policy Regulation and Corporate Compliance in a Spatial Evolutionary Game Model
地址: http://arxiv.org/abs/1802.09406
作者: Gabriel Meyer Salomão, André Barreira da Silva Rocha
摘要: 我们使用演化博弈模型来研究政策制定者在一个面临污染陷阱的国家所推行的企业环境合规与执法之间的相互作用,即绝大多数企业没有内部化其污染负面外部性的情景和审计人员不检查公司。这场博弈冲突是由于公司在污染和未检查的情况下富裕程度的平衡,而当审计师不需要检查负责技术生产决策中污染的社会责任公司时,社会福利最大化使用和排放水平。从混合良好的两种群体博弈模型开始,没有长期均衡,污染者和推卸责任的审计人员的份额随着时间的推移而持续振荡。相比之下,当公司和审计师被分配到一个空间网络中时,博弈会根据检查成本显示出丰富的动态。虽然振荡行为仍然是可能的,但是有一套参数可以实现长期稳健的平衡,同时该国离开污染陷阱。另一方面,过高的检查成本会导致审计过程无效,只有少数合规企业被赶出国外。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20180227/