Arxiv网络科学论文摘要21篇(2017-05-30)

  • 建模不同意见的动态;
  • BiFold可视化的二分数据集;
  • 在Twitter上挖掘健康和疾病事件:验证印度尼西亚境内的搜索协议;
  • 多重词汇网络揭示了儿童早期词汇习得的模式;
  • 希尔伯特变换,分析信号和图信号处理的调制分析;
  • SIGNet:用于符号网络的可扩展嵌入;
  • 社区认同和用户参与多社区景观;
  • 精神词汇的复合模型揭示了人类的爆炸性学习;
  • 动态拓扑结构社会网络社会力量演进;
  • 一种用于分析城市能源分配网络的多层次代理模型;
  • 一个病毒时间轴分支过程研究一个社交网络;
  • 相互依赖网络中的普遍性和尺度规律:愈合模型和有限范围相互依赖的情况;
  • 机器学习为三维离散裂缝网络的图表示;
  • 潜入恶魔的殖民地 - 在线社交网络中的虚构人物;
  • 加强或破坏给定网络的最佳成本;
  • 头部放置最大化可预测性。信息论方法;
  • 从Twitter数据流中提取城市事件的深层次多视图学习框架;
  • 传播学习网络结构;
  • 互惠驱动的稀疏网络形成;
  • 具有给定幂律度分布的稀疏最大熵随机图;
  • 从简单的配置模型构建和有效的采样;

建模不同意见的动态

地址: http://arxiv.org/abs/1603.01980

作者: Eun Lee, Petter Holme, Sang Hoon Lee

摘要: 我们调查组成由具有不同等级的代理人组成的专制社会的权威意见形成。我们探讨由权威领导人所持有的“肯定”意见的环境中传播的低级别,听话人或权威性低的人的“异议”观点。一个现实世界的例子将是一个腐败的社会,人们反对这样的领导人,但它可以应用于更广泛的情况。在我们的模型中,代理人可以根据他们相对于邻居的权威和他们自己的信心水平来改变他们的观点。另外,在某种可能性的情况下,代理人可以超越肯定的意见来接受邻居的反对意见。基于分析推导和数值模拟,我们观察到网络结构和权威异质性及其相关性对于反对意见在群体中传播的可能性有重大影响。特别是当权力分配非常不均匀,权力与人口邻居数量存在正相关关系时,反对意见被压制。除了这样一个极端的情况之外,反对意见的传播是在人们倾向于超越持有异议意见的权力的情况下发生的,但反对意见可能需要很长时间才能传播到整个社会,这取决于模型参数。我们认为,代理人的内部社会结构将时间的规模设定在达成共识的基础上,基于对意见传播的潜在结构性质的分析。

BiFold可视化的二分数据集

地址: http://arxiv.org/abs/1606.06159

作者: Yazhen Jiang, Joseph Skufca, Jie Sun

摘要: 数据启用科学的新兴领域需要开发用于知识发现的算法和工具。通过良好构造的图表示与数据的人际交互可以特别有利于我们的视觉能力来识别模式。我们开发了一个称为BiFold的数据可视化框架,用于对描述对象组之间的二元关系的二分数据集的探索性分析。典型的数据示例将包括投票记录,组织成员身份,成对关联或其他二进制数据集。 BiFold提供了通过视觉近似表示相似性的数据的低维嵌入,类似于多维尺度(MDS)。 BiFold的独特和新特性是能够同时捕获对象之间的组内和组间关系,从而增强知识发现。我们使用{\ it Southern Women Dataset}对BiFold进行基准测试,社交群体现在在视觉上显现。我们为两个美国投票数据集构建BiFold图:对于自1976年以来的总统选举结果,BiFold说明了这些选举结果的不断演变的地缘政治结构。参议院国会投票,BiFold确定了一个党派协调,将参议员分为两方,同时将两党联合协调一致,捕捉了票据的最终命运(通过/失败)。最后,我们考虑食谱和食物成分之间关联的全球美食数据集。 BiFold允许我们在视觉上比较和对比美食,同时还可以识别个人美食的特色成分。

在Twitter上挖掘健康和疾病事件:验证印度尼西亚境内的搜索协议

地址: http://arxiv.org/abs/1608.05910

作者: Aditya L. Ramadona, Rendra Agusta, Sulistyawati, Lutfan Lazuardi, Anwar D. Cahyono, Åsa Holmner, Fatwa S.T. Dewi, Hari Kusnanto, Joacim Röcklov

摘要: 本研究旨在使用Twitter数据来验证不健康相关术语的搜索协议,后者可用于了解Twitter如何以及如何揭示当前健康状况的信息。我们使用一组预定义的关键词,在Twitter上提取与健康和疾病发布相关的对话,评估这些内容在这些对话中的流行率,频率和时间,并验证了该搜索协议如何能够检测相关的疾病推文。使用分类和回归树(CART)算法来训练和测试与我们团队确定的疾病和健康命中的搜索协议。预测的准确性显示出良好的有效性,AUC超过0.8。我们的研究表明,Twitter上的公众情绪监测可以用作健康事件的实时代理。

多重词汇网络揭示了儿童早期词汇习得的模式

地址: http://arxiv.org/abs/1609.03207

作者: Massimo Stella, Nicole M. Beckage, Markus Brede

摘要: 语言的网络模型提供了一种将认知过程与语言的结构和连接相关联的方式。然而,目前的方法的一个缺点是一次只关注一种类型的语言关系,缺少语言的复杂多关系性质。在这项工作中,我们克服了这一限制,通过对英语学习者的心理词典进行建模,将其作为复合词汇网络,即根据四种类型的关系N = 529个单词/节点进行连接的多层网络:(i)协会,(ii)特征共享,(iii)共同发生,(iv)语音相似性。我们提供所得到的多路复用的拓扑结构的分析,然后继续评估单层以及完整的多重结构对预测英语学习者的经验观测年龄的能力。我们发现,新兴的多路网络拓扑是获取认知过程的重要代用,能够捕获紧急词汇结构。事实上,我们表明,在预测采集单词的顺序时,复用拓扑在本质上比单个层更强大。此外,多元分析允许在早期学习者中定量词汇获取的不同阶段:尽管最初所有的多重层都有助于词语学习,但在约23个自由协会率先驾驭词语习得之后。

希尔伯特变换,分析信号和图信号处理的调制分析

地址: http://arxiv.org/abs/1611.05269

作者: Arun Venkitaraman, Saikat Chatterjee, Peter Händel

摘要: 我们提出希尔伯特变换(HT)和分析信号(AS)结构的图信号。这是由于传统信号处理中的HT,AS和调制分析的普及,以及通过在图设置中观看常规信号来获得互补洞察的观察。我们对HT和AS的定义使用由图傅立叶变换(GFT)表现的共轭对称性。我们表明,可以使用比信号长度更少数量的GFT系数来表示实际图信号(GS)。我们显示图HT(GHT)和图AS(GAS)操作是线性的,并且在图上是移位不变的。使用GAS,我们定义了图信号(GS)的幅度,相位和频率调制。此外,我们使用凸优化来开发GS的信封的替代定义。我们通过展示应用于合成和实际信号来说明所提出的概念。例如,我们表明GHT适用于网络上的异常检测/分析,GAS显示语音信号中的补充信息。

SIGNet:用于符号网络的可扩展嵌入

地址: http://arxiv.org/abs/1702.06819

作者: Mohammad Raihanul Islam, B. Aditya Prakash, Naren Ramakrishnan

摘要: 最近在词语嵌入和文档嵌入方面取得的成功促使研究人员探索网络的类似表示,并将这些表示用于诸如边预测,节点标签预测和社区检测等任务。现有的方法主要集中在找到未符号网络的分布式表示,并且不能发现与边固有的极性相关的嵌入。我们提出了SIGNet,一种适用于符号网络的快速可扩展嵌入方法。我们提出的目标函数旨在通过加强社会平衡理论的原则来认真地模拟签约网络中隐含的社会结构。我们的方法建立在传统的word2vec嵌入式方法的基础之上,但是我们提出了一种新的目标节点抽样策略来维持高阶社区的结构平衡。我们展示了SIGNet的优越性,针对来自不同领域的几个现实世界数据集中的有符号和无符号网络提出的最先进的方法。特别地,SIGNet提供了一种方法来生成更加丰富的符号网络功能的词汇表来支持表示和推理。

社区认同和用户参与多社区景观

地址: http://arxiv.org/abs/1705.09665

作者: Justine Zhang, William L. Hamilton, Cristian Danescu-Niculescu-Mizil, Dan Jurafsky, Jure Leskovec

摘要: 社区的身份定义和塑造其内部动力。我们目前对这种相互作用的理解主要限于从个别社区的孤立研究中收集到的瞥见。在这项工作中,我们对各种在线社区的这种关系的性质进行了系统的探讨。为此,我们引入了一个定量的,基于语言的类型学,反映了社区身份的两个关键方面:如何独特,以及时间上如何。通过将近300个Reddit社区映射到这种类型学引发的景观中,我们揭示了用户参与模式如何随着社区特征而发生的规律性。我们的研究结果表明,新兴和现有用户与社区互动的方式,强烈和有系统地依赖其促进的集体身份的性质,以社区维护者高度重视的方式。例如,具有独特和高度动态身份的社区更有可能保留其用户。然而,这些利基社区在现有用户和新移民之间也表现出更大的适应差距,这可能阻碍后者的整合。更广泛地说,我们的方法揭示出社区各种社会现象如何表现出的差异,并表明构建多社区景观可以更好地理解这种多样性的系统性质。

精神词汇的复合模型揭示了人类的爆炸性学习

地址: http://arxiv.org/abs/1705.09731

作者: Massimo Stella, Nicole M. Beckage, Markus Brede, Manlio De Domenico

摘要: 文中的相似之处影响着语言习得与多关系的处理。我们提出了一个词汇相似性的多重网络表示在心理词典中作为调查大规模认知模式的自然框架。我们的模型考虑到语义,分类和语音交互,并且识别出更高频率的词组,更容易识别,记忆和学习,并且具有比预期随机的更多意义。这个集群通过不被零模型重现的爆炸性转变大约在7岁左右出现。我们将这种现象与多义性相关联,即词义的冗余。我们表明,集群词作为词汇的核心,增加了其导航性和对认知障碍退化的鲁棒性。我们的研究结果提供了关于心理词典中核心结构的现有心理语言学猜想的定量确认,以及将多关键字词互动整合到合适框架中的重要性。

动态拓扑结构社会网络社会力量演进

地址: http://arxiv.org/abs/1705.09756

作者: Mengbin Ye, Ji Liu, Brian D.O. Anderson, Changbin Yu, Tamer Başar

摘要: 最近提出的DeGroot-Friedkin模型描述了个人社会力量在一个社会网络中的动态演变,对一系列不同的问题进行了意见讨论。本文回顾了该模型,并采用非线性收缩分析等工具,建立了几个新的结果。首先,我们表明,对于具有不断拓扑结构的社交网络,每个人的社会功能都以指数快速收敛到其平衡值,而以前的结果只是渐近收敛。第二,当网络拓扑是动态的(即,相对交互矩阵可能在任何两个连续的问题之间变化)时,我们显示每个个体指数地忘记其初始社会力量。具体来说,个人社会力量仅依赖于动态网络拓扑结构,并且由于顺序观点讨论的结果,初始(或感知的)社会权力被遗忘。最后,我们提供了个人社会权力的明确上限,因为讨论的问题数量将达到无穷大;此绑定仅取决于网络拓扑。提供模拟来说明我们的结果。

一种用于分析城市能源分配网络的多层次代理模型

地址: http://arxiv.org/abs/1705.09803

作者: Alberto Fichera, Alessandro Pluchino, Rosaria Volpe

摘要: 重要的研究贡献和指导意见是针对在城市地区插入可再生能源系统的问题,以应对公民日益增长的能源需求。这种系统的引入使安装人员能够满足他们的能源需求,并将最终的能量过剩分配给邻近的邻居。本文提出了一种基于多层代理的计算模型,模拟城市内发生的能量分布网络的多个事件。该模型运行在NetLogo平台上,目的是在处理能量分配网络的设计时制定最合适的策略。实验数据在24小时运行期间的两个主要场景的基础上进行讨论。情景考虑到可再生能源系统的安装人员百分比的变化以及能量交换发生的距离。

一个病毒时间轴分支过程研究一个社交网络

地址: http://arxiv.org/abs/1705.09828

作者: Ranbir Dhounchak, Veeraruna Kavitha, Eitan Altman

摘要: 生物启发的范例被证明可用于分析网络中信息的传播和传播。在本文中,我们探讨了使用多类型分支过程来分析社会网络中内容的病毒属性,来自其他来源的竞争。我们得出和计算各种病毒度量,例如病毒概率,预期股数或预期股数增长率等。它们允许人们预测全球宏观财产的出现(例如,一个信息的病毒传播在整个网络中)根据确定本地交互的法律和参数。本地交互极大地依赖于保持网络的用户的内容和朋友的数量(即,连接)的时间线的结构。然后,我们制定了一个非合作的博弈问题,并研究纳什均衡作为参数的函数。在竞争中建模社交网络的分支过程变成可分解的,多类型和连续的时间变体。对于属于不同子类的这些过程,类别以不同的速率演化并具有不同的灭绝概率等。我们计算内容提供商明智的消光概率,增长率等。我们还推测内容提供商明显的预期份额增长率。

相互依赖网络中的普遍性和尺度规律:愈合模型和有限范围相互依赖的情况

地址: http://arxiv.org/abs/1705.09829

作者: Marcell Stippinger, János Kertész

摘要: 级联故障可能导致相互依赖的网络中的剧烈崩溃,其中故障发生为订单参数的不连续性。然而,这是一个混合转换,这意味着,除了这个第一个字符之外,转换也显示尺度。最近我们显示有两组指数分别描述了顺序参数和级联统计量,它们通过尺度法连接起来。在这里,我们研究这些指数在由参数控制的模型中的普遍性问题,在某些值下,它抑制了阶数参数的不连续性。在具有愈合的相互依赖的网络中,有两个普遍性类别:在临界愈合值以下,指数与原始模型的指数一致,而在该值之上,该模型显示微小的尺度。如果依赖关系链接的$ r $小于临界值$ r_ {max} $,则转换是二阶的,指数的结果表示通用行为。由于$ r_ {max} $被逼近有限大小的影响阻碍了指数的准确数值确定。对于$ r> r_ {max} $依赖关系和系统大小之间的关系$ N $决定行为。对于$ r_ {max} <r \ ll \ sqrt {N} $似乎存在与无限范围情况不同的通用行为,而在相反的限制中,我们观察到原始模型的指数。

机器学习为三维离散裂缝网络的图表示

地址: http://arxiv.org/abs/1705.09866

作者: Manuel Valera, Zhengyang Guo, Priscilla Kelly, Sean Matz, Adrian Cantu, Allon G. Percus, Jeffrey D. Hyman, Gowri Srinivasan, Hari S. Viswanathan

摘要: 结构和拓扑信息在通过断裂岩石的流动建模中发挥关键作用。离散裂缝网络(DFN)计算套件(如dfnWorks)旨在模拟此类介质中的流量和传输。使用粒子跟踪方法的运输计算表明,存在大部分运输发生的小骨架骨折,从而显着降低了流动骨折网络的有效尺寸。然而,粒子跟踪所需的模拟是计算密集型的,并且可能不可扩展到大型系统,或者对于需要数千次前向仿真来限制系统行为的断层网络的鲁棒不确定性量化。在本文中,我们结合机器学习和图理论方法开发dfnWorks的仿真器,以快速估计可以模拟高保真离散断层网络的传输。我们介绍一种机器学习方法来描述DFN中的运输。我们考虑一个图表示,其中节点表示裂缝,边表示它们的交点。使用监督学习技术,随机森林和支持向量机,对由dfnWorks发现的粒子跟踪主干路径进行训练,我们预测主要是基于节点中心性特征,图中的裂缝是否进行显着的流动。与粒子跟踪模拟相比,我们的方法运行时间可以忽略不计。我们发现,我们预测的骨干网可以将网络降低到其原始大小的约20%,同时仍然产生类似于完整网络的突破性曲线。

潜入恶魔的殖民地 - 在线社交网络中的虚构人物

地址: http://arxiv.org/abs/1705.09929

作者: Mudasir Ahmad Wani, Suraiya Jabin, Nehaluddin Ahmad

摘要: 在线社交网络(OSN)对于互联网用户进行日常活动,如内容分享,新闻阅读,发布消息,产品评论和讨论活动等方面发挥着重要的作用。同时,各种垃圾邮件发送者也被同样吸引这些OSNs。这些网络犯罪分子包括性捕食者,在线欺诈者,广告运动员,cat鱼和社交机器人等,通过各种方式利用信任网络,特别是通过创建假轮廓来传播自己的内容并进行诈骗。所有这些恶意身份对用户和服务提供商都是非常有害的。从OSN服务提供商的角度来看,除了带宽的损失外,假配置文件还会影响网络的总体声誉。要发现这些恶意用户,需要巨大的人力和精湛的自动化方法。在本文中,已经分类了各种类型的OSN威胁发生器,例如受损的配置文件,克隆的配置文件和在线漫游器(垃圾邮件机器人,社交机器人,如漫游器和有影响的机器人)。尝试提出已经用于训练分类器的几类功能,以便识别假的配置文件。已经确定了不同的数据爬取方法以及一些用于假轮廓检测的现有数据源。还介绍了现有的网络法律,限制社会媒体网络犯罪的局限性。

加强或破坏给定网络的最佳成本

地址: http://arxiv.org/abs/1705.09930

作者: Amikam Patron, Reuven Cohen, Daqing Li, Shlomo Havlin

摘要: 加强或破坏网络在设计弹性网络或规划网络攻击方面是一个非常重要的问题,包括针对疾病,病毒等免疫网络的规划策略。在这里,我们开发一种以最小成本加强或破坏随机网络的方法。我们假设加强或破坏节点所需的成本与节点的程度之间的相关性。因此,我们定义成本函数c(k),其是加强或破坏具有度k的节点的成本。在网络中使用度量$ k $和成本函数c(k),我们开发了一种定义度数优先级列表的方法,并选择要加强或销毁的正确的度数组,以使总价格加强或破坏整个网络。我们发现,各种随机网络的度数优先级列表是通用的,独立于网络的度数分布。加强网络和以最低成本销毁网络的优先级列表是一样的。然而,尽管有这种相似之处,但是它们的p_c(必须是功能的节点的关键部分)之间存在差异,以保证网络中存在巨大的组件。

头部放置最大化可预测性。信息论方法

地址: http://arxiv.org/abs/1705.09932

作者: Ramon Ferrer-i-Cancho

摘要: 句法依赖的长度的最小化是词序的一个很好的原则,是词序数学理论的基础。这里我们从信息论的角度来完成这个理论,增加了一个竞争的词序原则:目标元素的可预测性的最大化。这两个原则是矛盾的:为了最大化头部的可预测性,头部应该出现在最后,从而最大限度地提高依赖关系长度最小化的成本。回顾了这样一个广泛的理论框架对理解主体,对象和动词的六种可能排序的最优性,多样性和演变的影响。

从Twitter数据流中提取城市事件的深层次多视图学习框架

地址: http://arxiv.org/abs/1705.09975

作者: Nazli Farajidavar, Sefki Kolozali, Payam Barnaghi

摘要: 由于复杂的基础设施,城市在几个世纪以来一直是公民的繁荣之地。网络 - 物理 - 社会系统(CPSS)和情境感知技术的出现提高了对分析,提取和最终了解城市事件的兴趣,随后可以利用这些事件来利用公民对其城市的观察。在本文中,我们调查了使用Twitter文本流提取城市事件的可行性。我们提出了一种层次化多视角深度学习方法,以便对各种城市系统和服务的公民观察进行语境化。我们的目标是构建一个灵活的架构,可以学习对任务有用的表示,从而避免过度的任务特定功能工程。我们将我们的方法应用于由旧金山湾区数据集和从伦敦收集的其他数据集的事件报告和超过四个月的推文的现实世界数据集。我们的评估结果表明,我们提出的解决方案胜过现有的模型,可用于提取城市相关事件,平均精度为81%。为了进一步评估我们的Twitter事件提取模型的影响,我们通过收集伦敦交通运输局的道路交通中断数据,并分析了伦敦超时伦敦网站的社会文化事件,从而使用了两个授权报告来源。分析显示,在当地官方记录前约五小时内,有Twitter的流量评论中有49.5%报告。此外,我们发现在排定的社会文化事件主题之间;报告交通运输,文化和社会事件的微博比传播Twitter,评论的分布更有可能比体育,天气和犯罪主题的31.75%。

传播学习网络结构

地址: http://arxiv.org/abs/1705.10051

作者: Adisak Supeesun (Kasetsart University, Bangkok, Thailand), Jittat Fakcharoenphol (Kasetsart University, Bangkok, Thailand)

摘要: 在2014年,Amin,Heidari和Kearns证明,通过在主动和被动查询模型中仅观察独立级联模型下的传染过程的受感染的一组顶点,可以学习树状网络。他们也经验证明,他们的算法的简单扩展在稀疏网络上工作。在这项工作中,我们专注于积极的模式。我们证明,Amin等人的算法的简单修改适用于更广泛的网络类别,即(i)具有大环形和低路径增长速率的网络,以及(ii)具有有界度的网络。这也为Amin等人在稀疏网络上的实验提供了部分理论解释。

互惠驱动的稀疏网络形成

地址: http://arxiv.org/abs/1705.10122

作者: Konstantinos P. Tsoukatos

摘要: 考虑资源交换网络,其中节点之间的交换基于互惠。同行从网络获得与其贡献相称的一定数量的资源。我们假设网络是完全连接的,并且对同伴互动施加稀疏约束。寻求达到期望的互惠水平的最稀少的交流通常是NP-hard。为了捕获近乎最优的分配,我们引入了Eisenberg-Gale凸程序的变体,其中有稀疏性的惩罚。我们推导出分散算法,由此对等体通过重新加权的最小化来计算最稀疏的分配。算法实现新的比例响应动力学,具有非线性定价。研究了稀疏性和互惠性之间的折衷以及由稀疏交换引起的图表的属性。

具有给定幂律度分布的稀疏最大熵随机图

地址: http://arxiv.org/abs/1705.10261

作者: Pim van der Hoorn, Gabor Lippner, Dmitri Krioukov

摘要: 即使在大型实际网络中普遍观察到幂律或近力法律分布,但仍然缺乏满足现实主义的基本统计要求的随机幂律图的数学满意度处理。这些要求是:稀疏性,可交换性,投射性和无偏见。最后一个要求表明,图集合的熵必须在程度分布约束下最大化。这里我们证明属于具有潜在超参数的随机图类的超软件配置模型(HSCM)也称为不均匀随机图或$ W $ -random图,满足所有这些要求。证明依赖于广义图,并将绘制随机图集合的归一化吉布斯熵最大化的问题映射到图熵最大化问题,表明两个熵在大图限制中彼此收敛。

从简单的配置模型构建和有效的采样

地址: http://arxiv.org/abs/1705.10298

作者: Jean-Gabriel Young, Giovanni Petri, Francesco Vaccarino, Alice Patania

摘要: 简单的复合体现在是描述复杂系统结构的一个流行的替代网络,主要是因为它们明确地编码多节点交互。有了这个新的描述,就需要有原则的空模型,以便与经验数据进行轻松比较。我们提出一个自然的候选人,简单的配置模式。我们的贡献的核心是一个有效和统一的马尔科夫链蒙特卡罗取样器为这个模型。我们通过调查三个实际系统的拓扑结构及其随机对照(使用其Betti数)来证明其在一个简短的案例研究中的有用性。对于三个系统中的两个系统,该模型允许我们拒绝没有超出当地规模的组织的假设。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20170530/