- 一种用于网络随机动力学的矩阵乘积算法,适用于非平衡的Glauber动力学;
- 网络机器人与人类行为对比与网络模型;
- 从时态网络数据中遏制流行病的资源配置;
- 在线讨论中网络威胁的早期预警;
- 人工神经网络预测行人速度;
- 网络游戏中的表现动态与成功;
- 噪声引起的停走动态;
- 使用消息传递的加权社区检测和数据聚类;
- 在Facebook上使用半监督学习在图上进行多账户检测;
- 小组讨论中影响力的动态网络;
- “23andMe证实:我是超级白人” - 分析Twitter话语基因测试;
- 社会网络中语义建模的影响力研究综述;
- 社交媒体情感分析的改进土耳其数据集的编制;
- 建模结构和预测线上讨论线索的动态;
- 基于主题的双关网络的创造性探索;
- 分子网络中的多层流动在人类蛋白质组中识别生物模块;
一种用于网络随机动力学的矩阵乘积算法,适用于非平衡的Glauber动力学
原文标题: A matrix product algorithm for stochastic dynamics on networks, applied to non-equilibrium Glauber dynamics
地址: http://arxiv.org/abs/1508.03295
作者: Thomas Barthel, Caterina De Bacco, Silvio Franz
摘要: 我们引入并应用了一种新颖的局部树状图的随机动态过程精确模拟的有效方法。具有循环的网络在腔体法的框架内处理。这样的模型例如对应于自旋玻璃系统,布尔网络,神经网络或其他技术,生物和社会网络。基于量子多体理论的思想,新方法基于所谓的边消息的矩阵乘积逼近 - 顶点变量轨迹的条件概率。计算成本和准确性可以通过控制矩阵产品边消息(MPEM)的截断矩阵尺寸来调整。与蒙特卡罗模拟相比,该算法具有更好的误差尺度,适用于单个实例以及热力学极限。我们用它来检验动力学伊辛模型中的原型非平衡芒硝动力学。由于没有消除效应,可以精确评估具有小期望值的可观测值,从而研究衰变过程和时间相关性。
网络机器人与人类行为对比与网络模型
原文标题: Contrasting Web Robot and Human Behaviors with Network Models
地址: http://arxiv.org/abs/1801.09715
作者: Kyle Brown, Derek Doran
摘要: 网络图是网站的超链接结构的常用网络表示。与Web图类似的结构网络(我们称之为会话图)具有反映Web服务器日志中的代理浏览习惯的属性。在本文中,我们应用会话图来比较人类与网络机器人或爬虫的活动。了解这些属性将使我们能够改进HTTP流量的模型,这些流量可用于预测和生成真实流量,以便测试和提高Web服务器的效率,并设计新的缓存算法。我们应用大规模网络属性,例如人类和Web机器人会话图的连通性和度分布,以便识别对于建立Web流量和提高缓存性能有用的流量的特征。我们发现,一个Web服务器上的人和机器人请求的会话图的经验度分布最适合于不同的理论分布,这表明在产生流量的过程中存在差异。
从时态网络数据中遏制流行病的资源配置
原文标题: Resource Allocation for Containing Epidemics from Temporal Network Data
地址: http://arxiv.org/abs/1801.09753
作者: Masaki Ogura, Junichi Harada
摘要: 我们研究在时间网络中包含流行传播过程的问题。如果节点间连接性的经验时间序列数据可用,我们特别关注寻找资源分配来抑制流行感染的问题。虽然这个问题具有实际意义,但是由于问题的计算复杂性,实证的时间序列数据如何能够为我们的资源分配策略提供信息尚不清楚。在这个方向上,我们提出了一个计算有效的框架来寻找一个资源分配满足给定的预算约束,并达到一个给定的控制性能。该框架是基于凸面编程,而且,允许性能测量由广泛的称为具有非负指数的正项的泛函来描述。我们用一个小学内的时间交互网络数据来说明我们的理论结果。
在线讨论中网络威胁的早期预警
原文标题: Early Warnings of Cyber Threats in Online Discussions
地址: http://arxiv.org/abs/1801.09781
作者: Anna Sapienza, Alessandro Bessi, Saranya Damodaran, Paulo Shakarian, Kristina Lerman, Emilio Ferrara
摘要: 我们引入了一个自动生成即将或当前网络威胁警报的系统。我们的系统利用黑暗网络中的恶意行为者的交流,以及在Twitter等社交媒体平台上的网络安全专家的活动。在2016年9月至2017年1月的一段时间内,我们的方法产生了661条警报,其中约84%与当前或即将发生的网络威胁有关。在本文中,我们首先说明我们系统的基本原理和工作流程,然后衡量它的性能。我们的分析通过两个案例研究得到丰富:第一个展示了该方法如何预测DDoS攻击,以及如何让组织准备2016年10月导致广泛中断的Mirai攻击。第二,我们讨论了该方法及时识别数据泄露的各种情况。
人工神经网络预测行人速度
原文标题: Prediction of Pedestrian Speed with Artificial Neural Networks
地址: http://arxiv.org/abs/1801.09782
作者: Antoine Tordeux, Mohcine Chraibi, Armin Seyfried, Andreas Schadschneider
摘要: 行人行为往往取决于设施的类型。因此,对于参数较少的经典模型,难以准确预测复杂几何形状(包括走廊,瓶颈或相交)中的行人运动。人工神经网络具有多个参数并且能够识别各种类型的模式。他们可能是一个合适的替代预测。本文旨在介绍测试此方法的第一步。我们将行人速度的估计与经典模型和神经网络的走廊和瓶颈实验组合进行比较。结果表明,神经网络能够区分这两种几何形状,并在几何图混合时提高对行人速度的估计。
网络游戏中的表现动态与成功
原文标题: Performance Dynamics and Success in Online Games
地址: http://arxiv.org/abs/1801.09783
作者: Anna Sapienza, Hao Peng, Emilio Ferrara
摘要: 在线数据提供了一种方式来监视用户在社会网络和在线博弈等社交系统中的行为,并了解哪些功能会将普通个人变为成功的功能。在这里,我们建议研究多人在线竞技场(MOBA)游戏中的个人表现和成功。我们的目的是识别那些高技能水平的球员所具有的行为和打法,并与其他球员区分开来。为了达到这个目的,我们研究了一个受欢迎的MOBA游戏Dota 2的防御。我们的研究结果突出了三个主要方面在游戏中取得成功:(i)玩家需要有一个热身期来提高他们在游戏中的表现; (ii)具有长期的游戏体验并不一定意味着获得更好的技能; (3)高水平的球员由于其积极的打球策略而与其他球员相区别,这意味着与对手的配合更多地杀死对手,并试图尽早结束比赛。
噪声引起的停走动态
原文标题: Noise-induced Stop-and-Go Dynamics
地址: http://arxiv.org/abs/1801.09791
作者: Antoine Tordeux, Andreas Schadschneider, Sylvain Lassarre
摘要: 交通和行人通常会观察到停下来的波浪。在交通理论中,它们是由亚稳态模型的相变来描述的。自组织现象由于惯性机制而发生,但需要微调参数。在这里,为行人动力学提出了一种基于随机效应的停走波的新解释。我们表明,在稳定的微观模型中引入特定的有色噪声可以描述真实的行人停走行为,而不需要亚稳态和相变。我们将随机模型的仿真结果与真实的行人轨迹进行比较,并讨论模型参数的合理值。
使用消息传递的加权社区检测和数据聚类
原文标题: Weighted Community Detection and Data Clustering Using Message Passing
地址: http://arxiv.org/abs/1801.09829
作者: Cheng Shi, Yanchen Liu, Pan Zhang
摘要: 根据它们之间的相似性或权重将对象分组成集群是科学和工程中最重要的问题之一。在这项工作中,通过扩展消息传递算法和针对未加权社区检测问题提出的谱算法,我们开发了一种基于统计物理学的非参数化方法,将问题映射到自旋玻璃化转变临界温度下的Potts模型,来解决玻尔兹曼分布对应的边界。我们的算法是过度拟合的鲁棒性,并给出一个原则性的方式来确定是否有重要的数据集群和有多少个集群。我们将我们的方法应用于不同的聚类任务,并使用大量的数值实验来说明我们的方法相对于现有算法的优势。在加权和有向网络中的社区检测问题中,我们证明了我们的算法明显优于现有的算法。在稀疏区域混合模型生成数据的聚类问题中,我们证明了我们的方法对可检测性的理论极限起作用,并且给出了非常接近于最优贝叶斯推断的精度。在半监督聚类问题中,我们的方法只需要几个标签在经典数据集中完美工作。最后,我们进一步发展了Thouless-Anderson-Palmer方程,这些方程大大降低了密集网络中的计算复杂度,但是却给出了和置信传播几乎相同的性能。
在Facebook上使用半监督学习在图上进行多账户检测
原文标题: Multiple Accounts Detection on Facebook Using Semi-Supervised Learning on Graphs
地址: http://arxiv.org/abs/1801.09838
作者: Xiaoyun Wang, Chun-Ming Lai, Yunfeng Hong, Cho-Jui Hsieh, S. Felix Wu
摘要: 在社会网络中,单个用户可以创建多个账号来传播他/她的观点,并影响他人,通过积极评论不同的新闻页面。社会网络和社区都有利于降低这种不正常的活动,第一步就是检测这些账户。然而,检测是具有挑战性的,因为这些账户可能具有非常现实的名称和合理的活动模式。在本文中,我们调查了三种不同的方法,并提出使用图嵌入和半监督学习,来预测一对帐户是否由同一用户创建。我们进行广泛的实验分析,以了解输入数据和算法参数/优化中的变化如何影响预测性能。我们还发现,对于这样的预测,地方信息比全球信息具有更高的重要性,并指出了导致最佳结果的门槛。我们使用6700个来自中东的Facebook页面来测试所提出的方法,对于同名的用户,在0.996和AUC(曲线下的面积)上达到0.952的平均准确度;与美国2016年选举数据集相比,我们在0.877获得了不同名字用户的最佳AUC。
小组讨论中影响力的动态网络
原文标题: Dynamical Networks of Influence in Small Group Discussions
地址: http://arxiv.org/abs/1801.09913
作者: Mehdi Moussaid, Alejandro Noriega Campero, Abdullah Almaatouq
摘要: 在生活,商业和管理的许多领域,面对面讨论的小组人员解决了许多问题。尽管社会心理学的研究在研究小群体表演的决定因素方面有着悠久的历史,但是对于小组讨论的内在动力机制尚不清楚。在这里,我们依靠基于网络分析和意见动态的计算方法来描述个人在小组讨论期间如何相互影响。我们考虑一小群三个人参与讨论来解决估算任务的情况。我们提出了一个模型来描述团队成员如何逐渐相互影响,并在讨论过程中修改他们的判断。模型的主要组成部分是一个影响网络 - 一个加权的有向图,它决定了讨论过程中个人相互影响的程度。在模拟中,我们首先研究产生最佳团体表演的影响网络的最佳结构。然后,我们实施一个社会学习过程,使个人适应同行过去的表现,从而影响长期影响网络的结构。我们探索高效或不适应网络出现的机制,并且表明影响网络可以趋于最优化,但是只有当个体通过降低同龄人的相对表现而表现出社会贴现偏差时。最后,我们发现说话人后期效应,从而在讨论中稍后发言的人在长远看来会更积极,因此更有影响力。该模型的众多预测可以作为未来实验的基础,这项工作将开展有关计算社会科学的小组讨论研究。
“23andMe证实:我是超级白人” - 分析Twitter话语基因测试
原文标题: “23andMe confirms: I’m super white” – Analyzing Twitter Discourse On Genetic Testing
地址: http://arxiv.org/abs/1801.09946
作者: Alexandros Mittos, Jeremy Blackburn, Emiliano De Cristofaro
摘要: 基因组学的最新进展是将基因测试带给大众,参与式公共行动正在对数百万志愿者的基因组进行测序,一个新的市场正在蓬勃发展,像23andMe和AncestryDNA这样的公司正在向消费者直接提供负担得起的测试。因此,关于基因检测的新闻,经验和观点正在越来越多地在网上和Twitter等社会网络上分享和讨论。在本文中,我们对Twitter的基因测试话语进行了大规模的分析。我们通过使用与遗传检测公司和公共倡议相关的十三个关键词作为搜索关键词,从113K用户那里收集了302K个推文,超过了2.5年。我们研究推特和用户张贴他们沿着几个轴,旨在了解谁是关于基因测试的推文,他们谈论什么,以及他们如何使用Twitter的。除此之外,我们发现关于基因测试的推文来自整体看来对数字健康和技术感兴趣的账户。此外,营销工作以及FDA(美国食品及药物管理局)暂停23andMe健康报告等公告影响了用户参与的类型和性质。最后,我们报告了那些分享其结果截图的用户,并提出了一些道德和社会问题,因为我们发现将遗传检测与种族主义意识形态相关联的群体的证据。
社会网络中语义建模的影响力研究综述
原文标题: Modeling Influence with Semantics in Social Networks: a Survey
地址: http://arxiv.org/abs/1801.09961
作者: Gerasimos Razis, Ioannis Anagnostopoulos
摘要: 在各种网络(如社交,数字或计算机)中发现有影响的实体一直是一个重要的研究领域。近年来,网络社会网络(OSN)已经成为沟通的基本手段,往往有影响者和舆论导向者通过病毒式的内容来推动政治,事件,品牌或产品。在这项工作中,我们对i)在线社会影响度量,属性和应用进行系统评估,ii)在OSNs信息建模中的语义角色。最后得出的结论是,这两个领域可以共同提供对病毒性用户生成内容的定性评估以及对影响内容的动态属性及其流动动态进行建模的有用见解。
社交媒体情感分析的改进土耳其数据集的编制
原文标题: Preparation of Improved Turkish DataSet for Sentiment Analysis in Social Media
地址: http://arxiv.org/abs/1801.09975
作者: Semiha Makinist, İbrahim Rıza Hallaç, Betül Ay Karakuş, Galip Aydın
摘要: 为了能够成功进行分析研究,需要一个公共数据集,具有适合于情感分析[1],事件预测,趋势检测和其他文本挖掘应用的各种属性。社交媒体上的绝大多数数据是基于文本的,并且不可能将机器学习过程直接应用到这些原始数据中,因为在算法实施之前需要几个不同的过程来准备数据。例如,同一个词的不同拼写错误会使词向量空间不必要地扩大,从而导致算法的成功性降低,增加了计算能力的要求。本文提出了一个基于Hadoop的有效拼写纠正算法的改进土耳其数据集[2]。收集到的数据记录在Hadoop分布式文件系统上,基于文本的数据由MapReduce编程模型处理。这种方法适用于基于大型文本的社交媒体数据的存储和处理。在这项研究中,电影评论已经被Apache ManifoldCF(MCF)[3]自动录制,并且已经创建了数据集群。已经提出了诸如Levenshtein和模糊字符串匹配的各种方法来从收集的数据创建公共数据集。实验结果表明,该算法在情感分析研究中可以作为开源数据集,成功地用于拼写错误的检测和纠正。
建模结构和预测线上讨论线索的动态
原文标题: Modelling structure and predicting dynamics of discussion threads in online boards
地址: http://arxiv.org/abs/1801.10082
作者: Alexey N. Medvedev, Jean-Charles Delvenne, Renaud Lambiotte
摘要: 互联网董事会是在线讨论各种主题的平台。在这些理事会上,个人可能会针对具体的事情开始新的讨论,或者在现有的讨论中留下意见。由此产生的集体过程导致形成“讨论树”,其中节点表示帖子和评论,边表示“回复”关系。讨论树的结构已经在以前的作品中进行了分析,但仅从静态的角度来分析。在本文中,我们通过将它们的形式建模为一个自鸣得意的Hawkes过程来关注它们的结构和动力学特性。我们首先研究一个Reddit数据集,以显示树的结构类似于具有特殊根后代分布的Galton-Watson过程产生的结构。然后使用模型的动态方面来预测未来的评论活动和讨论树的最终大小。我们比较了我们的方法与以前的作品的效率,并显示其优势预测的讨论动态。
基于主题的双关网络的创造性探索
原文标题: Creative Exploration Using Topic Based Bisociative Networks
地址: http://arxiv.org/abs/1801.10084
作者: Faez Ahmed, Mark Fuge
摘要: 双向知识发现是一种将来自两个或更多“不兼容”域的元素结合起来以产生创造性解决方案和洞察力的方法。受Koestler的bisociation概念的启发,在本文中,我们提出了一个发现域之间新连接的计算框架,以促进设计中的创造性发现和灵感。具体来说,我们建议使用主题模型对来自多个领域的大量非结构化文本想法进行研究,以发现创意的灵感来源。我们使用这些主题来生成一个双向信息网络—一个能够捕捉概念之间概念相似性的图表—帮助设计师在网络中找到创造性的链接。使用来自OpenIDEO(一个在线协作社区)的成千上万个想法的数据集,我们的结果显示通过收集单词(主题)来表达跨领域灵感的概念桥梁的有用性。我们发现,发现的领域之间的联系,无论是自己或通过他们的想法提出,被认为是更新颖,也可以作为创意刺激新的想法生成。
分子网络中的多层流动在人类蛋白质组中识别生物模块
原文标题: Multilayer flows in molecular networks identify biological modules in the human proteome
地址: http://arxiv.org/abs/1801.10144
作者: Giuseppe Mangioni, Giuseppe Jurman, Manlio De Domenico
摘要: 各种复杂系统同时展示不同类型的关系,可以通过多路复用网络进行建模。一个典型的问题是确定这样的系统的社区结构,一般来说,这取决于一个或多个参数的调整。在这项研究中,我们提出了一个基于信息论的测量方法,以找到表征多路复用Infomap的松弛率的最优值,Infomap算法在多层网络领域的推广。我们对合成网络的方法进行评估,以表明当使用最合适的放松率时,可以可靠地识别出最具代表性的社区结构。利用这些结果,我们使用这种方法来确定人类蛋白质 - 蛋白质相互作用多重网络中最可靠的中等规模功能组织,并将观察到的簇与来自分子签名数据库(MSigDB)的独立注释的基因集合进行比较。我们的分析表明,获得最佳松弛率值的模块在生物学上是显著的,并且显著地具有比从人类蛋白质组的总体表示中获得的更高的功能含量。我们的框架允许我们描述那些层之间没有明确相互连接的多层系统的中尺度结构 - 就像边颜色模型 - 从蛋白质组到连接体描述大多数生物网络的那些。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20180131/