- 活动组织101:了解事件流行的潜在因素;
- 用于评估可能的税收收入操纵的数据科学:意大利的情况;
- 物理学家是否太早停止搜索?远程科学,优化景观调查;
- 多层脑网络;
- 当标签变短时:通过网络结构和顶点属性的混合进行属性图模拟;
活动组织101:了解事件流行的潜在因素
地址: http://arxiv.org/abs/1709.02024
作者: Shuo Zhang, Qin Lv
摘要: 理解人们参与现实世界事件的问题一直是积极研究的课题,可以为人类行为分析和事件相关推荐/广告提供宝贵的见解。基于事件的社会网络(EBSN)的出现吸引了在线用户主持/参与线下活动,这使得这一领域令人兴奋的新研究成果。然而,大多数现有作品着重于理解或预测/推荐个人用户的活动参与。从事件组织者的观点来看,很少有研究解决了事件流行度(即参加人数)的问题。在这项工作中,我们研究使用从世界各地五大城市流行的Meetup.com EBSN收集的大规模数据集确定事件流行度的潜在因素。我们对四个情境因素(空间,群体,时间和语义)进行了建模分析,并开发了一个基于群体的社会影响传播网络来模拟群体对事件的影响。通过结合语境特征和社会影响网络,我们的综合预测框架CASINO可以捕捉事件参与的多种影响因素,并可以由活动组织者用来预测/提高其活动的普及程度。评估表明,我们的CASINO框架通过我们捕获的所有潜在功能的贡献,实现了高预测精度。
用于评估可能的税收收入操纵的数据科学:意大利的情况
地址: http://arxiv.org/abs/1709.02129
作者: Marcel Ausloos, Roy Cerqueti, Tariq A. Mir
摘要: 本文从数据科学的角度探讨了现实世界的基本主题。它具体讨论了通过从公民财政报告汇总,是否可以在市政当局所得税分配范围内观察欺诈或操纵。研究案例涉及2007 - 2011年意大利经济与金融部的官方数据。所有意大利(20)地区都被考虑。被考虑的数据科学方法将Benford第一数字法作为定量工具采用具体化。发现了显着的差异 - 对于几个地区,导致意想不到的“结论”。根据关于意大利金融影子事件的古典想象,最多的浏览区域不是预期的。
物理学家是否太早停止搜索?远程科学,优化景观调查
地址: http://arxiv.org/abs/1709.02230
作者: Robert Heck, Oana Vuculescu, Jens Jakob Sørensen, Jonathan Zoller, Morten G. Andreasen, Mark G. Bason, Poul Ejlertsen, Ottó Elíasson, Pinja Haikka, Jens S. Laustsen, Lærke L. Nielsen, Andrew Mao, Romain Müller, Mario Napolitano, Mads K. Pedersen, Aske R. Thorsen, Carsten Bergenholtz, Tommaso Calarco, Simone Montangero, Jacob F. Sherson
摘要: 尽管最近由机器学习算法推动了进步,但专家们一致认为,这些算法往往无法在高度复杂的环境中匹配基于经验的直观问题解决技能。最近的研究已经证明了公民科学博弈中人们的直觉和融合科学家的经验[2]如何通过限制活动搜索空间的大小来辅助自动搜索算法,从而获得优化的结果。因此,人类具有根据观察,计算或物理洞察来检测模式和解决策略的不可思议的能力。在这里,我们探讨一个根本问题:这些策略是否真正有区别,或仅仅是标注我们在高维度连续体解决方案中的不同点?在后一种情况下,我们人类想要识别模式的愿望可能导致我们太早地终止搜索。我们证明,在光学镊子中单原子运输的理论研究中就是这样,超过20万公民科学家帮助探测了量子速度限制[1]。有了这个见解,我们开发出一种全新的全局确定性搜索方法,从而大大提高了结果。我们证明,这种解决策略的“桥接”也可以应用于Bose-Einstein冷凝物生产的闭环优化。在这里,我们发现使用两个新型远程接口实现的改进解决方案。首先,一组理论最优控制研究人员采用Remote版本的dCRAB优化算法(RedCRAB),其次,博弈界面允许来自世界各地的600位公民科学家参与优化。最后,这些问题的“现实世界”本质就是一个全新的方法去研究人类的解决问题,使我们能够在野外进行假设驱动的社会科学实验。
多层脑网络
地址: http://arxiv.org/abs/1709.02325
作者: Michael Vaiana, Sarah Muldoon
摘要: 神经科学领域面临着前所未有的广泛的数据量和多样性的现有数据。传统上,网络模型已经为大脑的结构和功能提供了重要的见解。随着神经科学大数据的出现,需要能够表征日益增加的数据复杂性的更复杂的模型和新的定量分析方法。最近,传统网络的数学扩展多层网络由于能够捕获多模型,多尺度,时空数据集的全面信息而在神经科学中越来越受欢迎。在这里,我们审查多层网络及其在神经科学中的应用,显示如何将多层框架纳入网络神经科学分析已经揭示了以前隐藏的大脑网络的特征。我们特别强调使用多层网络来建模疾病,结构 - 功能关系,网络演化和链接多尺度数据。最后,我们结合对多层网络神经科学研究的有希望的新方向的讨论,并提出了多层网络的修改定义,旨在团结和澄清多层形式主义在描述现实世界系统中的应用。
当标签变短时:通过网络结构和顶点属性的混合进行属性图模拟
地址: http://arxiv.org/abs/1709.02339
作者: Arun V. Sathanur, Sutanay Choudhury, Cliff Joslyn, Sumit Purohit
摘要: 属性图可用于表示具有标记(归因)顶点和边的异构网络。给定一个属性图,模拟具有相同或更大尺寸的另一个图,相对于标签和连接具有相同的统计属性对于隐私保护和基准测试目的至关重要。在这项工作中,我们解决了捕获边连接对顶点标签的统计依赖性的问题,并使用相同的分布以可扩展方式重新生成相同或扩展大小的属性图。然而,当属性不完全解释网络结构时,精确的模拟成为一个挑战。我们提出了使用标签增强策略来减轻问题并保留顶点标签和边连通性分布及其相关性的属性图模型(PGM)方法,同时也复制了度数分布。我们提出的算法是可扩展的,目标图中边数量的线性复杂度。我们通过利用两个不同的插图来说明PGM方法在再生和扩展数据集中的功效。我们的开源实现在GitHub上可用。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客 https://netsci.complexly.cn 进行更新,并提供RSS订阅。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20170908/