- 在Twitter中总结故事情节生成的基于图的方法;
- 复杂网络社区检测,以确定在总线系统瓶颈和资源浪费;
- 数字痕迹的信息可靠性和来源可信度;
- “物理学杂志空间”:寻找质量期刊;
- 政治极端主义的心理与个性概况;
- 谁创造了趋势?了解人群建议中的人口偏差;
- 使用低功率移动磁力计在伦敦公共交通工具的共现流行病跟踪;
- 数据驱动格林函数法的犯罪预测;
- 在空间多层网络中传播本地化攻击;
- 双重普遍性表征了现实的空间网络模型;
- 用于核心,桁架和核分解的并行局部算法;
- 识别具有共同组织原则的网络;
- 震惊人群:检查冲击对中国维基百科的影响;
- 跟踪随机游走;
- 程度相关在相互依赖的安全性中的作用:好还是坏?;
- 随机几何图中的对称模体;
- 社会媒体传播的检测与解决:调查;
在Twitter中总结故事情节生成的基于图的方法
地址: http://arxiv.org/abs/1504.07361
作者: Nazanin Dehghani, Masoud Asadpour
摘要: Twitter已经成为世界范围内实时信息的主要来源,是探索新兴事件,突发新闻和一般话题的绝佳媒介,这对大多数观众至关重要。另一方面,Twitter中传入信息的爆炸率导致用户体验信息超载。而关于新闻事件的一小部分推特,总结事件的故事情节可以帮助用户轻松访问Twitter中隐藏的相关信息和关键信息,从而得出高层次的结论。讲故事的任务是提供重要的子事件的时间摘要,并绘制子事件之间的关系。在本文中,我们提出一个新颖的框架,从社会角度产生一个新闻事件的总结故事情节。利用图论中的概念,我们识别子事件,总结子事件的演变,并产生一致的故事情节。我们的方法将故事情节模拟成社会突出的子事件随着时间的推移而发展的有向树。为了克服大量的冗余推文,我们将蒸馏信息保存在超级推文中。在伊朗总统选举(#IranElection)发表的小报中对大规模数据集进行的实验和结果表明了我们框架的效率和有效性。
复杂网络社区检测,以确定在总线系统瓶颈和资源浪费
地址: http://arxiv.org/abs/1606.03737
作者: Carlos Caminha, Vasco Furtado, Vládia Pinheiro, Caio Ponte
摘要: 我们在这里提出一种方法,通过挖掘代表公共交通工具供需的复杂网络,帮助了解城市公共交通工具的不足。我们展示如何通过应用估计OD并重建乘客完整行程的算法,在基于公交车智能卡使用的数据上构建这些网络。两个网络的重叠显示出潜在的超载和浪费资源的提供,可以通过平衡供需策略来缓解。
数字痕迹的信息可靠性和来源可信度
地址: http://arxiv.org/abs/1610.07472
作者: Behzad Tabibian, Isabel Valera, Mehrdad Farajtabar, Le Song, Bernhard Schölkopf, Manuel Gomez-Rodriguez
摘要: 在线知识库通常依靠用户或专业编辑来评估其内容的可靠性。这些评估可以被视为信息可靠性和信息源可信度的嘈杂度量。我们可以利用这些嘈杂的评估,往往有偏见,为两种观念提供强有力,无偏见和可解释的措施?在本文中,我们认为这些嘈杂评估留下的时间痕迹提供了信息的可靠性和来源的可信赖性。然后,我们提出一个时间点流程建模框架,将这些时间轨迹与信息可靠性和来源可信赖性的鲁棒,无偏差和可解释的概念联系起来。此外,我们开发了一个有效的凸优化程序,以从历史轨迹中学习模型的参数。从维基百科和Stack Overflow收集的现实世界数据的实验表明,我们的建模框架准确地预测了评估事件,提供了信息可靠性和来源可信度的可解释度量,并为现实世界事件产生了有趣的见解。
“物理学杂志空间”:寻找质量期刊
地址: http://arxiv.org/abs/1611.10357
作者: Yurij L. Katchanov, Yulia V. Markova
摘要: 本文旨在有助于更好地解释物理学期刊的整体。主要假设是科学杂志的“期刊影响因子”在引用领域中具有其他期刊“期刊影响因子”的现实意义。我们不是构建新的科学测量指标,而是识别具有相应的引文经验分布函数的物理学杂志。使用Web of Science Core Collection的数据,我们考虑物理学期刊的空间和科学出版社的空间。第一个为物理学期刊的文献计量分组提供拓扑结构。第二部分揭示了区域出版商,跨国出版商和专业体育社团的“竞争对手三角”。这些发现促使我们推进物理学期刊的空间结构由发行商之间的关系系统决定的假设。
政治极端主义的心理与个性概况
地址: http://arxiv.org/abs/1704.00119
作者: Meysam Alizadeh, Ingmar Weber, Claudio Cioffi-Revilla, Santo Fortunato, Michael Macy
摘要: 激进的伊斯兰运动的全球招募激发了对政治极端主义吸引力的兴趣。上诉是对物质条件的理性反应还是与侵略行为,不容忍,阴谋想象和偏执狂相关的心理和人格障碍的表现?使用调查的实证回答受到缺乏进入极端主义团体的限制,而实地调查则缺乏心理措施,没有将极端主义分子与对比组进行比较。我们重新审视了在美国境内极端主义的呼吁的辩论,比较了由355,000多名政治极端主义追随者撰写的公开提供的Twitter消息与非极端主义美国用户写的消息。基于文本的心理指标分析支持道德基础理论,其将情感识别为确定个人政治取向的关键因素。极端主义追随者在四大五大人格特质中也与别人不同。
谁创造了趋势?了解人群建议中的人口偏差
地址: http://arxiv.org/abs/1704.00139
作者: Abhijnan Chakraborty, Johnnatan Messias, Fabricio Benevenuto, Saptarshi Ghosh, Niloy Ganguly, Krishna P. Gummadi
摘要: 社交媒体网站(如Facebook和Twitter)的用户依赖众包内容推荐系统(例如热门话题)来检索重要而有用的信息。选择推荐的内容间接地使初始用户(通过喜好或发布)内容有机会向更广泛的受众传播他们的信息。因此,重要的是要了解一些内容值得推荐的人群的人口统计数据,并探讨他们是否代表媒体网站的整体人口。在这项工作中,使用从Twitter收集的大量数据,我们首先尝试量化和探索众包推荐中的人口偏差。我们的分析,重点是选择热门话题,发现人口数量与Twitter人口总体有显着差异的人群中有很大一部分趋势得到提升。更令人担忧的是,我们发现某些人口群体在热门话题的推动者中系统地不足。为了使Twitter的趋势更加透明化,我们在twitter-app.mpi-sws.org/who-makes-trends开发并部署了一个基于Web的服务“Who-Makes-Trends”。
使用低功率移动磁力计在伦敦公共交通工具的共现流行病跟踪
地址: http://arxiv.org/abs/1704.00148
作者: Khuong An Nguyen, Chris Watkins, Zhiyuan Luo
摘要: 公共交通工具是传播传染病的理想手段。本文介绍了一种使用智能手机上普遍存在的地磁场传感器来检测人们在这种环境中的共同定位的新想法。基本上,考虑到所有乘客必须在至少两个连续站之间共享相同的旅程,我们有一个很长的窗口来匹配用户轨迹。我们的想法是通过对超过150公里的旅行距离的精心调查进行了评估,涵盖伦敦的不同地区,使用地下火车,地下管道和公共汽车。
数据驱动格林函数法的犯罪预测
地址: http://arxiv.org/abs/1704.00240
作者: Mami Kajita, Seiji Kajita
摘要: 我们提出了一种基于Green函数方案解决的近重复受害模型的犯罪预测算法。绿色的功能是从历史数据集中的犯罪事件密度的时空相关性产生的。我们通过将其应用于芝加哥和纽约市的爆窃数据,来检查我们的方法的准确性。我们发现,这些犯罪的级联具有长期的对数尾部,这与早先对其他盗窃数据的研究一致。所提出的方法是一个强大的工具,不仅可以预测犯罪,还要分析其相关性,因为格林的功能可以描述过去犯罪如何影响未来的事件。
在空间多层网络中传播本地化攻击
地址: http://arxiv.org/abs/1704.00267
作者: Dana Vaknin, Michael M. Danziger, Shlomo Havlin
摘要: 许多现实世界的多层系统(如关键基础设施)是相互依赖的,并且嵌入在具有特征长度的链接的空间中。他们也容易受到局限性的攻击或失败,例如恐怖袭击或自然灾害的影响,影响到给定半径内的所有节点。这里我们研究本地化攻击对两层空间复用网络的影响。我们发现一个亚稳态区域,其中大于临界尺寸的局部攻击会引起成核过渡,因为整个系统的故障级联蔓延,导致其崩溃。我们开发了一种预测关键攻击尺寸的理论,发现它具有新的尺度行为。我们进一步发现,这些多路复用系统中的本地化攻击可以引发以前不可观察的随机和空间级联组合。我们的研究结果证明了现实世界相互依赖网络中的重要漏洞,并展示了空间网络的新理论特征。
双重普遍性表征了现实的空间网络模型
地址: http://arxiv.org/abs/1704.00268
作者: Bnaya Gross, Michael M. Danziger, Sergey V. Buldyrev, Shlomo Havlin
摘要: 统计物理学最强大的发现之一是发现可用于分类和预测看似不同系统的行为的普遍性课程。然而,许多真实世界的复杂网络尚未适用于现有的普遍性课程。在这里,我们研究一个具有特征尺度$ \ zeta $的链接长度的现实空间网络模型。我们发现,这种简单的空间网络拓扑虽然不能满足任何单一普遍性类的要求,但在独特的临界阈值下表现出由两组关键指数组成的新的多重普遍性。这种双重普遍性的特征在于用于小于$ \ zeta $的尺度的测量的平均场尺度定律,但是在更大规模上用于测量的空间尺度。我们通过测量渗透关键指数$ \ nu $(相关长度),$ \ beta $(巨型组件),$ \ gamma $(平均质量)以及化学对几何距离和流行动力的尺度关系来验证这种多重普遍性。通过引入多重普遍性的概念,我们能够概括出复杂拓扑的普遍性概念。
用于核心,桁架和核分解的并行局部算法
地址: http://arxiv.org/abs/1704.00386
作者: Ahmet Erdem Sariyuce, C. Seshadhri, Ali Pinar
摘要: 查找图形的密集区域和它们之间的关系是网络分析中的基本任务。核分解是将k-核和k-桁架分解概括为一个原理的算法框架。它可以利用高阶结构来定位分层关系的密集子图。核分解的计算以多个步骤进行,称为剥离过程,并且它随时需要关于图的全局信息。这样可以防止计算的可扩展并行化。此外,不可能通过剥离过程计算近似和快速的结果,因为它在算法完成之前不产生最密集的区域。在以前的研究中,Lu等提出迭代计算顶点度的h指数以获得核心数,并证明在有限次迭代之后获得收敛。在这项工作中,我们推广了任何核分解的迭代h指数计算,并证明了收敛边界。我们提出一个局部算法的框架来获得精确和近似的核分解。我们的算法是非常平行的,可以提供近似来探索时间和质量的权衡。我们的共享内存实现验证了我们的算法在现实世界网络上的效率,可扩展性和有效性。特别是使用24个线程,我们可以获得高达4.04x和7.98x的k-truss和(3,4)核分解的加速。
识别具有共同组织原则的网络
地址: http://arxiv.org/abs/1704.00387
作者: Anatol E. Wegner, Luis Ospina-Forero, Robert E. Gaunt, Charlotte M. Deane, Gesine Reinert
摘要: 许多复杂的系统可以被表示为网络,并且网络比较的问题越来越重要。有许多网络比较技术,从简单的比较网络摘要统计到复杂但计算上昂贵的基于对齐的方法。然而,准确地聚类具有不同大小和密度的网络仍然具有挑战性,但假定其结构相似。在本文中,我们通过引入一种新的网络比较方法来解决这个问题,该方法旨在确定网络中的共同组织原则。该方法简单,直观,适用于从蛋白质功能分类到跟踪世界贸易网络发展的各种设置。
震惊人群:检查冲击对中国维基百科的影响
地址: http://arxiv.org/abs/1704.00412
作者: Ark Fangzhou Zhang, Danielle Livneh, Ceren Budak, Lionel P. Robert Jr., Daniel M. Romero
摘要: 合作众包已成为全球组织工作的一种流行方式。全球化也意味着容易受到震撼 - 不可预见的事件,扰乱人群 - 起源于任何国家。在这项研究中,我们研究了由于2005年中国大陆政府审查而导致的维基百科编辑的合作行为变化。利用审查制度阻止编辑部分的外生变化,我们研究了三种协作行为措施:活动量,集权和冲突的组大小减少对冲击水平的影响。我们发现,那些面临冲击的文章的活动和冲突下降,而中央集权则增加。冲击对冲击的影响随着冲击程度的增加而增加,而对中度和冲突的影响在中等程度的冲击水平上高于非常小或非常高的冲击水平。这些研究结果为组织理论文献中引入的威胁刚度理论提供了支持 - 在大规模合作人群的背景下。
跟踪随机游走
地址: http://arxiv.org/abs/1704.00480
作者: Riccardo Gallotti, Rémi Louf, Jean-Marc Luck, Marc Barthelemy
摘要: 在随机游走的实证研究中,动物或个体的连续轨迹通常在空间和时间上的有限数量的点上进行采样。然而,不清楚这种部分观察如何影响步行的测量统计特性,我们在这里使用统计物理学的分析和数值方法来研究取样在交替休息和随机持续时间的移动中的作用。我们评估估计的统计属性如何受到轨迹测量的方式的影响,并且我们确定导致最佳可能测量的最佳采样频率。我们解析分析中最简单的一个采样间隔和休息和移动持续时间短尾分布的场景,这使我们可以看出,测量的位移统计量可能与原始位移统计量显着不同,也可以确定最佳采样时间。针对这种短尾情景分析预测的正确采样运动的相应最佳分数是轨迹采样质量的上限。实际上,我们通过数值模拟显示,在我们观察到休息持续时间的长尾分布的任何真实世界的情况下,这个部分都显着减少。我们使用高分辨率GPS人体轨迹测试我们的结果,其中恒定的采样间隔允许最多恢复$ 18 \%$的运动,而平均行程长度超过$ 2 $。如果我们使用从实际通信数据中提取的采样间隔,我们仅恢复$ 11 \%$的移动,这个值不能超过$ 16 \%$甚至理想的算法。这些数字要求在个人轨迹的所有量化研究中更谨慎地使用数据,特别是对基于手机数据的人类流动研究的结果特别严重的怀疑。
程度相关在相互依赖的安全性中的作用:好还是坏?
地址: http://arxiv.org/abs/1704.00571
作者: Richard J. La
摘要: 我们研究程度相关性或网络混合在相互依赖的安全性中的影响。我们使用依赖图来模拟代理商之间的安全性的相互依赖性,并采用人口游戏模型来捕获许多代理商之间的战略交互,并具有可以选择自己保护的各种安全措施。整体网络安全性由我们称之为邻居的平均风险暴露(ARE)来衡量,这与网络中的总(预期)攻击次数成正比。我们首先表明,人口游戏存在独特的纯粹策略纳什均衡。然后,我们证明,随着依赖图中具有较大程度的代理人比具有较小程度的风险更高的风险,整体网络安全性恶化,代理商经历的ARE增加,网络中有更多的攻击。最后,使用这一发现,我们证明网络混合对ARE的影响取决于代理商提供的安全措施的(成本)有效性;如果安全措施无效,依赖图的增加会导致更高的ARE。另一方面,如果安全措施有效抵御攻击造成的损失和损失,增加分拣就可以减少代理商所经历的ARE。
随机几何图中的对称模体
地址: http://arxiv.org/abs/1704.00640
作者: Carl P. Dettmann, Georgie Knight
摘要: 我们在随机几何图中研究对称模体。对称模体是具有相同邻接性的节点的子集。这些子图在随机几何图中特别普遍,并且在拉普拉斯和相邻光谱中出现了清晰,明显的峰值,这是现实世界网络中常见的特征。我们看看它们的外观概率,并将它们与参数空间和尺寸进行比较。然后,我们使用Chen-Stein方法来推导随机几何图形中的最小间隔距离,我们应用于在密集和热力学极限中研究对称图案。在热力学极限中,最接近的节点对称的概率接近一个,而在密集极限中,这个概率取决于维数。
社会媒体传播的检测与解决:调查
地址: http://arxiv.org/abs/1704.00656
作者: Arkaitz Zubiaga, Ahmet Aker, Kalina Bontcheva, Maria Liakata, Rob Procter
摘要: 尽管越来越多地使用社交媒体平台进行信息和新闻采集,但其无差别的性质往往导致谣言的出现和传播,即在发布时未经验证的信息。同时,社交媒体平台的开放性提供了研究用户如何分享和讨论谣言的机会,并探索如何使用自然语言处理和数据挖掘技术来找出确定其真实性的方法。在这次调查中,我们介绍并讨论了在社交媒体上流传的两种传闻:长期传播长期传播的传言,新兴传闻在快节奏的事件中产生,例如突发新闻,报道是零碎地发布的,并且在早期阶段经常处于未经验证的状态。我们提供对社交媒体谣言研究的概述,其最终目标是开发谣言分类系统,包括谣言检测,谣言跟踪,谣言姿态分类和谣言真实性分类四个部分。我们深入研究科学文献中提出的这四个组成部分的发展方法。我们总结了迄今为止谣言分类制度发展所做的努力和成就,并提出了未来社会媒体采矿研究途径的探索和解决谣言的建议。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20170404/