- 展示共同点促进友谊的形成:大型随机田野实验;
- 使用新型计算框架进行多类Twitter数据分类和地理编码;
- 量化多边社会网络中的三角闭合;
- 社交媒体在水文信息学中的应用综述;
- 有引导的团队划分问题:定义,复杂性和算法;
- 周期中最大化最小值的份额分配;
- 斐波那契数列与图模型的纯优先附着机制之间的联系;
- 挖掘主观感兴趣的属性子图;
- Tag2Vec:标记网络中的标记表示学习;
- 通过新闻传播动态和用户表示学习进行谣言检测;
- Twitter扩散网络的拓扑比较可靠地揭示了虚假信息新闻;
- Lanchester战斗模型的随机版本;
- 改划选区的混乱:地图投影置换区的紧凑度得分;
- May-Leonard模型中的饥饿致死;
- 在线评论可以预测个股的长期回报;
- 一种基于加权随机块模型的混合推荐算法;
- 社交机器人的艺术:综述与分类改进;
展示共同点促进友谊的形成:大型随机田野实验
原文标题: Displaying Things in Common to Encourage Friendship Formation: A Large Randomized Field Experiment
地址: http://arxiv.org/abs/1905.02762
作者: Tianshu Sun, Sean J. Taylor
摘要: 友谊的形成对于在线社交网站和社会很重要,但可能会受到信息摩擦的影响。在这项研究中,我们证明社会网络可以有效地使用IT促进的干预 - 在用户(共同的家乡,兴趣,教育,工作,城市)之间展示共同的东西(TIC) - 以鼓励友谊的形成。显示TIC更新个人对与另一个人共享相似性的信念,并减少在离线通信中可能难以克服的信息摩擦。与在线社会网络合作,我们进行随机现场实验,当用户浏览非朋友的个人资料时,随机改变不同事物的重要性。二元水平的外生变化,与观察者概况网络中任何(未)观察到的结构因素正交,使我们能够清晰地隔离TIC偏好在驱动网络形成和同质性中的作用。我们发现向观众展示TIC可以显著增加他们发送朋友请求和形成友谊的可能性,并且对于几乎没有共同点的人群尤其有效。我们还发现,显示TIC可以改善具有不同人口统计特征的各种观众的友谊形成,并且当TIC对观众更令人惊讶时更有效。
使用新型计算框架进行多类Twitter数据分类和地理编码
原文标题: Multi-class Twitter Data Categorization and Geocoding with a Novel Computing Framework
地址: http://arxiv.org/abs/1905.02916
作者: Sakib Mahmud Khan, Mashrur Chowdhury, Linh B. Ngo, Amy Apon
摘要: 运输数据分析正在成为计算应用的主要领域。运输系统的运行和管理随着计算技术的进步而不断变化。本研究通过一种新颖的计算框架展示了运输数据分析的这种进步。本研究提出了标记的潜在Dirichlet分配(L-LDA) - 结合支持向量机(SVM)分类器,其具有支持计算策略,用于在确定交通相关事件时使用公共可用的Twitter数据(占总Twitter数据的1%)(即,事件,拥堵,特殊事件,建筑和其他事件),为旅行者提供可靠的信息。分析方法包括使用文本分类和基于字符串相似性的地理编码位置来分析推文。为纽约市及其周边地区进行的案例研究证明了分析方法的可行性。总共分析了近700,010条推文,以提取相关的运输相关信息一周。对于像纽约市及其周边地区这样的大型地理区域,使用并行计算,与分析交通相关推文的顺序处理相比,实现了30倍的加速。 SVM分类器在从结构化数据中识别与运输相关的推文方面的准确率达到85%以上。为了进一步将与交通相关的推文分类为子类:事件,拥塞,构造,特殊事件和其他事件,使用三个监督分类器:L-LDA,SVM和L-LDA并入SVM。使用L-LDA结合SVM的分析框架可以对来自Twitter的道路运输相关数据进行分类,准确度超过98.3%,这明显高于独立L-LDA和SVM所达到的精度。
量化多边社会网络中的三角闭合
原文标题: Quantifying Triadic Closure in Multi-Edge Social Networks
地址: http://arxiv.org/abs/1905.02990
作者: Laurence Brandenberger, Giona Casiraghi, Vahan Nanumyan, Frank Schweitzer
摘要: 多边网络捕获个体之间的重复交互。在社会网络中,这样的边通常形成封闭的三角形或三元组。然而,测量这种三元闭合的标准方法对于多边网络是失败的,因为它们不认为三元组可以由不同多重性的边形成。我们提出了一种基于共享伙伴统计的社会交往多边网络的三元闭包的新方法。我们证明了我们的操作能够在合成和经验多边网络中检测到有意义的闭包,其中常见的方法失败。这是推动从二元网络分析到多边和加权网络分析的推理网络分析的基石,这些分析提供了对社会交互和关系的更真实的表示。
社交媒体在水文信息学中的应用综述
原文标题: Applications of Social Media in Hydroinformatics: A Survey
地址: http://arxiv.org/abs/1905.03035
作者: Yufeng Yu, Yuelong Zhu, Dingsheng Wan, Qun Zhao, Kai Shu, Huan Liu
摘要: 研究和实际应用的洪水将社交媒体数据用于广泛的公共应用,包括环境监测,水资源管理,灾难和应急响应。水文信息学可以从社交媒体技术中受益,新出现的数据,技术和分析工具可以处理大型数据集,可以从中挖掘创意和新价值。本文首先提出了一个4W(What,Why,When,hoW)模型和方法结构,以更好地理解和表示社交媒体在水文信息学中的应用,然后提供概述将社交媒体应用于水环境,水资源,洪水,干旱和水资源管理等水文信息学的学术研究。最后,根据前面的讨论,向水文信息管理人员和研究人员提供了数据收集,数据质量管理,虚假新闻检测,隐私问题,算法和平台等与水相关的社交媒体应用的一些高级主题和建议。
有引导的团队划分问题:定义,复杂性和算法
原文标题: The Guided Team-Partitioning Problem: Definition, Complexity, and Algorithm
地址: http://arxiv.org/abs/1905.03037
作者: Sanaz Bahargam, Theodoros Lappas, Evimaria Terzi
摘要: 很多文献都集中在从大量候选人中选择一个人团队的问题,以便尊重某些约束,并使给定的目标函数最大化。尽管现存的研究成功地考虑了不同的目标函数和约束系列,但最常见的限制之一是关注单团队范式。尽管在多个域中有充分记录的应用程序,但当团队构建者需要将整个群体划分为多个团队时,这种模式是不合适的。团队划分任务在教育环境中非常普遍,在教学环境中,教师必须将班级中的学生划分为团队以进行协作项目。当组织需要将员工分成具有特定属性的团队来处理相关项目时,任务也会出现在组织的背景下。在这项工作中,我们通过引入指导团队分区(GTP)问题来扩展团队形成文献,该问题要求将群体划分为团队,使得每个团队的质心尽可能接近给定的目标向量。正如我们在工作中详细描述的那样,此配方允许团队建设者控制生产团队的组成,并在实际环境中具有自然应用。 GTP的算法需要同时考虑竞争相同候选人群的多个非重叠团队的组成。这使得问题比专注于优化单个团队的配方更具挑战性。事实上,我们证明GTP是NP难以解决甚至是近似的。问题的复杂性促使我们考虑有效的算法启发式算法,我们通过实验和合成数据集的实验来评估。
周期中最大化最小值的份额分配
原文标题: Maximin share allocations on cycles
地址: http://arxiv.org/abs/1905.03038
作者: Zbigniew Lonc, Miroslaw Truszczynski
摘要: 不可分割商品的公平分配问题是社会选择的根本问题。最近,问题扩展到商品形成图表并且目标是将商品分配给代理商以使每个代理商的包形成连接子图的情况。对于maximin股票公平性标准,研究人员证明,如果商品形成一棵树,那么为每个代理商提供至少她的最大股票价值的分配总是存在。而且,它们可以在多项式时间内找到。我们在这里考虑一个周期的maximin股票分配问题。尽管图表很简单,但问题证明比树版本更难。我们提出了存在最大周期货物份额分配的情况,并提供分配结果,保证每个代理人的最大份额的某一部分。我们还研究了用于计算周期中货物的最大份额分配的算法。
斐波那契数列与图模型的纯优先附着机制之间的联系
原文标题: Handshake between Fibonacci series and pure preferential attachment mechanism on a graph-model
地址: http://arxiv.org/abs/1905.03039
作者: Fei Ma, Ding Wang, Ping Wang, Bing Yao
摘要: 为了更好地理解自然和人造复杂系统的动态功能,来自各个学科的许多研究人员,包括统计物理学,数学,理论计算机科学等,花了很多时间来做这个有趣的事情。研究。在本文中,讨论的主题,如何构建合理的图模型,然后使用以前提出的理论模型来解释现实网络的许多特征,仍然是我们的主要工作。与单一演化方式中许多已有的确定性图模型相比,我们可以使用三种生长方式构建新的图模型,以满足优先连接机制。同时将报告与网络研究相关的几个典型指数。此外,还将展示一些有趣的发现,包括斐波那契系列与“纯”优先附着机制之间的第一次握手,这是一个明显的关系,它连接了两个众所周知的规则,幂律和Zipf定律,以及一个常见但有用的等式。生成树数和具有最大叶的生成树数的基础。基于上述讨论,我们可以证明我们的图模型服从幂律和小世界属性。对于未来的研究方向,我们提出了一些未知的问题需要在本文的最后研究。
挖掘主观感兴趣的属性子图
原文标题: Mining Subjectively Interesting Attributed Subgraphs
地址: http://arxiv.org/abs/1905.03040
作者: Anes Bendimerad, Ahmad Mel, Jefrey Lijffijt, Marc Plantevit, Céline Robardet, Tijl De Bie
摘要: 图,数据聚类和局部模式挖掘中的社区检测是数据挖掘和机器学习的三个成熟领域。近年来,归因于子图挖掘正在成为这些领域交叉的新的强大数据挖掘任务。给定每个顶点的图和一组属性,属性子图挖掘的目的是找到内聚子图,其属性值(的一个子集)在某种意义上具有异常值。虽然对这一任务的研究可以借鉴上述三个领域,但图和属性数据的原则整合带来了两个挑战:一种直观的模式语言的定义,有助于高效的搜索策略,以及这种模式的有趣性的形式化。模体。我们提出了针对这两个挑战的集成解决方案。所提出的模式语言在高度灵活和直观的基础上改进了先前的工作。我们展示了一个有效且有原则的算法如何枚举这种语言的模式。用于量化该语言模式的兴趣的建议方法植根于信息论,并且能够解释关于数据的先验知识。先前的工作通常基于子图的内聚和单独的属性的异常来量化兴趣,将它们组合在参数化的权衡中。相反,在我们的提案中,这种权衡是以原则性,无参数的方式隐式处理的。大量的实证结果证实了所提出的模式语法是直观的,并且趣味性度量与实际的主观兴趣度很好地对齐。
Tag2Vec:标记网络中的标记表示学习
原文标题: Tag2Vec: Learning Tag Representations in Tag Networks
地址: http://arxiv.org/abs/1905.03041
作者: Junshan Wang, Zhicong Lu, Guojie Song, Yue Fan, Lun Du, Wei Lin
摘要: 网络嵌入是一种学习复杂网络中节点的低维表示向量的方法。在实际网络中,节点可以具有多个标签,但是现有方法忽略标签的丰富语义和分层信息。此信息对许多网络应用程序很有用,通常非常稳定。在本文中,我们提出了一种标签表示学习模型Tag2Vec,它将节点和标签混合到一个混合网络中。首先,对于标签网络,我们将语义距离定义为标签之间的接近度,并设计一种新颖的策略,参数化随机游走,自适应地生成具有语义和标签层次信息的上下文。然后,我们提出双曲线Skip-gram模型,以较低的输出维度更好地表达复杂的层次结构。我们在NBER美国专利数据集和WordNet数据集上评估我们的模型。结果表明,我们的模型可以学习具有丰富语义信息的标签表示,并且优于其他基线。
通过新闻传播动态和用户表示学习进行谣言检测
原文标题: Rumour Detection via News Propagation Dynamics and User Representation Learning
地址: http://arxiv.org/abs/1905.03042
作者: Tien Huu Do, Xiao Luo, Duc Minh Nguyen, Nikos Deligiannis
摘要: 谣言已存在很长时间,并因严重后果而闻名。社交媒体平台的快速增长使得谣言的负面影响成倍增加;因此,及早发现它们变得很重要。已经引入了许多方法来使用新闻的内容或社交背景来检测谣言。然而,大多数现有方法忽略或不有效地探索社交媒体中新闻的传播模式,包括社交媒体用户与新闻的跨时间交互的顺序。在这项工作中,我们提出了一种基于深度学习的谣言检测的新方法。我们的方法通过学习用户的表示和用户响应的时间相互关系来利用新闻的传播过程。在Twitter和微博数据集上进行的实验证明了所提方法的最新性能。
Twitter扩散网络的拓扑比较可靠地揭示了虚假信息新闻
原文标题: Topology comparison of Twitter diffusion networks reliably reveals disinformation news
地址: http://arxiv.org/abs/1905.03043
作者: Francesco Pierri, Carlo Piccardi, Stefano Ceri
摘要: 近年来,社交媒体上的恶意信息爆炸式增长,带来严重的社会和政治反弹。最近进行大规模分析的重要研究已经对这个问题产生了更深入的了解,表明虚假信息比社交媒体上的真相更快,更深,更广泛地传播,社交媒体和回声室在传播网络中发挥着重要作用。根据这些指示,我们探索了对社交媒体上流传的新闻文章进行分类的可能性,这些新闻文章完全基于对其扩散网络的拓扑分析。为此,我们在Twitter上收集了一个关于扩散网络的大型数据集,涉及来自主流和虚假信息渠道的新闻文章。我们使用几种无对齐方法对这些网络进行了广泛的比较,包括基本网络属性,中心度量分布和网络距离。因此,我们评估这些特征在多大程度上允许区分与上述新闻域相关联的网络。我们的研究结果突出了通过单独检查所产生的扩散网络,迅速正确地识别在社交媒体上传播的虚假信息的可能性。
Lanchester战斗模型的随机版本
原文标题: On a stochastic version of Lanchester’s model of combat
地址: http://arxiv.org/abs/1905.03122
作者: Michael J. Kearney, Richard J. Martin
摘要: 兰彻斯特的战斗模式由于忽略了随机波动的影响而在标准形式上存在某些缺陷。已经提出了几种纠正这种方法的方法,并且各种结果分散在整个文献中。这里,重新考虑离散时间随机版本,其适合于精确解决方案,目的是在一个设置内导出关键结果。该博览会简化并提供了对早期派生和分析的改进。
改划选区的混乱:地图投影置换区的紧凑度得分
原文标题: The Gerrymandering Jumble: Map Projections Permute Districts’ Compactness Scores
地址: http://arxiv.org/abs/1905.03173
作者: Assaf Bar-Natan, Lorenzo Najt, Zachary Schutzman
摘要: 在政治上的重新划分中,一个地区的紧凑性被用作其公平性的量化代表。几个完善但竞争的地理紧凑性概念通常用于评估区域的形状,包括Polsby-Popper评分,凸壳评分和Reock评分,这些评分用于比较两个或更多区域或计划。在本文中,我们在数学上证明,从球体到平面的任何地图投影都反转了所有这三个得分中某些区域的得分的排序。根据经验,我们证明了共同墨卡托地图投影对Reock分数顺序的影响是非常显著的。
May-Leonard模型中的饥饿致死
原文标题: Death by starvation in May-Leonard models
地址: http://arxiv.org/abs/1905.03182
作者: P.P. Avelino, B.F. de Oliveira
摘要: 我们考虑空间随机May-Leonard模型的动力学,在不同物种的任何两个个体之间具有相等强度的相互捕食相互作用。使用具有两个和三个pecies的二维模拟,我们研究了在给定阈值数量的连续不成功捕食尝试之后个体死亡的动态影响。我们发现这些人的死亡会对人口网络的动态产生强烈影响,并为维持共存做出重要贡献。
在线评论可以预测个股的长期回报
原文标题: Online reviews can predict long-term returns of individual stocks
地址: http://arxiv.org/abs/1905.03189
作者: Junran Wu, Ke Xu, Jichang Zhao
摘要: 在线评论是消费者自愿发布的有关其消费体验的反馈。这种反馈表明了客户对品牌或公司的态度,意识和信心等态度,表明了公司未来销售,现金流和股票定价的内在联系。然而,在线评估对股票长期回报的预测能力,特别是在个人层面,几乎没有受到研究关注,需要进行全面的探索以解决现有的争论。在本文中,该论文完全基于在线评论,建立了一个预测具有胜任绩效的个股长期收益的方法框架。具体而言,从超过1800万个产品评论中推断出的13个类别的6,246个特征被选择用于构建预测模型。使用从交叉验证测试中选择的最佳分类器,与具有10个技术指标为特征的尖端解决方案相比,实现了令人满意的准确度提高13.94%,相对于随机值提高了18.28%。我们模型的稳健性在现实场景中得到进一步评估和验证。因此,首次确认个股的长期回报可以通过在线评论预测。该研究为投资者提供了对个股长期投资的新机会。
一种基于加权随机块模型的混合推荐算法
原文标题: A hybrid recommendation algorithm based on weighted stochastic block model
地址: http://arxiv.org/abs/1905.03192
作者: Yuchen Xiao, Ruzhe Zhong
摘要: 混合建议通常将协同过滤与基于内容的过滤相结合,以利用两种技术的优点。人们普遍认为混合滤波优于单一算法,因此近年来它已成为电子商务的新趋势。在本文中,我们提出了一种基于加权随机块模型(WSBM)的新型混合推荐系统。我们的算法不仅充分利用基于内容和协同过滤的推荐来解决冷启动问题,而且通过用WSBM选择最近邻居来提高推荐的准确性。实验结果表明,与传统的混合推荐相比,我们提出的方法具有更好的预测和分类精度。
社交机器人的艺术:综述与分类改进
原文标题: The Art of Social Bots: A Review and a Refined Taxonomy
地址: http://arxiv.org/abs/1905.03240
作者: Majd Latah
摘要: 社交机器人代表了新一代机器人,它们利用在线社会网络(OSN)作为命令和控制(C \和C)频道。恶意社交机器人负责发起大规模垃圾邮件活动,推广低价股,操纵用户的数字影响力以及进行政治性的人畜冲击。本文详细介绍了目前的社交机器人和适当的技术,可以用来在OSNs防御的雷达下飞行很长一段时间都无法察觉。我们还建议从社会网络角度对检测方法进行精细分类,以及常用数据集及其相应的发现。我们的研究可以帮助OSN管理员和研究人员了解恶意社交机器人的破坏性潜力,并可以改善目前针对他们的防御策略。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20190509/