- 通过凸层聚合的多层谱图聚类:理论与算法;
- 在线讨论是否被操纵?量化在线社交媒体中的在线讨论真实性;
- 人们如何不同?社交媒体方法;
通过凸层聚合的多层谱图聚类:理论与算法
地址: http://arxiv.org/abs/1708.02620
作者: Pin-Yu Chen, Alfred O. Hero
摘要: 多层图通常用于表示实体之间的不同关系和处理异构数据处理任务。需要非标准的多层图聚类方法来将集群分配给公共多层节点集合并且用于组合来自每个层的信息。本文提出了一种执行凸层聚合的多层谱图聚类(SGC)框架。在多层信号加噪声模型下,我们提供了聚类可靠性的相变分析。此外,我们使用相变标准为多层SGC提出了一种多层次迭代模型阶选择算法(MIMOSA),其具有自动聚类分配和层权重适配,并提供统计聚类可靠性保证。合成多层图的数值模拟验证了相变分析,实际的多层图表显示,MIMOSA比其他聚类方法更具竞争力或更好。
在线讨论是否被操纵?量化在线社交媒体中的在线讨论真实性
地址: http://arxiv.org/abs/1708.02763
作者: Aviad Elyashar, Jorge Bendahan, Rami Puzis
摘要: 在线社交媒体(OSM)对今天的世界影响很大。有些人认为OSM是滥用的肥沃土地,并用它来传播错误信息,政治宣传,诋毁竞争对手和传播垃圾邮件。人群众多的行业雇佣了大量的机器人和人力工作人员操纵OSM并歪曲公众舆论。 OSM滥用者操纵的在线讨论话题的检测是一个引起重视的新兴问题。在本文中,我们提出了一种基于参与讨论的OSM帐户与已知滥用者和合法账户的相似性量化网络讨论真实性的方法。我们的方法使用多个相似性函数进行OSM账户的分析和分类。所提出的方法使用为本研究收集的Twitter数据和以前发表的阿拉伯蜜罐数据进行了演示。前者包括参与人群平台的手动标记的帐户和滥用者。从帐目相似性功能中得出的主题真实性的演示表明,建议的方法对于歧视滥用者强烈推动的主题和吸引真正的公共利益的话题是有效的。
人们如何不同?社交媒体方法
地址: http://arxiv.org/abs/1708.02900
作者: Vincent Wong, Yaneer Bar-Yam
摘要: 包括心理学和语言学在内的各种领域的研究已经发现了个人特征和行为的相关性和模式,但是,为了了解更广泛的人类行为异质性的努力尚未将这些方法和观点与凝聚力的方法相结合。在这里,我们提取行为模式,并将这些模式与高维图相关联。我们使用维度降低来分析来自在线讨论平台Reddit的文本数据中的文字使用情况。我们发现,代词可以用来表征两个最突出的维度的空间,它们捕捉到词语使用的最大差异,即使代词不包括在这些维度的确定中。这些模式与讨论主题的模式重叠,以揭示可以描述用户群体的代词和主题之间的关系。这一分析证实了过去研究中发现的词汇使用差异的结果,并将它们相互合成。我们相信,这是了解人们之间的差异如何相互关联的一步。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客 https://netsci.complexly.cn 进行更新,并提供RSS订阅。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20170810/