- 加权有向聚类:异构、推断和测量网络的解释和要求;
- 连续时间网络中的频繁模式挖掘;
- 国家干预主义在竞争性公司市场中的临界现象;
- 转发网络中的社区演化;
- 具有猝灭性障碍的连续意见动力学模型中的共识,两极分化和共存;
- 通过半定规划同时进行社区检测和旋转同步;
- 不止是与连接见面:检查人际关系在社会网络中的作用;
- 将铁路延迟传播建模为类似扩散的扩展;
- 将患者护理聚集到泡中的建模和评估;
- 模拟接种疫苗的城市大学人口中的COVID-19;
- 货币化宣传:极右翼极端分子如何通过视频流赚钱;
- 识别在线社会网络中的有偏用户以提高情感分析的准确性:一种基于用户行为的方法;
- 低资源语言的多语言进攻性语言识别;
- 全球国家和社会传染动态参考;
加权有向聚类:异构、推断和测量网络的解释和要求
原文标题: Weighted directed clustering: interpretations and requirements for heterogeneous, inferred, and measured networks
地址: http://arxiv.org/abs/2105.06318
作者: Tanguy Fardet, Anna Levina
摘要: 边的权重和方向性承载着我们可以从复杂网络中提取的大部分信息。但是,最初针对无向二进制网络制定了许多措施。合并有关权重信息的必要性导致了多重扩展的概念,特别是此处讨论的局部聚类系数的定义。我们发现并非所有这些扩展都被完全加权。有些取决于程度,因此在将无限小的砝码边更换为不存在边时会发生很大变化,这并非始终是理想的功能。我们称这些方法为“混合”方法,并认为在许多情况下,应首选完全加权的定义。在列出了适当地分析许多各种加权网络的方法的必要要求之后,我们提出了一个完全加权的连续聚类系数,该系数满足所有先前提出的标准,同时对于消失的权重也是连续的。我们证明了Zhang-Horvath聚类的行为和意义以及我们新的连续定义提供了互补的结果,并且在多个相关条件下明显优于其他定义。
连续时间网络中的频繁模式挖掘
原文标题: Frequent Pattern Mining in Continuous-time Temporal Networks
地址: http://arxiv.org/abs/2105.06399
作者: Ali Jazayeri, Christopher C. Yang
摘要: 网络在不同学科中被用作具有高度表达能力的工具。近年来,时态网络的分析和挖掘引起了人们的广泛关注。频繁模式挖掘被认为是网络科学文献中必不可少的任务。除了众多应用之外,对网络中频繁模式挖掘的研究还直接影响其他分析方法,例如聚类,准clique和clique挖掘以及链路预测。在为时态网络中的频繁模式挖掘提出的几乎所有算法中,网络都表示为静态网络的序列。然后,挖掘网络间或网络内的模式。这种表示形式对挖掘问题施加了计算表达权衡。在本文中,我们提出了一种新颖的表示形式,它可以无损地保留网络的时间方面。然后,我们介绍约束间隔图(CIG)的概念。接下来,我们开发了一系列算法,用于挖掘时间网络数据集中的完整的频繁时间模式集。我们还考虑了同构的四个不同定义,以允许在时间数据收集中容忍噪声。针对三个现实世界的数据集实施该算法证明了该算法的实用性以及发现各种设置中未知模式的能力。
国家干预主义在竞争性公司市场中的临界现象
原文标题: Critical phenomena in the market of competing firms induced by state interventionism
地址: http://arxiv.org/abs/2105.06206
作者: Michal Chorowski, Ryszard Kutner
摘要: 我们在这项工作中实现了两个主要目标。首先,我们提出了一种灵活的算法,可以模拟政府/政府干预的各种情况。其次,我们分析了展示竞争企业市场关键行为的情景,这取决于政府干预的程度和企业的活动水平。因此,我们分析了二阶相变序列,找到了关键干预的水平和关键指数值。结果,我们观察到在关键干预水平上波动的急剧增加以及与前沿技术有关的平均市场技术的局部崩溃。
转发网络中的社区演化
原文标题: Community evolution in retweet networks
地址: http://arxiv.org/abs/2105.06214
作者: Bojan Evkoski, Igor Mozetic, Nikola Ljubesic, Petra Kralj Novak
摘要: 社会网络中的社区通常反映出其成员之间的紧密社会联系以及它们随着时间的演变。我们提出了一种方法,该方法可跟踪转推网络中社区演变的两个方面:成员在社区内,社区外和社区之间的流动及其影响。我们从高分辨率的时间窗口开始,然后选择几个时间点,这些时间点在社区之间表现出很大的差异。对于社区发现,我们提出了一种两阶段方法。在第一阶段,我们应用增强的Louvain算法(称为Ensemble Louvain)来找到稳定的社区。在第二阶段,我们在这些社区之间形成影响力联系,并确定相互联系的超级社区。对于检测到的社区,我们计算内部和外部影响,对于个人用户,计算转发的h指数影响。我们将建议的方法应用于所有斯洛文尼亚推文的三年Twitter数据。分析表明,斯洛文尼亚的十二球层以政治为主导,左翼社区较大,而右翼社区和使用者的影响要大得多。有趣的发现是,尽管发生了Covid-19大流行或政府更迭等事件,但转推网络的变化相对缓慢。
具有猝灭性障碍的连续意见动力学模型中的共识,两极分化和共存
原文标题: Consensus, polarisation and coexistence in a continuous opinion dynamics model with quenched disorder
地址: http://arxiv.org/abs/2105.06123
作者: Joseph William Baron
摘要: 介绍了意见动态的通用模型,其中,每个人的意见都是在有界连续谱上进行测量的。人口中的每种其他观点均受不同观点的异质影响。事实证明,在此模型中,共识,两极分化和适度意见的传播都是可能的。使用动态平均场理论,我们能够识别引起上述每种新兴现象的个体之间相互作用的统计特征。还研究了每个观察到的宏观状态之间过渡的性质。事实证明,个人之间互动的异质性可能导致两极分化,大多数是对抗性或逆向互动可以促进中度意见的共识,而大多数加强互动性则鼓励大多数人采取极端意见。
通过半定规划同时进行社区检测和旋转同步
原文标题: Joint Community Detection and Rotational Synchronization via Semidefinite Programming
地址: http://arxiv.org/abs/2105.06031
作者: Yifeng Fan, Yuehaw Khoo, Zhizhen Zhao
摘要: 在存在异构数据的情况下,随机旋转的对象属于多个基础类别,将它们同时分类为聚类并基于成对关系进行同步具有挑战性。这引起了社区检测和同步的共同问题。我们提出了一系列半定松弛,并证明了当将著名的随机块模型扩展到这个新的设置旋转和聚类身份的新环境时,它们的精确恢复。数值实验证明了我们提出的算法的有效性,并证实了我们的理论结果,该结果表明了精确恢复的尖锐相变。
不止是与连接见面:检查人际关系在社会网络中的作用
原文标题: More than Meets the Tie: Examining the Role of Interpersonal Relationships in Social Networks
地址: http://arxiv.org/abs/2105.06038
作者: Minje Choi, Ceren Budak, Daniel M. Romero, David Jurgens
摘要: 对话中的主题部分取决于说话者之间的人际关系类型,例如友谊,亲戚关系或浪漫史。识别这些关系可以提供个人如何交流的丰富描述,并揭示关系如何影响人们共享信息的方式。使用超过960万个Twitter用户的数据集,我们显示了关系类型如何影响语言使用,主题多样性,交流频率和对话的日间模式。这些差异可用于预测两个用户之间的关系,最佳预测模型可实现0.70的宏F1得分。我们还演示了关系类型如何通过预测未来转推的任务来影响通信动态。将关系作为功能添加到强大的基线模型中,可使F1和召回率分别提高1%和2%。这项研究的结果表明,关系类型有可能提供新的见解,以理解社会网络中的沟通和信息传播是如何发生的。
将铁路延迟传播建模为类似扩散的扩展
原文标题: Modelling railway delay propagation as diffusion-like spreading
地址: http://arxiv.org/abs/2105.06111
作者: Mark M. Dekker, Alexey N. Medvedev, Jan Rombouts, Grzegorz Siudem, Liubov Tupikina
摘要: 铁路系统是世界范围内重要的运输手段。但是,拥堵或干扰可能会大大降低这些系统的效率,从而使预测和理解由此产生的火车延误成为铁路组织的优先事项。在各种各样的模型中研究了延误,这些模型通常将列车模拟为承载延误的离散主体。相反,在本文中,我们定义了一种研究延误的新颖模型,其中延误是通过类似扩散的过程在整个铁路网络中传播的。这种类型的建模具有多种优势,例如计算速度快和易于使用各种统计工具(例如谱方法),但也存在与延迟和运载延迟的方向性和离散性有关的限制。我们将模型应用于比利时铁路,并研究其在模拟严重干扰铁路情况下的延迟传播时的性能。特别是,我们通过提议将比利时铁路系统聚集到车站集合中并相应地调整模型,来讨论空间聚集的作用。我们发现这种聚合显著提高了模型的性能。对于某些特定情况,可以找到模型在其上表现最佳的非平凡的最佳空间分辨率级别。我们的结果表明,这种类型的延迟模型有可能理解铁路系统的大规模特性。
将患者护理聚集到泡中的建模和评估
原文标题: Modeling and Evaluation of Clustering Patient Care into Bubbles
地址: http://arxiv.org/abs/2105.06278
作者: D. M. Hasibul Hasan, Alex Rohwer, Hankyu Jang, Ted Herman, Philip M. Polgreen, Daniel K. Sewell, Bijaya Adhikari, Sriram V. Pemmaraju
摘要: COVID-19对世界各地的医疗机构造成了沉重负担。已经提出将患者和医护人员(HCP)归入“泡沫”作为一种感染控制机制。在本文中,我们提出了一种新颖而灵活的模型,用于将医疗机构中的患者护理聚集成气泡,以最大程度地减少感染的传播。我们的模型旨在控制患者/住院病人和HCP的各种费用,以避免聚集患者护理的潜在的下游负面影响。该模型导致一个离散的优化问题,我们称之为BubbleClustering问题。该问题将代表HCP移动性的临时访问图作为输入,包括HCP对患者/住院室的访问。问题的输出是重连的访问图,该图是通过将HCP和患者房间划分为多个气泡并将HCP访问重连到患者房间而获得的,因此,对患者的护理主要限于构建的气泡。尽管BubbleClustering问题通常很难解决,但我们还是提出了该问题的整数线性规划(ILP)公式,对于典型医院单位和长期护理机构引起的问题实例,可以最佳地解决该问题。我们将整体解决方案称为网络成本感知布线(CoRN)。我们使用来自医院医疗重症监护室以及两个长期护理机构的细粒度运动数据评估CoRN。这些数据是使用我们构建和部署的传感器系统获得的。从我们的实验结果中得出的主要结论是,可以使用CoRN通过减少患者和HCP的队列来大幅减少感染的传播,而不会牺牲患者的护理,并且在轮班期间的时间和距离方面对HCP的额外成本最小。
模拟接种疫苗的城市大学人口中的COVID-19
原文标题: Modeling COVID-19 Spread in a Vaccinated Urban University Population
地址: http://arxiv.org/abs/2105.06446
作者: Matthew Junge, Sheng Li, Samitha Samaranayake, Matthew Zalesak
摘要: 我们构建了一个基于智能体的SEIR模型,以模拟2021年秋季学期在16000名学生(主要是非住宅城市大学)中传播的COVID-19。我们发现,即使疫苗覆盖率较高,重新开放也可能导致感染率远高于目前的周围社区水平。由于许多就读城市大学的学生属于犹豫不决的人群,无症状病例给这些学生的家庭和社区带来了更大的附带风险。我们建议此类大学确保为大多数校园人口接种疫苗,进行无症状筛查测试,限制校园内的人数并鼓励学生安全地进行社交。
货币化宣传:极右翼极端分子如何通过视频流赚钱
原文标题: Monetizing Propaganda: How Far-right Extremists Earn Money by Video Streaming
地址: http://arxiv.org/abs/2105.05929
作者: Megan Squire
摘要: 诸如Youtube,Twitch和DLive之类的视频流平台允许用户为观看者提供实时流视频内容,观看者可以选择通过捐款来表达自己的谢意。 DLive是较小的鲜为人知的流媒体平台之一,并且从历史上看,其内容审核实践较少。因此,这里已成为暴力极端主义分子和其他秘密组织赚钱和宣传的好去处。 DLive流媒体生态系统的财务结构是什么,多少钱在易手?过去,由于活动的秘密性质以及由于难以从社交媒体平台获取数据,因此很难理解极右翼极端分子是如何通过播客和视频流进行募捐的。本文介绍了一个新颖的实验,该实验从DLive的公开交易分类账中收集和分析数据,以理解秘密的极右翼视频流社区的财务结构。本文的主要发现是,首先,大多数捐赠者以不同的频率使用小额支付,但是一小部分捐赠者花费大量资金来为其最喜欢的彩带筹集资金。接下来,向备受瞩目的极右流媒体节目捐款的时间安排遵循与广播时间表紧密相关的相当可预测的模式。最后,最右边的视频流财务状况被分为多个单独的团体,这些团体在大量捐赠方面几乎没有交叉。这项工作对试图理解极端分子如何利用利基社交媒体服务(包括视频平台)进行宣传和筹款的技术公司,政策制定者和研究人员而言非常重要。
识别在线社会网络中的有偏用户以提高情感分析的准确性:一种基于用户行为的方法
原文标题: Identifying Biased Users in Online Social Networks to Enhance the Accuracy of Sentiment Analysis: A User Behavior-Based Approach
地址: http://arxiv.org/abs/2105.05950
作者: Amin Mahmoudi
摘要: 从在线社会网络(OSN)交互中提取关于产品,电影和食物的用户意见的自动方法的开发是情感分析和意见挖掘研究的主要兴趣之一。情绪分析领域中的现有方法大多不会区分不同类型用户的句子,即使某些用户始终是负面的,而某些用户总是正面的。因此,找到一种识别这两种类型用户的方法很重要,因为它们的态度会改变对企业和产品的用户评论的分析。由于自然语言处理的复杂性,纯文本挖掘方法可能导致对审阅文本中表达的情感的确切性质产生误解。在这项研究中,我们提出了一种神经网络分类器,可以根据用户的心理行为来预测有偏见的用户的存在。对用户心理行为的识别使我们能够找到过度积极和过度消极的用户,并对这些用户的态度进行分类,无论其评论文本的内容如何。实验结果表明,对于三个不同的数据集,可以根据用户行为预测偏向用户,准确率分别为89%,67%和81%。
低资源语言的多语言进攻性语言识别
原文标题: Multilingual Offensive Language Identification for Low-resource Languages
地址: http://arxiv.org/abs/2105.05996
作者: Tharindu Ranasinghe, Marcos Zampieri
摘要: 令人反感的内容在社交媒体中无处不在,是引起公司和政府组织关注的原因。最近发表了几项研究,以研究各种形式的此类内容(例如仇恨言论,网络欺凌和网络侵略)。这些研究中的绝大部分涉及英语,部分原因是因为大多数带注释的可用数据集都包含英语数据。在本文中,我们通过应用跨语言的上下文词嵌入和转移学习来利用低资源语言进行预测,从而利用可用的英语数据集。我们以阿拉伯文,孟加拉文,丹麦文,希腊文,印地文,西班牙文和土耳其文的可比数据预测。我们在2020年OffensEval中报告孟加拉语0.8415 F1宏的结果,丹麦语中0.8532 F1宏,希腊语的0.8701 F1宏,HASOC 2019共享任务中印地语的0.8568 F1宏和SemEval中西班牙文的0.7513 F1宏的结果-2019任务5(HatEval)显示,与使用这三种语言的最新共享任务提交的最佳系统相比,我们的方法具有优势。此外,我们使用OffensEval 2020共享任务的培训和开发集报告了阿拉伯语和土耳其语的竞争表现。所有语言的结果都证实了跨语言上下文嵌入的鲁棒性,并为该任务提供了转移学习的机会。
全球国家和社会传染动态参考
原文标题: Reference to Global State and Social Contagion Dynamics
地址: http://arxiv.org/abs/2105.06003
作者: Kyuho Jin, Unjong Yu
摘要: 基于网络的社会传染模型围绕着关于地方互动的信息展开。它的中心重点是网络拓扑属性,这些拓扑属性决定了本地交互以及最终的社会传播结果。我们通过将有关全球状态的信息或基于全球信息的信息引入基于网络的模型,并分析其如何改变六种不同类型的网络中的社会传染动态,来扩展这种方法:二维方格,小世界网络,Erd H o sR ‘e nyi网络,常规随机网络,Holme-Kim网络和Barab ‘a si-Albert网络。我们发现,存在最佳数量的全局信息,可以最大程度地缩短在高度集群的网络中到达全局级联的时间。我们还发现,全局信息会延长达到临界点的时间,但在此之后会大大压缩到达全局级联的时间,因此甚至可以在某些条件下缩短到达全局级联的总时间。最后,我们证明了随机链接替代了全球信息,从而调节了社会传染的动态。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20210514/