Arxiv网络科学论文摘要5篇(2019-06-03)

2019年06月03日 · 2200 字 · 阅读时间约5分

使用多个指标改进图中隐私的度量;
我们能从语料库中得出明显和隐含的偏见吗？;
通过在手机众感拍卖中惩罚冗余任务分配来最大化出清率;
发现客户评价中在线欺诈群体的串通行为;
图上的端到端学习和优化;

使用多个指标改进图中隐私的度量

原文标题： Using Metrics Suites to Improve the Measurement of Privacy in Graphs

地址： http://arxiv.org/abs/1905.13264

作者： Isabel Wagner, Yuchen Zhao

摘要：社交图被广泛用于研究（例如，流行病学）和商业（例如，推荐系统）。但是，共享这些图表会带来隐私风险，因为它们包含有关个人的敏感信息图匿名化技术旨在保护图中的各个用户，而图去匿名化旨在重新识别用户。通常使用隐私度量来评估匿名化和去匿名化算法的有效性。但是，目前尚不清楚现有的隐私指标在图隐私中使用时的强弱程度。在本文中，我们研究了图匿名化和去匿名化的26个隐私度量，并根据三个标准评估它们的强度：单调性表明度量标准表明较强的对手的隐私较低;对于场景内比较，均匀度表示度量值是否均匀分布;对于场景间比较，共享值范围指示度量标准是否在各个方案中使用一致的值范围。我们的广泛实验表明，没有一个指标可以完美地满足所有三个标准。因此，我们使用来自多标准决策分析的方法来聚合度量套件中的多个度量，并且我们显示这些度量套件与最佳单个度量相比改善了单调性。这一重要结果使得对新图匿名化和去匿名化算法的评估更加单调，从而更准确。

我们能从语料库中得出明显和隐含的偏见吗？

原文标题： Can We Derive Explicit and Implicit Bias from Corpus?

地址： http://arxiv.org/abs/1905.13364

作者： Bo Wang, Baixiang Xue, Anthony G. Greenwald

摘要：语言是引发演讲者态度偏见的一种流行资源，假设演讲者的陈述代表他们对概念的偏见。然而，心理学研究表明，人们在陈述中的明显偏见可能与其隐含的偏见有所不同。尽管显式和隐式偏差对于不同的应用都是有用的，但是当前的自动技术不能区分它们。受到显性和隐性偏见的心理测量的启发，我们开发了一种基于语言的自动技术来重现大量人口的心理测量。通过将每个心理测量与包含特定单词组合的语句联系起来，我们通过理解相应类别语句的情感来得出明确和隐含的偏差。对中英文严谨媒体（维基百科）和非严肃媒体（社交媒体）的广泛实验表明，我们的方法成功地重现了对大量人口的小规模心理观察，并取得了新的发现。

通过在手机众感拍卖中惩罚冗余任务分配来最大化出清率

原文标题： Maximizing Clearance Rate by Penalizing Redundant Task Assignment in Mobile Crowdsensing Auctions

地址： http://arxiv.org/abs/1905.13563

作者： Maggie E. Gendy, Ahmad Al-Kabbany, Ehab F. Badran

摘要：该研究涉及基于拍卖的任务分配和管理在集中式，参与式移动群体（MCS）系统中的有效性。在拍卖期间，基于分别由参与者和平台提供的出价和激励，将感测任务与参与者匹配。最近的文献解决了拍卖中的一些挑战，包括不真实的投标和恶意参与者。我们最近的工作开始解决另一项挑战，即在传感活动中最大化清除率（CR），即完成的传感任务的百分比。在这项研究中，我们提出了一个新的目标函数，用于将任务与参与者匹配，以实现CR最大化，声誉感知的拍卖。特别是，我们惩罚冗余任务分配，其中任务被分配给多个参与者，这可以不必要地消耗预算。我们观察到，某个任务的投标人越少，应该分配的优先级就越高。因此，我们引入了一个新因素，即管理拍卖的任务冗余因素。通过在不同的传感活动条件下进行广泛的模拟，并给出固定的预算，我们表明，与最近文献中的最高清除率相比，惩罚冗余（给予不受欢迎的任务更高的优先级）会使CR显著增加约50％。

发现客户评价中在线欺诈群体的串通行为

原文标题： Spotting Collusive Behaviour of Online Fraud Groups in Customer Reviews

地址： http://arxiv.org/abs/1905.13649

作者： Sarthika Dhawan, Siva Charan Reddy Gangireddy, Shiv Kumar, Tanmoy Chakraborty

摘要：在线评论在购买任何产品之前在决定质量方面起着至关重要的作用。不幸的是，垃圾邮件发送者经常利用在线评论论坛撰写欺诈评论来推广/降级某些产品。当这些垃圾邮件发送者串通并集体注入垃圾邮件评论时，它可能会变得更加有害，因为他们可以完全控制用户的情绪，因为他们注入了大量的欺诈评论。因此，群组垃圾邮件检测比单个级别的欺诈检测更具挑战性，因为群组定义不明确，群间动态变化，标记的群组级别垃圾邮件数据稀缺等等。在这里，我们提出DeFrauder，一种无监督的检测方法在线欺诈审核小组。它首先通过利用基础产品评论图表并结合几种行为信号来检测候选欺诈群体，这些信号模拟了评论之间的多方面协作。然后，它将审阅者映射到嵌入空间，并为每个组分配垃圾邮件分数，使得包含具有高度相似行为特征的垃圾邮件发送者的组实现高垃圾邮件分数。在与四个真实世界数据集（其中两个由我们策划）的五个基线进行比较时，DeFrauder表现出优异的性能，优于最佳基线，NDCG @ 50（平均）跨数据集高出17.64％。

图上的端到端学习和优化

原文标题： End to end learning and optimization on graphs

地址： http://arxiv.org/abs/1905.13732

作者： Bryan Wilder, Eric Ewing, Bistra Dilkina, Milind Tambe

摘要：实际应用程序通常将学习和优化问题结合在一起。例如，我们的目标可能是聚类图以便检测有意义的社区（或解决其他常见的图优化问题，例如设施位置，最大限度等）。然而，通常仅部分地观察图或相关属性，引入学习问题，例如必须在优化之前解决的链路预测。我们提出了一种方法，将用于常见图优化问题的可微代理集成到用于链路预测等任务的机器学习模型的训练中。这允许模型专门关注其预测将用于的下游任务。实验结果表明，我们的端到端系统在示例优化任务上获得的性能优于通过将最先进的链路预测方法与专家设计的图优化算法相结合而获得的性能。

声明：Arxiv文章摘要版权归论文原作者所有，由本人进行翻译整理，未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”（微信号netsci）和个人博客 https://netsci.complexly.cn （提供RSS订阅）进行同步更新。

作者：ComplexLY
微信公众号：netsci
欢迎扫描左侧微信公众号二维码进行交流！
本文地址：https://netsci.complexly.cn/post/20190603/

网络科学研究速递