最近几周不在国内,更新或有延迟。
- ICT数据中的空间信息是否可靠?;
- 移民的城市梦想 - 以上海移民融合为例;
- 通过社会影响控制选举;
- 网络嵌入综述;
- 复杂网络中的拓扑与动力学:边互惠的作用;
- 自然和有效的模糊头部修复;
- 在共演化选民模型中链接和节点排序的耦合;
- 通过众包来检测社会网络中的假新闻;
- 性别歧视的语义地图:日常性别项目的主题建模;
ICT数据中的空间信息是否可靠?
原文标题: Is spatial information in ICT data reliable?
地址: http://arxiv.org/abs/1609.03375
作者: Maxime Lenormand, Thomas Louail, Marc Barthelemy, José J. Ramasco
摘要: 利用个人ICT设备产生的数据研究越来越多的人类活动。特别是,当ICT数据包含空间信息时,它们是分析城市动态的宝贵资料。然而,调查这类结果对数据特征波动的稳健性的贡献相对较少。在这里,我们对塞内加尔900万人在全年被动生产的手机数据中提取的更高级别信息进行了稳定性分析。我们着重于两个信息检索任务:(a)从交流活动的时间节奏中确定达喀尔地区的土地使用情况; (b)确定匿名个人的家庭和工作地点,这些地点能够构建通勤流量的始发地(OD)矩阵。我们的分析表明,结果的不确定性在很大程度上取决于样本数量,收集数据的年份的规模和时期。尽管如此,不同样本计算的土地利用空间分布具有显著的稳健性:平均而言,当考虑到至少10万个用户的活动时,不同空间分区之间的共享表面积的平均值超过了75%。 OD矩阵不太稳定,在考虑从10万个用户的家庭工作地点构建的所有类型的流量时,至少有75%的乘客的比例取决于规模。对于这两个任务来说,在更大的聚合级别或考虑更多的用户时可以获得更好的结果。这些结果证实,ICT数据是城市系统空间分析的非常有用的资料来源,但是它们的可靠性通常应该被更彻底地检验。
移民的城市梦想 - 以上海移民融合为例
原文标题: Urban Dreams of Migrants: A Case Study of Migrant Integration in Shanghai
地址: http://arxiv.org/abs/1706.00682
作者: Yang Yang, Chenhao Tan, Zongtao Liu, Fei Wu, Yueting Zhuang
摘要: 人类空前的流动性推动了全球迅速的城市化进程。在中国,1978年至2012年,城市人口居住比例从17.9%上升到52.6%。这种大规模的移民给决策者带来了挑战,也给研究人员带来了重要的问题。为了调查移民融合的过程,我们在上海使用了一个为期一个月的电信元数据完整数据集,用户达到5,400万,通话记录达到6.98亿。我们发现移动通信网络和地理位置的本地人和移民之间存在系统性差异。例如,移民在定居后有更多不同的接触,在城市周围移动的半径大于当地人。通过区分新移民(最近移居上海)和定居的移民(他们已经在上海呆了一段时间),我们展示了新移民在前三周的整合过程。此外,我们制定分类问题来预测一个人是否是移民。我们的分类器在将定居的移民与本地人区分时能够达到0.82的F1分数,但是由于阶级失衡,识别新移民仍然是一个挑战。这种分类设置有助于确定新的移民将成功融入当地人(新移民误认为当地人)。
通过社会影响控制选举
原文标题: Controlling Elections through Social Influence
地址: http://arxiv.org/abs/1711.08615
作者: Bryan Wilder, Yevgeniy Vorobeychik
摘要: 选举控制考虑了试图篡改投票过程的对手的问题,以确保他们喜欢的候选人获胜(建设性控制)或其他候选人失去(破坏性控制)。由于在线社会网络已经成为潜在选民的重要信息来源,攻击者手中的一个新工具就是通过利用社交影响来实现控制,例如通过在线社交媒体传播假新闻和其他形式的错误信息。我们考虑通过社会影响来控制选举的计算问题,研究在哪些条件下找到好的对抗策略在计算上是可行的。我们在建设性和破坏性的控制环境中考虑对手的两个目标:胜利的概率和边际(分别为POV和MOV)。我们提出了几个强烈的负面结果,例如,显示最大化POV的问题对于任何常数因子是不可接受的。另一方面,我们提出了近似算法,它提供了一些较弱的近似保证,例如POV目标的双标准近似值和MOV的常数因子近似值。最后,我们提出这些问题的混合整数规划公式。实验结果表明,我们的近似算法经常发现接近最优的控制策略,表明通过社会影响力进行选举控制是对选举完整性的突出威胁。
网络嵌入综述
原文标题: A Survey on Network Embedding
地址: http://arxiv.org/abs/1711.08752
作者: Peng Cui, Xiao Wang, Jian Pei, Wenwu Zhu
摘要: 网络嵌入将网络中的节点分配给低维表示并有效地保留网络结构。最近,这个新兴的网络分析范例已经取得了相当大的进展。在这次调查中,我们着重对网络嵌入方法的发展进行了分类和回顾,并指出了未来的研究方向。我们首先总结网络嵌入的动机。我们讨论经典图嵌入算法及其与网络嵌入的关系。其次,主要从系统的角度对大量的网络嵌入方法进行了全面的综述,包括网络嵌入结构和属性保留方法,带有辅助信息的网络嵌入方法和先进的信息保存网络嵌入方法。此外,还介绍了几种网络嵌入评估方法和一些有用的在线资源,包括网络数据集和软件。最后讨论了利用这些网络嵌入方法构建一个有效的系统框架,并指出了一些潜在的未来发展方向。
复杂网络中的拓扑与动力学:边互惠的作用
原文标题: Topology and Dynamics in Complex Networks: The Role of Edge Reciprocity
地址: http://arxiv.org/abs/1711.08838
作者: Paulo J. P. de Souza, Cesar H. Comin, Luciano da F. Costa
摘要: 复杂系统中的一个关键问题是拓扑和动态之间的关系。在这项工作中,我们使用最近引入的被称为转向系数的网络属性作为解决这个问题的方法,针对在不同动态下不同的有向复杂网络系统。考虑理论和现实世界的网络,量化互惠性和平均度对转向系数的影响。报道了许多有趣的结果,可以帮助设计展现拓扑和动态之间更大或更小关系的复杂系统。
自然和有效的模糊头部修复
原文标题: Natural and Effective Obfuscation by Head Inpainting
地址: http://arxiv.org/abs/1711.09001
作者: Qianru Sun, Liqian Ma, Seong Joon Oh, Luc Van Gool, Bernt Schiele, Mario Fritz
摘要: 随着越来越多的个人照片在线共享,能够混淆这些照片中的身份正在成为隐私保护的必要条件。人们基本上已经使得头部区域变黑或变得模糊,但是它们导致了糟糕的用户体验,而对于最先进的人员识别器来说却是令人惊讶的无效的。在这项工作中,我们提出了一种新颖的头部修复混淆技术。在社交媒体照片中生成一个真实的头部修复是具有挑战性的,因为主题出现在不同的活动和头部方向。因此我们把这个任务分成两个子任务:(1)从图像上下文(例如身体姿势)产生用于无形假设合理头部姿势的面部标志,以及(2)面部标志条件头部修复。我们验证了我们的修复方法生成逼真的人物图像,同时实现了对自动人物识别器的超级混淆性能。
在共演化选民模型中链接和节点排序的耦合
原文标题: Coupling of link- and node-ordering in the coevolving voter model
地址: http://arxiv.org/abs/1711.09004
作者: Joanna Toruniewska, Krzysztof Kułakowski, Krzysztof Suchecki, Janusz A. Hołyst
摘要: 我们考虑在协同选举模型中达到最终状态的过程。有一个状态动态协同演化,其中一个节点可以从概率$ 1-p $和链路动态复制一个随机邻居的状态,其中一个节点可以重新连线到同一状态的另一个节点的概率$ p $ 。这表现出在重新接线概率的临界值之上的向冷冻阶段的吸收转变。我们的分析和数值研究表明,在活跃阶段,节点$ n $和链节$ m $的磁化平均值倾向于取决于初始条件的相同值。以类似的方式,平均旋转和旋转的程度是平等的。该系统服从一个特殊的统计守恒定律,因为从相同的初始条件开始,在许多实现上平均的两种类型的磁化的线性组合是运动常数:$ \ Lambda \ equiv(1-p)\ mu m(t)+ pn (t)= const $,其中$ \ mu $是平均节点度数。活动阶段中节点和链接的最终平均磁化强度与$ \ Lambda成正比,而活动链接的最终密度是$ \ Lambda $的平方函数。如果重新接线的概率高于临界值,系统分离成断开的区域,则节点和链路磁化的值不相同,最终的平均旋转和旋转的平均度可能不同。
通过众包来检测社会网络中的假新闻
原文标题: Detecting Fake News in Social Networks via Crowdsourcing
地址: http://arxiv.org/abs/1711.09025
作者: Sebastian Tschiatschek, Adish Singla, Manuel Gomez Rodriguez, Arpit Merchant, Andreas Krause
摘要: 我们的工作考虑利用人群信号来检测假新闻,并受Facebook最近推出的工具的激励,使用户能够标记假新闻。通过汇总用户的标志,我们的目标是每天选择一小部分新闻,将它们发送给专家(例如,通过第三方实情检查机构),并阻止专家认定为伪造的新闻的传播。我们工作的主要目标是通过阻止网络中的假新闻的传播来最小化错误信息的传播。要实现这一目标尤其具有挑战性,因为它需要尽快发现高信度的假新闻。我们表明,为了有效地利用用户的标志,了解用户标志的准确性是至关重要的。我们开发了一种新算法\算法,它执行贝叶斯推断以检测假新闻,并共同学习用户的标记精度随着时间的推移。我们的算法采用后验采样来主动权衡利用(选择直接最大化给定时期的客观价值的新闻)和探索(选择使信息的价值最大化的新闻以学习关于用户的标记精度)。我们通过广泛的实验证明了我们的方法的有效性,并显示了利用社区信号的力量。
性别歧视的语义地图:日常性别项目的主题建模
原文标题: Semantic Map of Sexism: Topic Modelling of Everyday Sexism Project Entries
地址: http://arxiv.org/abs/1711.09074
作者: Sophie Melville, Kathryn Eccles, Taha Yasseri
摘要: 日常性别歧视项目记录了来自世界各地的志愿捐助者所报道的日常性别歧视案例。它在其存在的前三年内以13种语言收集了10万份作品。提交给“日常性别歧视”的各种语言的报告内容是众包的信息的宝贵来源,对女权主义和性别研究具有巨大的潜力。在本文中,我们采用计算方法来分析报告的内容。我们使用主题建模技术从报告中提取出现的主题和概念,并映射这些主题之间的语义关系。由此产生的图像与定性分析非常相似,并且通过定性分析得出,表明这种形式的主题建模可以用于筛选之前没有进行任何分析的数据集。主题之间的关系的力量说明了性别歧视的流动性和无处不在的性质,没有任何单一的经验与另一个无关。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20171127/