- 回复与供给:当工作人员不仅仅是回答问题时,众包是高效的;
- 1990年至2012年拉丁美洲理论高能物理学:统计研究;
- 社会网络中的约束社区检测;
- 使用混合密度网络连续表示地理位置和词汇方言;
- 1919~1913年爱尔兰议会发言数据库;
- 信息流显示在线社交活动的预测限制;
- 变化中的世界极端温度统计;
回复与供给:当工作人员不仅仅是回答问题时,众包是高效的
地址: http://arxiv.org/abs/1611.00954
作者: Thomas C. McAndrew, Elizaveta A. Guseva, James P. Bagrow
摘要: 众包工作通过向大量工人分配许多小任务,但众包的真正潜力在于工作人员不仅仅是执行简单的任务 - 他们可以运用自己的经验和创造力向众包提供新的和意想不到的信息。一个这样的情况是工人不仅回答众人的问题,而且为随后的人群分析提出了新的问题,导致越来越多的问题。这种增长为早期问题创造了固有的偏见,因为早些时候提出的问题可以由更多的后续工作人员回答,而不是稍后提出的问题。在这里,我们研究如何用这样不断增长的问题集进行有效的众包。通过将问题集合建模成为相互关联的问题网络,我们引入算法来帮助减少增长偏倚,通过有效地分配工作人员探索新问题和解决当前问题。实验和模拟表明,这些算法可以有效地探索无限的问题集,而不会失去对人群答案的信心。
1990年至2012年拉丁美洲理论高能物理学:统计研究
地址: http://arxiv.org/abs/1708.04342
作者: Gerardo Urrutia Sánchez, Lilian Prado, Wolfgang Bietenholz
摘要: 我们提供了在1990年至2012年期间拉丁美洲(LA)出现的理论高能物理学(HEP)出版物的统计概况。我们的研究记录了在研究领域占主导地位的八个拉丁美洲国家:巴西,墨西哥,阿根廷,智利,哥伦比亚,委内瑞拉,乌拉圭和古巴。作为洲际基准,我们将其与印度,加拿大,韩国,比利时和南非进行比较。我们考虑研究论文在专业高影响力期刊中的生产力,以及相应的引文数量。此外,我们调查这些记录与三个社会经济指标如何相关:国内生产总值(GDP),人类发展指数(HDI)和教育指数(EI)。
社会网络中的约束社区检测
地址: http://arxiv.org/abs/1708.04354
作者: Weston D. Viles, A. James O’Malley
摘要: 网络中的社区检测是识别异常连接良好的子网络的过程,是许多应用网络分析的核心组成部分。模块化优化的范例规定了网络顶点的分割,其最大化组(社区)中边的分数与边随机分布的预期分数之间的差异。模块化目标函数独特地融合了网络拓扑结构,并得到了广泛的研究,而社会组成的约束或外部信息的整合在很大程度上仍未被探索。我们对模块化目标函数施加惩罚功能,以规范社区的构成,并将我们的方法应用于确定医院网络中的医疗保健社区(HCC),使得每个HCC内进行的心脏除颤器手术的数量超过最小阈值。这种限制允许通过标准化整个医院网络中的心脏护理的分布,在所得到的医疗保健社区之间进行心脏保健的有意义的比较。
使用混合密度网络连续表示地理位置和词汇方言
地址: http://arxiv.org/abs/1708.04358
作者: Afshin Rahimi, Timothy Baldwin, Trevor Cohn
摘要: 我们提出了一种使用包含高斯分布混合的基于神经网络的模型在连续向量空间中嵌入二维位置的方法,呈现了用于基于文本的地理位置和词汇方言的两种模型变体。对Twitter数据进行评估,所提出的模型优于常规基于回归的地理定位,并提供了对不确定性的更好估计。我们还展示了表征的有效性,用于预测词汇方言中的单词,并使用DARE数据集进行评估。
1919~1913年爱尔兰议会发言数据库
地址: http://arxiv.org/abs/1708.04557
作者: Alexander Herzog, Slava J. Mikhaylov
摘要: 我们提出了一个议会辩论数据库,其中包含了从1919年到2013年,爱尔兰议会下院和爱尔兰的艾伦(Eireann)议会发言的完整记录。另外,该数据库还包含所有的背景信息运输署(Teachta D’ala,议会议员),如党派,选区和办公室职位。当前版本的数据库包括来自1,178个TD的近450万次演讲。演讲稿从官方议会网站下载,并进一步处理并解析为Python脚本。关于运输署的背景资料是从议会网站的会员资料库收集的。内阁职务数据(部长和初级部长)是从政府官方网站收集的。使用记录连锁算法和人类编码器来匹配TD和部长。
信息流显示在线社交活动的预测限制
地址: http://arxiv.org/abs/1708.04575
作者: James P. Bagrow, Xipei Liu, Lewis Mitchell
摘要: 现代社会取决于在线社交网络上的信息流动,而流行的社会平台现在也产生了重要的行为数据。然而,使用这些数据来预测个人的活动和兴趣仍然存在什么基本限制尚不清楚。在这里,我们应用信息论的工具来估计Twitter用户的作品的预测信息内容以及用户之间的信息流动程度。在信息流中可以看到不同的时间和社会影响,这些估计提供了对这些数据可实现的预测精度的基本约束。由于信息的社会流动,我们估计,只有个人的社会关系才可以获得大约95%的潜在预测精度,而不需要个人的数据。
变化中的世界极端温度统计
地址: http://arxiv.org/abs/1708.04581
作者: J. M. Finkel, J. I. Katz
摘要: 我们使用全球历史气候网络 - 每日数据库来计算一个非参数统计量,描述在大部分时间段内在九个地理区域(大陆或大部分地区)设置了全日制高温和低温记录的速率20世纪中叶到现在。这个统计数字是在我们早先在美国48个连续的温度记录工作中定义的。与之前的工作相比,我们发现,除了北美以外的每一个地区,历史悠久的历史记录都明显高于稳定气候的零假设(至少$ 3 \西格玛)。除南极洲外,历史最低记录的设定幅度明显低于零假设。在欧洲,北非和北亚,建立新的历史最高点的速度在1990年代突然增加,表明区域气候制度发生了变化;在其他大多数地区,增幅更加明显。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客 https://netsci.complexly.cn 进行更新,并提供RSS订阅。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20170816/