- 用于疾病关系提取的图的多模态学习;
- 比特币交易网络的复杂网络分析;
- 多层知识图中的中心性度量;
- 脑动力学多元时空模型中的社区排名;
- 以太坊交互图上的行为感知账户去匿名化;
- 网络上两种物种共生过程的异质平均场理论;
- 价格追踪:链接优化电力系统中的节点价格;
- 模体挖掘:发现和总结混合图像内容;
- 粒子物理学研究活动中的生活方式和个人健康;
- FairFoody:食品配送考虑公平性;
- 需要进行结构变革以在美国粒子物理学中创造有影响力的公众参与;
- 理解 Twitter 上的隐私切换行为;
- 大型行业参与使 HEP 受益:大型 CAD 公司的微电子支持;
- DISMISS:推特上的印度社交媒体影响者数据库(按顺序滚雪球);
用于疾病关系提取的图的多模态学习
原文标题: Multimodal Learning on Graphs for Disease Relation Extraction
地址: http://arxiv.org/abs/2203.08893
作者: Yucong Lin, Keming Lu, Sheng Yu, Tianxi Cai, Marinka Zitnik
摘要: 目标:疾病知识图是一种连接、组织和访问有关疾病的不同信息的方法,对人工智能 (AI) 有很多好处。为了创建知识图谱,有必要以疾病概念之间的关系形式从多模态数据集中提取知识,并对概念和关系类型进行规范化。方法:我们介绍 REMAP,一种用于疾病关系提取和分类的多模式方法。 REMAP 机器学习方法将部分、不完整的知识图和医学语言数据集共同嵌入到紧凑的潜在向量空间中,然后对齐多模态嵌入以实现最佳疾病关系提取。结果:我们将 REMAP 方法应用于具有 96,913 个关系和 124 万个句子的文本数据集的疾病知识图谱。在人类专家注释的数据集上,REMAP 通过将疾病知识图与文本信息融合,将基于文本的疾病关系提取提高了 10.0%(准确度)和 17.2%(F1 分数)。此外,REMAP 利用文本信息推荐知识图中的新关系,比基于图的方法高出 8.4%(准确度)和 10.4%(F1 分数)。讨论:系统化的知识正在成为人工智能的支柱,为将语义注入人工智能并将其完全集成到机器学习算法中创造了机会。虽然先验语义知识可以帮助从文本中提取疾病关系,但现有方法不能充分利用多模态数据集。结论:REMAP 是一种通过融合结构化知识和文本信息来提取和分类疾病关系的多模式方法。 REMAP 提供了一个灵活的神经架构,可以轻松查找、访问和验证 AI 驱动的疾病概念之间的关系。
比特币交易网络的复杂网络分析
原文标题: Complex Network Analysis of the Bitcoin Transaction Network
地址: http://arxiv.org/abs/2203.09026
作者: Bishenghui Tao, Hong-Ning Dai, Jiajing Wu, Ivan Wang-Hei Ho, Zibin Zheng, Chak Fong Cheang
摘要: 在这篇简报中,我们对比特币交易网络进行了复杂的网络分析。特别是,我们设计了一种新的采样方法,即带回扫的随机游走(RWFB),以进行有效的数据采样。然后,我们从度分布、聚类系数、最短路径长度、连通分量、中心性、分类性和富俱乐部系数等方面对比特币网络进行了综合分析。我们获得了几个重要的观察结果,包括当前网络的小世界现象、多中心状态、优先依恋和非富人俱乐部效应。这项工作加深了对当前比特币区块链网络的理解,并为加密货币区块链网络中恶意活动和欺诈检测的未来方向提供了启示。
多层知识图中的中心性度量
原文标题: Centrality Measures in multi-layer Knowledge Graphs
地址: http://arxiv.org/abs/2203.09219
作者: Jens Dörpinghaus, Vera Weil, Carsten Düing, Martin W. Sommer
摘要: 知识图在链接不同数据方面发挥着核心作用,从而导致多层。因此,它们被广泛用于大数据集成,特别是用于连接来自不同领域的数据。很少有研究调查图中的多个层如何影响为单一用途网络(例如社会网络)开发的方法和算法的问题。与单一用途图相比,本手稿研究了多层对中心性度量的影响。特别是,(a)我们开发了一个实验环境,以(b)在受社会网络分析启发的随机图上评估两种不同的中心性度量 - 度和中介中心性:小世界和无标度网络。所提出的方法(c)表明,图结构和拓扑对其存储的附加数据的鲁棒性有很大影响。尽管随机图的实验分析使我们能够做出一些基本的观察,但我们将 (d) 对对网络稳定性有很大影响的特定图结构的进一步研究提出建议。
脑动力学多元时空模型中的社区排名
原文标题: Ranking of Communities in Multiplex Spatiotemporal Models of Brain Dynamics
地址: http://arxiv.org/abs/2203.09281
作者: James B. Wilsenach, Catherine E. Warnaby, Charlotte M. Deane, Gesine D. Reinert
摘要: 作为一个相对较新的领域,网络神经科学倾向于关注大脑在许多连续实验或长时间记录中的平均聚合行为,以构建强大的大脑模型。这些模型在解释由于正常脑功能而自发发生的大脑动态变化的能力方面受到限制。此后,在神经影像时间序列数据上训练的隐马尔可夫模型 (HMM) 已作为一种生成动态模型的方法出现,这些模型易于训练但难以完全参数化或分析。我们提出将这些神经 HMM 解释为多重大脑状态图模型,我们称之为隐马尔可夫图模型 (HMGM)。这种解释允许使用完整的网络分析技术来分析动态大脑活动。此外,我们基于最大熵原理,提出了一种在没有外部数据的情况下选择 HMM 超参数的通用方法,并以此来选择多路模型中的层数。我们使用基于时空随机游走的过程来确定大脑区域的重要社区,该过程利用了模型的基本马尔可夫结构。我们对真实多主体 fMRI 数据的分析提供了新的结果,证实了静止大脑的模块化处理假设,并提供了动态大脑状态社区之间和内部功能重叠的新证据。我们的分析管道提供了一种在新行为或条件下表征大脑动态网络活动的方法。
以太坊交互图上的行为感知账户去匿名化
原文标题: Behavior-aware Account De-anonymization on Ethereum Interaction Graph
地址: http://arxiv.org/abs/2203.09360
作者: Jiajun Zhou, Chenkai Hu, Jianlei Chi, Jiajing Wu, Meng Shen, Qi Xuan
摘要: 区块链技术具有去中心化、可追溯、不可篡改的特点,创造了可靠的去中心化信任机制,进一步加速了区块链金融的发展。然而,区块链的匿名化阻碍了市场监管,导致区块链金融平台上的洗钱、赌博和网络钓鱼欺诈等非法活动增加。因此,金融安全已成为区块链生态系统的重中之重,需要有效的市场监管。在本文中,我们考虑从图分类的角度来识别以太坊账户,并提出了一个名为 Ethident 的端到端图神经网络框架,以表征账户的行为模式并进一步实现账户去匿名化。具体来说,我们首先使用原始以太坊数据构建账户交互图(AIG)。然后我们设计了一个名为 HGATE 的分层图注意力编码器作为我们框架的主干,它可以有效地表征节点级帐户特征和子图级行为模式。为了缓解帐户标签稀疏性,我们进一步引入对比自我监督机制作为正则化来共同训练我们的框架。对以太坊数据集的综合实验表明,我们的框架在账户识别方面取得了卓越的性能,与之前的最新技术相比,产生了 1.13% - 4.93% 的相对改进。此外,详细的分析说明了 Ethident 在识别和理解以太坊已知参与者(例如交易所、矿工等)以及违法者(例如网络钓鱼诈骗者、黑客等)的行为方面的有效性,这可能协助风险评估和市场监管。
网络上两种物种共生过程的异质平均场理论
原文标题: Heterogeneous mean-field theory for two-species symbiotic processes on networks
地址: http://arxiv.org/abs/2203.09500
作者: Guilherme S. Costa, Marcelo M. de Oliveira, Silvio C. Ferreira
摘要: 研究合作的一个简单模型是双物种共生接触过程(2SCP),其中两个不同的物种在图上传播,如果两者占据相同的顶点,则以降低的死亡率进行相互作用,代表共生相互作用。众所周知,2SCP 表现出具有丰富相图的复杂行为,包括活跃相和消光之间的连续和不连续过渡。在这项工作中,我们通过发展异质平均场 (HMF) 理论来推进对不相关网络上 2SCP 相变的理解,其中明确地考虑了接触的异质性。具有幂律度分布的网络的 HMF 理论表明,随着通过降低度指数而增加异质性水平,相图中的双稳态区域(活跃和非活跃相)会缩小。有限尺寸分析揭示了一种复杂的行为,其中有限尺寸的伪不连续过渡可以转换为热力学极限内的连续过渡,具体取决于度数指数和共生耦合。理论结果得到了广泛的数值模拟的支持。
价格追踪:链接优化电力系统中的节点价格
原文标题: Price Tracing: Linking Nodal Prices in Optimized Power Systems
地址: http://arxiv.org/abs/2203.08902
作者: Fabian Hofmann, Markus Schlott
摘要: 优化电力系统的总成本是网络运营和规划的常用工具。除了有关如何运行和可能扩展电力系统的宝贵信息外,优化还提供了每个节点和时间步长的最佳位置边际价格。这个价格可以看作是消费者支付的电价,供应商购买的电价,同时最大限度地提高了社会福利。自然,它是优化问题的直接结果,因此不提供有关其内部组成的任何信息。本文表明,通过应用流量跟踪(一种用于跟踪复杂网络中的流量的算法),可以以连贯的数学方式将位置边际价格相互关联。这不仅导致对价格结构的重要洞察,而且还提供了对所有系统成本的直观分解和分配。然后,个人消费者会看到他们必须为电力系统中的单个发电机和输电线路支付多少费用。这种作为价格跟踪引入的方法优于文献提供的类似方法,因为由此产生的成本分配是透明的、合理的,并且与优化的位置边际价格一致。价格追踪方法代表德国具有高比例可再生能源的电力系统模型应用和讨论。所提出的分析及其影响有助于寻找更有效的市场设计来促进可再生能源供应。
模体挖掘:发现和总结混合图像内容
原文标题: Motif Mining: Finding and Summarizing Remixed Image Content
地址: http://arxiv.org/abs/2203.08327
作者: William Theisen, Daniel Gonzalez Cedre, Zachariah Carmichael, Daniel Moreira, Tim Weninger, Walter Scheirer
摘要: 在互联网上,图像不再是静态的;它们已成为动态内容。由于配备了摄像头和易于使用的编辑软件的智能手机的出现,图像可以即时重新混合(即编辑、编辑和与其他内容重新组合),并且全球观众可以重复过程。从数字艺术到模因,图像随时间的演变现在是数字人文主义者、社会科学家和媒体取证专家的重要研究课题。然而,由于计算机视觉中的典型数据集由静态内容组成,因此分析混合内容的自动化算法的发展受到了限制。在本文中,我们介绍了 Motif Mining 的概念——在大量未标记和未分类的数据中查找和汇总重新混合的图像内容的过程。在本文中,这个想法被形式化并介绍了一个参考实现。实验在三个模因式数据集上进行,包括一个新收集的与俄罗斯-乌克兰冲突中的信息战相关的数据集。所提出的主题挖掘方法能够识别相关的混合内容,与类似的方法相比,这些内容更符合人类观察者的偏好和期望。
粒子物理学研究活动中的生活方式和个人健康
原文标题: Lifestyle and personal wellness in particle physics research activities
地址: http://arxiv.org/abs/2203.08631
作者: Tiffany R. Lewis, Sara M. Simon, Carla Bonifazi, Savannah Thais, Johan Sebastian Bonilla Castro, Kétévi A. Assamagan
摘要: 在职业责任和个人优先事项之间找到平衡是当代生活的一大挑战,尤其是在 HEPAC 社区内。未能达到适当的平衡往往会导致不同程度的精神和身体问题,并影响工作绩效。在本文中,我们讨论了导致我们学术领域工作和个人生活不平衡的一些主要原因。我们提出了一些建议,以建立机制,为我们社区中处于不同职业水平的不同成员创造一个更健康、更公平的工作环境。
FairFoody:食品配送考虑公平性
原文标题: FairFoody: Bringing in Fairness in Food Delivery
地址: http://arxiv.org/abs/2203.08849
作者: Anjali, Rahul Yadav, Ashish Nair, Abhijnan Chakraborty, Sayan Ranu, Amitabha Bagchi
摘要: 随着食品配送平台的快速增长和崛起,人们对支撑这种增长的“零工”的雇佣条件也产生了担忧。我们对来自印度三个大城市的真实食品配送平台数据的分析表明,配送主体商的收入存在显著不平等。在本文中,我们制定了主体人之间公平收入分配的多目标问题,同时确保及时送餐。我们确定该问题不仅是 NP 难的,而且在多项式时间内也是不可近似的。我们通过一种称为 FairFoody 的新型匹配算法克服了这一计算瓶颈。对现实世界食品配送数据集的广泛实验表明,与基准策略相比,FairFoody 在公平收入分配方面的改进高达 10 美元,同时还确保对客户体验的影响最小。
需要进行结构变革以在美国粒子物理学中创造有影响力的公众参与
原文标题: The need for structural changes to create impactful public engagement in US particle physics
地址: http://arxiv.org/abs/2203.08916
作者: Kétévi Adiklè Assamagan, Mateus Carneiro, Sarah Demers, Kathryn Jepsen, Don Lincoln, Azwinndini Muronga
摘要: 这篇 Snowmass21 投稿论文解决了与美国粒子物理学界有交叉的许多团体和组织需要发生的结构变化,以使有影响力的公众参与蓬勃发展。这些变化的推动力应该来自粒子物理学界,他们应该承认公众参与的重要性,并根据 Snowmass 贡献的这篇论文中的建议采取行动。科学家们对阻碍他们参与公众参与的障碍、惩罚和缺乏支持表示失望。在本文中,我们提供了许多方法来为物理学家的公众参与创造一种支持性的、有利的氛围。
理解 Twitter 上的隐私切换行为
原文标题: Understanding Privacy Switching Behaviour on Twitter
地址: http://arxiv.org/abs/2203.08935
作者: Dilara Keküllüoğlu, Kami Vaniea, Walid Magdy
摘要: 在公共和受保护之间更改 Twitter 帐户的隐私设置会更改过去推文的可见性。通过在 3 个月内检查超过 10 万 Twitter 用户的隐私设置,我们注意到超过 40% 的用户至少更改了一次隐私设置,大约 16% 的用户更改了 5 次以上。这促使我们探索人们切换隐私设置的原因。我们通过比较用户在公开和受保护时的推文行为来定量研究这些切换现象,并定性地使用两个后续调查(n=100,n=324)来理解观察到的行为背后的潜在推理。我们的定量分析表明,切换隐私设置的用户在其设置公开时会更多地提及他人并分享主题标签。我们的调查强调,用户转为受保护以共享个人内容并规范界限,同时他们转为公开以通过受保护而被阻止的方式与他人互动。
大型行业参与使 HEP 受益:大型 CAD 公司的微电子支持
原文标题: Big Industry Engagement to Benefit HEP: Microelectronics Support from Large CAD Companies
地址: http://arxiv.org/abs/2203.08973
作者: Gabriella Carini, Marcel Demarteau, Peter Denes, Angelo Dragone, Farah Fahim, Carl Grace, Shaorui Li, F Mitch Newcomer, Brianna Yi
摘要: 微电子开发对于大量 DOE 项目和任务空间至关重要。为生产半导体 (CHIPS) 和制造专用集成电路 (ASIC) 创造有益的激励措施对 DOE 来说很重要,因此需要存在允许 DOE 执行其任务的基础设施。本文讨论了当前的举措并推荐了一种商业模式,为 DOE 构建微电子设计生态系统,其中包括三个主要构建块:计算机辅助设计 (CAD) - 电子设计自动化 (EDA) 设计工具、基本设计 IP 和访问到半导体制造设施。
DISMISS:推特上的印度社交媒体影响者数据库(按顺序滚雪球)
原文标题: DISMISS: Database of Indian Social Media Influencers (Snowballed Sequentially) on Twitter
地址: http://arxiv.org/abs/2203.09193
作者: Arshia Arya, Soham De, Dibyendu Mishra, Gazal Shekhawat, Ankur Sharma, Anmol Panda, Faisal Lalani, Parantak Singh, Ramaravind Kommiya Mothilal, Rynaa Grover, Sachita Nishal, Saloni Dash, Shehla Shora, Syeda Zainab Akbar, Joyojeet Pal
摘要: 高度网络化的个人数据库对于研究叙事和对社交媒体的影响是必不可少的。为了支持对印度 Twitter 的研究,我们提供了一个系统分类的印度 Twitter 影响账户数据库,通过朋友、网络和自我描述的个人资料信息的迭代过程进行识别和注释,并手动验证。我们建立了一个基于朋友网络的初始账户集,种子账户集基于各个领域的真实世界知名度,然后多次滚雪球“朋友的朋友”,并根据in-的数量对个人进行排名。团体联系和整体追随者。然后,我们将已识别的帐户手动分类为在社交媒体之外具有独立地位的娱乐、体育、商业、政府、机构、新闻、民间社会帐户类别,以及“数字优先”类别,指派生其帐户的帐户。在线活动的主要影响。总体而言,我们注释了所有类别的 11580 个唯一帐户。该数据库有助于研究与影响者在两极分化、错误信息、极端言论、政治话语等方面的作用相关的各种问题。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

作者:ComplexLY
微信公众号:netsci
欢迎扫描左侧微信公众号二维码进行交流!
本文地址:https://netsci.complexly.cn/post/20220318/