网站建设的论文(Arxiv网络科学论文摘要8篇)

网络中的异常检测和社区检测;在线社会网络抽样:Metropolis Hastings随机游走和随机游走;链路推荐:它们对网络结构和少数群体的影响;跨界意识形态竞争动态建模;信息流估计:推特新闻研究;从二值数据中推断经验因果图以支持多维贫困分析的框架;通过(超)图分区的局部模体聚类;FACTOID:用于识别错误信息传播者和政治偏见的新数据集;网络中的异常检测和社区检测原文标题: Anomaly detection and community detection in networks地址: http://arxiv.org/abs/2205.06012作者: Hadiseh Safdari, Caterina De Bacco摘要: 异常检测是数据分析领域的一个相关问题。在网络系统中,个体实体成对交互,当交互模式偏离被认为是规则的模式时,就会观察到异常。正确定义规则模式所需要的依赖于开发用于描述观察到的交互的表达模型。解决网络中的异常检测至关重要。在许多著名的网络模型中,潜在变量模型(一类概率模型)提供了有前途的工具来刻画数据的内在特征。在这项工作中,我们提出了一种概率生成方法,该方法将领域知识(即社区成员)作为常规行为的基本模型,从而标记出偏离该模式的潜在异常。事实上,社区成员身份充当空模型的构建块,以识别常规交互模式。结构信息通过社区成员和异常参数的潜在变量包含在模型中。该算法旨在推断这些潜在参数,然后输出识别网络边异常的标签。在线社会网络抽样:Metropolis Hastings随机游走和随机游走原文标题: Sampling Online Social Networks: Metropolis Hastings Random Walk and Random Walk地址: http://arxiv.org/abs/2205.05885作者: Xiao Qi摘要: 近年来,随着社会网络分析(SNA)备受关注,SNA的瓶颈之一是这些网络数据太大而无法处理。此外,由于隐私问题,一些网络数据无法访问。因此,我们必须开发抽样方法来从总体图中绘制具有代表性的样本图。本文介绍了 Metropolis-Hastings Random Walk (MHRW) 和 Random Walk with Jumps (RWwJ) 采样策略,包括收集节点的过程、基础数学理论和相应的估计量。我们比较了我们的方法和现有的研究成果,发现 MHRW 在估计度分布(比 RWwJ 少 61% 的误差)和图顺序(比 RWwJ 少 0.69% 的误差)时表现更好,而 RWwJ 估计追随者和追随率平均值和相互关系比例在相邻关系中具有更好的结果,与 MHRW 相比,错误少 13%,错误少 6%。我们分析结果的原因并给出未来可能的工作方向。链路推荐:它们对网络结构和少数群体的影响原文标题: Link recommendations: Their impact on network structure and minorities地址: http://arxiv.org/abs/2205.06048作者: Antonio Ferrara, Lisette Espín-Noboa, Fariba Karimi, Claudia Wagner摘要: 基于网络的人物推荐算法在网络上被广泛使用,以建议社交媒体或专业平台中的新联系。虽然这些建议将人们聚集在一起,但算法之间的反馈循环和网络结构的变化可能会加剧社会偏见。这些偏见包括富人越富效应、过滤气泡和极化。然而,社会网络是多种多样的复杂系统,推荐可能会对它们产生不同的影响,具体取决于它们的结构特性。在这项工作中,我们通过随着时间的推移系统地将它们应用于不同的合成网络来探索五种人推荐算法。特别是,我们衡量了这些建议在多大程度上改变了双人口网络的结构,并展示了这些变化如何影响少数群体。我们的系统实验有助于更好地理解链接推荐算法何时对社会网络中的少数群体有利或有害。特别是,我们的研究结果表明,虽然所有算法都倾向于闭合三角形并增加内聚性,但除 Node2Vec 之外的所有算法都倾向于偏爱并建议具有高度数的节点。此外,我们发现,特别是当这两个类别都是异性恋时,推荐算法会降低少数群体的可见性。跨界意识形态竞争动态建模原文标题: Modelling the dynamics of cross-border ideological competition地址: http://arxiv.org/abs/2205.06010作者: Jose Segovia-Martin摘要: 在一个日益全球化的世界中,个人越来越多地接触到来自国界以外的新闻和观点。这些新闻和观点通常集中在意识形态同质化的集群中,例如政党、派别或利益集团。但是,接触跨境信息如何影响思想跨越国界和意识形态边界的传播?在这里,我们使用流行病学方法为两种意识形态的跨境传播开发了一个非线性数学模型。假设每个国家的人口是恒定的且均匀混合的。我们以数值方式求解微分方程系统,并展示少数意识形态影响的微小变化如何引发全球政治均衡的变化。信息流估计:推特新闻研究原文标题: Information flow estimation: a study of news on Twitter地址: http://arxiv.org/abs/2205.06029作者: Tobin South, Bridget Smart, Matthew Roughan, Lewis Mitchell摘要: 长期以来,新闻媒体一直是一个创造、复制和批评的生态系统,新闻媒体在其中报道时事并为正在进行的故事添加评论。理解新闻信息创建和传播的动态对于准确地将功劳归于有影响力的工作并理解社会叙事如何发展非常重要。这些动态可以通过信息论自然语言处理和网络的组合来建模;并且可以使用大量文本数据进行参数化。然而,很难看到“树木的木材”,即在嘈杂的海洋中检测小而重要的信息流。在这里,我们开发了新的比较技术来估计文本生产者对之间的时间信息流。使用模拟和真实文本数据,我们比较了估计文本信息流的方法的可靠性和敏感性,表明通过局部邻域结构标准化的度量提供了对大型网络中信息流的稳健估计。我们将此指标应用于 Twitter 上的大型新闻机构语料库,并展示其在识别信息生态系统中的影响力方面的有用性,发现对网络的平均信息贡献与关注者数量或推文数量无关。这表明,平均追随者人数较低的小型地方组织和右翼组织仍然为生态系统贡献了大量信息。此外,这些方法适用于跨新闻网站和 Twitter 上的俄罗斯巨魔机器人的特定新闻事件的较小全文数据集。信息流估计揭示并量化了这些事件如何发展的特征以及机器人组在设置虚假信息叙述中的作用。从二值数据中推断经验因果图以支持多维贫困分析的框架原文标题: Framework for inferring empirical causal graphs from binary data to support multidimensional poverty analysis地址: http://arxiv.org/abs/2205.06131作者: Chainarong Amornbunchornvej, Navaporn Surasvadi, Anon Plangprasopchok, Suttipong Thajchayapong摘要: 贫困是人类面临的根本问题之一。多维贫困指数 (MPI) 用于衡量人口中超出货币的贫困问题。然而,MPI 无法提供有关贫困因素之间关联和因果关系的信息。教育是否会导致特定地区的收入不平等?缺乏教育是健康问题的原因吗?由于不理解因果关系,决策者无法确定特定人群贫困问题的根本原因,而不同人群的贫困问题可能并不相同。此外,MPI 需要二进制数据,大多数因果推理框架都无法对其进行分析。在这项工作中,我们提出了一个探索性数据分析框架,用于发现二进制数据之间的置信区间可能存在的因果关系。所提出的框架不仅提供了贫困问题的严重程度,而且还提供了贫困因素之间的因果关系。此外,知道因果方向程度的置信区间可以让我们知道因果关系有多强。我们使用模拟数据集中的几种基线方法以及使用两个真实世界的数据集作为案例研究来评估提议的框架 1)美国的双胞胎出生:出生体重与双胞胎死亡率之间的关系,以及 2)泰国人口调查清迈 37.8 万户家庭和孔敬府 35.3 万户家庭。在大多数情况下,我们的框架比基线表现更好。第一个案例研究显示,几乎所有双胞胎死亡病例都有低出生体重问题,但并非所有低出生体重双胞胎都死亡。第二个案例研究表明,两个省的吸烟与饮酒有关,并且仅在清迈省吸烟与饮酒有因果关系。该框架可以在贫困范围之外应用。通过(超)图分区的局部模体聚类原文标题: Local Motif Clustering via (Hyper)Graph Partitioning地址: http://arxiv.org/abs/2205.06176作者: Adil Chhabra, Marcelo Fonseca Faraj, Christian Schulz摘要: 图上广泛使用的操作是局部聚类,即在种子节点周围提取特征良好的社区,而无需处理整个图。最近提出了局部模体聚类:它根据模体的分布寻找局部簇。由于这种局部聚类观点相对较新,因此提出的大多数方法都是以前用于基于边的局部聚类的统计和数值方法的扩展,而可用的组合方法仍然很少且相对简单。在这项工作中,我们构建了一个超图和一个图模型,它们都表示种子节点周围的主题分布。我们使用为(超)图分区设计的复杂组合算法来解决这些模型。在对三角形基序的广泛实验中,我们观察到,与最先进的工具 MAPPR 计算的社区相比,我们的算法计算的社区平均电导值为三分之一,而平均速度快了 6.3 倍。FACTOID:用于识别错误信息传播者和政治偏见的新数据集原文标题: FACTOID: A New Dataset for Identifying Misinformation Spreaders and Political Bias地址: http://arxiv.org/abs/2205.06181作者: Flora Sakketou, Joan Plepi, Riccardo Cervero, Henri-Jacques Geiss, Paolo Rosso, Lucie Flek摘要: 主动识别错误信息传播者是减轻假新闻对我们社会影响的重要一步。在本文中,我们介绍了一个新的当代 Reddit 数据集,用于假新闻传播者分析,称为 FACTOID,自 2020 年初以来监测 Reddit 上的政治讨论。该数据集包含超过 4K 用户和 340 万条 Reddit 帖子,并且包括用户之外的二元标签,还有它们的细粒度可信度(从非常低到非常高)和它们的政治偏见强度(从极右到极左)。据我们所知,这是第一个同时刻画用户历史帖子的长期上下文以及它们之间的交互的假新闻传播者数据集。为了在我们的数据上创建第一个基准,我们提供了通过利用用户之间的社会联系以及他们的心理语言特征来识别错误信息传播者的方法。我们表明,用户的社交互动本身可以表明错误信息的传播,而心理语言学特征在非神经分类设置中大多提供信息。在定性分析中,我们观察到检测情感心理过程与右倾用户呈负相关,并且传播假新闻的人对体验因素的开放性较低。声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在公众号“网络科学研究速递”(netsci)和个人博客进行同步更新。


本文出自快速备案,转载时请注明出处及相应链接。

本文永久链接: https://www.xiaosb.com/beian/43568/