关键词:
复杂网络
链路预测
特征向量中心性
聚类系数
信息熵
摘要:
链路预测是将复杂网络和计算机科学真正连接的重要应用之一,它处理的是信息科学中最基本的问题,因此研究链路预测是非常重要的。如何提高预测精确程度是研究链路预测的基本问题之一,目前的链路预测方法大部分与基于节点相似性的局部节点指标相关,而节点之间的邻居节点在网络中的性质常常被节点的相似性的指标所忽视。针对以上问题,本文在节点重要性的基础上提出了基于传统链路预测的改进算法,主要研究内容有以下三点:1.基于特征向量中心性的链路预测算法,该算法的创新点主要是将复杂网络节点重要性中的特征向量中心性考虑到共同邻居指标、AA指标、RA指标和其他节点相似性指标中,并且以链路预测中经典的算法有效性评价方法——AUC作为改进算法优劣的参考。最后在真实数据集上进行仿真实验,最终的实验结果表明,通过基于节点中心性的链路预测算法。在复杂网络的链路预测上,相比于AA、RA、CN等节点相似性指标算法,基于节点中心性的链路预测算法更准确,改进的算法提高了算法的预测效果,在没有增加算法时间复杂度的基础上,使得链路预测的效率得到了提升。2.在以往的链路预测算法中,网络稠密程度对链路预测的影响鲜有考虑,而网络的稠密程度对于节点之间产生连接的影响却是显而易见的,因为越密集的网络中一个节点的度往往就会越大,而聚类系数的高低则是网络稠密程度的表现,因此本文在此处的创新点是基于特征向量中心性的链路预测算法的基础上加以结合了局部聚类系数公式,使得算法的效率和准确度获得了提升,最后通过一系列的实验验证其结果比原始算法更优秀。这里的研究主要分为两个部分,第一部分是对复杂网络节点相似性指标与局部聚类系数公式相结合的链路预测算法研究,通过将网络稠密程度的概念引入复杂网络节点相似性指标中,并通过仿真数据集对该算法与原始算法相比较,实验结果证明新的算法相比较于只基于节点相似性的算法更加有效,AUC值普遍得到了提升;第二部分是在上述通过局部聚类系数改进的链路预测公式之上,再与基于特征向量中心性的链路预测算法融合,将节点中心性和局部聚类系数一同考虑到算法中,通过新的实验验证了结合局部聚类系数和特征向量中心性的链路预测算法在没有增加时间复杂度的情况下对节点的预测仍然具有较好的表现,进一步提高了链路预测的精度。3.混合信息熵与节点重要性指标的研究,对考虑特征向量中心性的复杂网络链路预测算法的进行研究,把信息熵与复杂网络局部信息指标相结合,并作用在共同邻居指标基础上和资源分配指标的链路预测算法。信息熵作为网络局部信息重要性的一种评价方法,能够衡量一个节点的重要性,从而能够更好的提高链路预测效率。通过仿真实验证明了混合信息熵与节点重要性指标的算法在对节点之间产生连边预测的准确性。