关键词:
药物相互作用预测
药物文本信息
图卷积神经网络
归一化
图自编码器
摘要:
多种药物共同使用时,一种药物对另一种药物的药效等造成影响,就会产生药物相互作用(Drug-Drug Interaction,DDI),例如拮抗、相加、协同等作用。未知DDI潜藏风险,轻则影响治疗效果,重则危害患者身体健康甚至生命安全。因此,精准预测DDI能够辅助临床决策、规避潜在风险,促进药物研发及相关领域的研究。近年来,随着人工智能在DDI预测、药物靶点相互作用预测等方面的广泛应用,涌现出基于文献提取、基于图神经网络等代表性方法。但上述方法大多侧重于利用药物分子结构、酶、靶点等信息进行药物特征表达,对药物文本信息不够重视。这些文本信息通常用来描述药物类别、成分或药效,有利于全面深入理解药物特征。为此,本文引入药物文本信息,并结合归一化图自编码器,提出一种用于药物相互作用预测的归一化图自编码器方法(Drug-Drug Interaction prediction method based on Graph Normalized Auto Encoder,DDI-GNAE),本文的主要贡献如下:
(1)使用药物的生物信息和文本信息共同作为药物的属性。使用自然语言处理方法对药物文本信息进行语义特征提取,与药物生物特征融合,以获得更全面更丰富的药物特征表示。在特征融合过程中,针对西药和中药数据选取不同的代表性特征。西药药物描述融合药物靶点、SMILES、酶特征,中药适应症则融合活性成分。同时,收集西药间相互作用和中药间相互作用数据,分别与西药特征与中药特征进行组合,构建新的西药相互作用数据集和中药相互作用数据集。
(2)引入归一化图自编码器进行药物相互作用预测。本文将药物相互作用网络构建为以药物为节点,相互作用为边,药物属性为节点属性的属性同构图。为更好地学习该图的节点特征与图形拓扑关系,本文增加编码器模块图卷积神经网络层数,使用两层GCN结构进行编码。同时,考虑到本文的任务为二分类任务,增加更契合二分类任务的tanh激活函数,提升方法为复杂药物相互作用网络生成节点嵌入的能力。
(3)在西药和中药的真实数据集上,与其他的基准方法进行对比。对比实验结果表明,DDI-GNAE方法取得更高AUC与AP值。消融实验结果表明,药物文本信息、图卷积神经网络和激活函数对于提高药物相互作用预测方法的性能具有积极影响。
本文提出的DDI-GNAE方法能够同时考虑药物生物特征和药物语义特征,并且能够生成高质量节点嵌入,实现DDI预测任务,有助于避免不合理用药、提升用药安全,对于加速新药研发等具有重大意义。