首页 期刊 智能计算机与应用 基于平均交互信息量的DNA序列相似性分析 【正文】

基于平均交互信息量的DNA序列相似性分析

作者:詹青; 王亚东 哈尔滨工业大学计算机科学与技术学院; 哈尔滨150001
生物信息学   dna序列相似性   信息熵   平均交互信息量   进化树  

摘要:序列相似性分析是生物信息学中一个重要问题,对于研究物种的进化起源有着重要的意义。序列相似性算法包括基于序列比对的方法及非比对方法两种。基于比对的方法对于序列整体的衡量略有欠缺;非比对算法中有DNA曲线化方法以及比较序列各自整体碱基分布间的信息量差异的方法,只是考虑了序列整体信息间的差异,但未考虑序列各个位点间的差异。因此,提出了一种基于信息熵的相似性度量模型,把序列比对与信息量差异结合起来,将两条比对后的序列间的平均交互信息量与其联合熵之比作为两条序列的相似性度量。使用该度量构建了11个物种的相似性矩阵,对各物种间的相似性进行了分析,结果在一定程度上与生物分类学相契合。通过距离矩阵所构建的进化树,也反映了各物种间的进化关系,表明该模型的设计具有合理性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅