首页 期刊 计算机工程与应用 DBN在蛋白质编码区识别问题中的应用研究 【正文】

DBN在蛋白质编码区识别问题中的应用研究

作者:胡青渝; 刘广臣 鲁东大学数学与统计科学学院; 山东烟台264025; 重庆大学数学与统计学院; 重庆401331
编码区识别   信号处理   随机森林  

摘要:针对真核生物DNA序列中蛋白质编码区的识别问题,提出基于深度置信网络(Deep Belief Network,DBN)的组合模型。通过信号处理技术对真核生物的DNA序列进行数值转换,并结合统计学知识提取转换后DNA序列的数值特征;利用随机森林对所提取的特征变量降维;用深度置信网络模型对DNA序列分类判别;根据短时傅里叶变换(Short Time Fourier Transform,STFT)技术对外显子区准确定位。在三个标准测试集上比较组合模型与传统Logistic回归模型、贝叶斯判别模型的判别效果,结果显示,深度置信网络组合模型的准确率和特异度等指标都明显优于Logistic回归模型和贝叶斯判别模型。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅