摘要:基因组测序是生物信息学中最基本的研究方向之一,然而大多数生物的基因组都不可能一次性获得,需要利用序列拼接技术对实验中获得的DN段进行拼接操作。目前,测序过程中获得的DN段越来越短,基于Euler路径的拼接算法在处理这种短片段拼接时具有优势。在Euler路径算法中,一个关键的步骤是deBruijn图的构建,一直以来,构建deBruijn图的方式总是让后一个κ-mer与前一个κ-mer之间有κ-1个碱基的交叠,相邻的两个κ-mer之间相互错开一位。但文中的研究发现,如果有边连接的两个κ-mer之间有κ-2个或者更少的碱基相交叠,会对deBruijn图结构复杂性产生重要影响。针对这些影响进行详细分析,并设计实验进行验证,实验结果表明,κ-mer之间的错位数变化对deBruijn图结构复杂性有显著影响。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
热门期刊服务
China Foundry Tsinghua Science and Technology Plasma Science and Technology Control Theory and Technology Chinese Journal of Oceanology and Limnology Journal of Computer Science and Technology Journal of Huazhong University of Science and Technology The Journal of China Universities of Posts and Telecommunications International Journal of Mining Science and Technology