第1个回答 2022-12-15
动植物基因组De novo测序分析也叫从头测序分析,指不依赖于任何参考序列信息就可对某动植物进行测序分析,使用最新的生物信息学方法进行序列拼接获得某物种的基因组序列图谱,并进行基因组结构注释、功能注释、比较基因组学分析等一系列的后续分析。三代测序技术(以PacBio和Nanopore为代表)具有读长长的特点,自2015年开始在动植物基因组De novo中初露锋芒,已延用至今。该类型测序分析结果可以广泛应用于农林鱼牧医药及海洋等各个方面的研究。
图1 不同测序技术读长,准确性及基因组连续性评估
三代测序技术原理
PacBio测序原理
采用边合成边测序的方式,以其中一条DNA链为模板,通过DNA聚合酶合成另外一条链,进一步将荧光信号转变为碱基信号。同时PacBio已升级了CCS测序模式以获得长读长的高保真(HiFi)15 kb reads,由此提升基因组组装的准确性。
图2 三代PacBio测序原理
Nanopore测序原理
当单链DNA分子穿过纳米孔时,相对于每个核苷酸,都会获得不同的电流信号。记录每个孔的离子电流变化,并基于马尔可夫模型或递归神经网络的方法将其转换为碱基序列。除此之外,Ultra-long reads (ULRs) 是ONT平台的另一重要特征,并具有促进大型基因组组装的潜力。
信息分析内容
De novo研究 研究内容
基因组组装 多软件组装、组装结果评估
基因预测与注释 编码基因预测;重复序列注释和转座元件分类;非编码RNA注释;假基因注释等
Hi-C辅助基因组组装 有效数据评估;Contig聚类、排序及定向分析;挂载结果评估