关键词:
Kraken2
反刍动物
消化道微生物
分类数据库
摘要:
宏基因组学技术的应用丰富了对动物消化道中微生物组成以及功能的认识。当前,基于宏基因组测序读长(reads)水平的物种组成的分类比对水平普遍在15%-45%。因此,提高宏基因组测序reads水平微生物的比对率,可进一步挖掘宏基因数据中的微生物信息。【目的】通过扩展Kraken2标准数据库来提高反刍动物消化道微生物的分类能力,从而进一步挖掘宏基因组数据中的微生物信息。【方法】本研究共收集了来自牛、绵羊和山羊瘤胃液、粪便以及消化道中14827个宏基因组组装基因组(metagenome-assembled genomes,MAGs),经质控过滤后,保留了3095个物种级基因组箱(species-levelgenomebins,SGBs),经物种分类以及功能预测后,SGBs被整合进Kraken2标准数据库,并对其分类效果予以评估。【结果】在SGBs在基因组分类数据库(genome taxonomy database,GTDB)物种分类中,3053个SGBs为细菌,可归类为28门782属;42个SGBs为古菌,可归类为2门8属。基于eggNOG软件功能预测,SGBs在蛋白相邻类的聚簇(clusterof orthologous groups of proteins,COG)功能分类中可注释到26种分类;在京都基因与基因组百科全书(Kyotoencyclopediaofgenesandgenomes,KEGG)功能预测中,前25个直系同源物(KEGG orthology,KO)通路号可归类为14种通路类型;碳水化合物酶(carbohydrate-active enzymes,CAZy)预测中,593个SGBs可注释到6类碳水化合物酶,分别是辅助氧化还原酶类(auxiliaryactivities,AA)、碳水化合物酯酶(carbohydrate esterases,CE)、糖苷转移酶(glycosyltransferases,GT)、碳水化合物结合模块(carbohydrate-binding modules,CBM)、糖苷水解酶(glycoside hydrolases,GH)、多糖裂解酶(polysaccharide lyases,PL);其中,GH是最为广泛的碳水化合物酶种类。3095个SGBs加入Kraken2标准数据库(2024年5月)后,使得数据库中物种数量增加了5.00%,数据库大小从87.2 Gb提升为98.2Gb。通过对一项基于宏基因组技术解析日粮精粗比对荷斯坦奶牛瘤胃微生物组成影响的研究再评估,加入SGBs的数据库使得该研究中瘤胃液宏基因组reads水平的物种比对率从(19.35±1.81)%提升到(51.04±2.05)%,种水平主成分(principal components analysis,PCA)分析结果表明,扩展的数据库增强了区分2种不同日粮精粗比水平下的瘤胃微生物结构的能力,线性判别丰度差异分析(linear discriminant analysis effect size,LEfSe)结果表明,在标准数据库中,Xylanibacter ruminicola和Aristaeella hokkaidonensis分别是低粗料和高粗料日粮条件下的微生物标志物;而在扩展后的数据库中,Prevotella sp.902800365和Prevotella sp.900316445分别是低粗料和高粗料日粮条件下的微生物标志物。【结论】通过引入SGBs扩展Kraken2标准数据库,可进一步增加数据库中物种覆盖度,提高宏基因组reads水平物种比对率,从而增进对宏基因数据中微生物的理解。