最近,《分子园艺》(Molecular Horticulture)中国农业科学院郑州果树研究所桃遗传育种团队的文章在网上发表。PeachMD数据库(http://www.peachmd.com)首次整合桃基因组、表观遗传组、人群遗传变异和多维表型数据,深度整合CRISPR设计、GWAS分析等工具,为促进桃分子育种和功能基因组学研究提供数据支持。
随着高通量测序技术的快速发展和测序成本的显著降低,生物大数据呈指数级增长趋势。在桃子遗传育种研究领域,多组学习技术的广泛应用催生了多维、多层次的海量数据资源,如基因组、转录组、表面组等。这些数据的积累为分析桃子进化过程、探索重要性质的关键基因和指导分子育种实践提供了前所未有的机会。
然而,面对如此庞大而复杂的多组数据,如何高效地整合、深入挖掘和提取有价值的生物信息已经成为当前研究者面临的主要挑战之一。这不仅需要强大的计算和分析能力,还需要系统化的数据管理平台和智能分析工具的开发和应用。因此,建立多组数据库已成为促进桃遗传育种研究的重要基石。
PeachMD数据库包括迄今为止最新最全面的桃多组数据库。数据库收集整合了已发布的12个桃基因组(支持基因组之间的共线性分析)、支持FPKM//329个转录组数据集(包括不同组织、不同发展阶段)TPM/Read Count多维表达谱分析)、102个全基因组亚硫酸氢盐测序(分析CG/CHG1313个全基因组重测序数据(包括13种关键农艺性状表型)/CHH不同位点甲基化调控方法。
通过CRISPR-GWAS联动,数据库坚持从基因挖掘到分子设计的全过程覆盖的全过程设计理念。另外,PeachMD数据库还支持从基因ID到基因ID的多模式检索、启动子、蛋白质结构域等多维查询,一键获取基因序列信息。集成Gene 作为基因组数据分析的“桥梁工具”,LiftOver工具便于不同基因组之间的基因比较。
简而言之,PeachMD提供的多组学关联分析工具可以揭示基因组变异-表面变异-转录差异协同控制网络,方便数据的应用。因此,它有望成为促进桃分子育种和功能基因组学研究的重要资源,为相关领域的研究提供强有力的数据支持。
中国农业科学院郑州果树研究所博士生李昂和助理研究员孙世航是论文的第一作者,研究员曾文芳是通信作者。该研究获得了国家自然科学基金、河南省科技研究项目、中国农业科学院科技创新项目、郑州果树研究所基本科研业务费等项目的资助。
赞一个