小麦是重要的粮食作物之一。小麦基因组庞大,高度重复,是异源的六倍体,使得小麦的完整组装面临挑战。2018年,国际小麦基因组测序联盟发布了中国春季小麦参考基因组。但基因组装中存在大量未分析的重复区域和复杂的序列结构,使得小麦基因组学研究难以全面覆盖整个基因组,阻碍了对特定区域的精细化研究,制约了小麦基因组学研究的发展和育种应用。
近日,中国科学院遗传与发展生物学研究所傅向东研究小组和鲁非研究小组,结合中国农业大学研究人员,综合利用ONT超长读长测序,PacBio HiFi高精度测序和Hi-C数据,实现了中国春小麦基因组的近完整组装。(CS-CAU)。CS-CAU大小为14.46 Gb,碱的准确率大于99.9963%,只剩下290个组装间隙。在这些间隙中,1D、3D、4D、首次实现5D染色体无间隙组装,1D和5D染色体达到端粒至端粒的水平。
这项研究解决了小麦基因组重复序列高、多倍体复杂的组装问题,为解析其它复杂作物基因组提供了一个模型。基于近完整的基因组装,共注释了151,405个高置信度基因,其中59,180个是新注释的基因,包括7,602个首次组装的基因。通过整合RNA-seq数据集和跨物种蛋白同源性证据,对6种种子储存蛋白的基因分布和表达特征进行了研究和分析。研究发现,ω-醇溶蛋白表达完全由B亚基因组贡献,而其他五种SSP表达主要由D亚基因组贡献,为分析小麦面筋质量的遗传基础和分子改良奠定了基础。除了chr1B的着丝粒存在与超长GAA重复序列相关的间隙外,其他20个染色体的着丝粒序列全部组装完毕。通过对颗粒区序列组成的分析,发现颗粒区域主要由逆转座组成,其中A/B亚基因组颗粒富含颗粒相关逆转转座CRW和Quinta,而D亚基因组颗粒中只有30%的序列是CRW和Quinta。同样,三个亚基因组之间串联重复序列的分布也有很高的不均匀性,其中71.89%的简单串联重复集中在B亚基因组,而近一半的卫星序列集中在D亚基因组。与此同时,对丝粒区CRW和Quinta逆转座的插入时间进行了研究和分析,明确了它们在三个亚基因组之间的主要扩张时期。
以上研究为小麦遗传改良和基础研究提供了关键资源。
Near相关研究成果-complete assembly and comprehensive annotation of the wheat Chinese Spring 以genome为题,《分子植物》在线发布。(Molecular Plant)上面。研究工作得到了国家重点研发计划和国家自然科学基金的支持。
赞一个