随着信息技术的快速发展,传统的存储方式已经逐渐不能满足大数据时代的需要。在此背景下,DNA信息存储技术应运而生。使用DNA分子存储数据已被视为未来大规模数据存储的潜在介质。每克DNA可以存储数百个艾字节的数据,并且可以存储近几千年,而无需电力。特别是在生物医学数据领域,DNA存储的潜力尤为显著——其图像数据分辨率高、存储周期长、相似性强,具有巨大的发展前景。
最近,天津大学应用数学中心教授吴华明在DNA存储领域取得了新的突破,并在国际期刊《自然计算科学》上发表了研究论文。该研究提出了一个新的DNA存储系统——HELIX,专门用于存储生物医学数据,并成功实现了60MB时空组学图像的存储和恢复。
研究小组开发的HELIX系统包括三个核心模块:图像压缩、图像纠错编码和图像恢复。针对DNA存储过程中可能出现的碱基错误,HELIX优化了当前的压缩算法,大大提高了系统的容错能力。同时,为了进一步提高图像解码的成功率,团队还引入了深度学习技术,显著提高了图像修复过程中的信息恢复能力。在湿实验中,团队成功地将两个60MB的时空组学图像编码为13万个DNA序列,每个183个碱基,并通过DNA合成和测序技术成功地恢复了图像数据。实验结果表明,HELIX系统具有强大的鲁棒性,只需5.8倍左右的测序深度就可以恢复图像的大部分信息。
据报道,这一结果意味着天津大学应用数学中心团队在推动DNA信息存储技术的实际应用方面迈出了关键一步。研究表面,针对特定数据类型量身定制的DNA存储系统不仅在存储效率方面表现出色,而且在可靠性方面表现出更大的优势,为DNA信息存储技术的广泛应用奠定了坚实的基础。本研究由天津大学应用数学中心和国家合成生物技术重点实验室共同完成。曲冠金博士生是第一作者,吴华明是通信作者。
赞一个