記者從天津大學(xué)獲悉,該校合成生物學(xué)團(tuán)隊(duì)創(chuàng)新DNA存儲(chǔ)算法,將十幅精選敦煌壁畫存入DNA中,通過(guò)加速老化實(shí)驗(yàn)驗(yàn)證壁畫信息在實(shí)驗(yàn)室常溫下可保存千年,在9.4℃下可保存兩萬(wàn)年。該算法支持DNA分子成為世界上最可靠的數(shù)據(jù)存儲(chǔ)介質(zhì)之一,可以讓面臨老化破損危機(jī)的人類文化遺產(chǎn)信息保存千年萬(wàn)年。
該成果近日發(fā)表于《自然·通訊》上。
DNA存儲(chǔ)的敦煌壁畫
從結(jié)繩記事、倉(cāng)頡造字到磁帶、硬盤等現(xiàn)代磁光電存儲(chǔ)技術(shù),人類文明的發(fā)展與存儲(chǔ)技術(shù)密切相關(guān)。隨著科學(xué)技術(shù)的進(jìn)步,數(shù)據(jù)存儲(chǔ)方式不斷迭代創(chuàng)新。中國(guó)科學(xué)院院士、天津大學(xué)元英進(jìn)教授帶領(lǐng)團(tuán)隊(duì)一直致力于下一代存儲(chǔ)技術(shù)——DNA存儲(chǔ)。“據(jù)國(guó)際數(shù)據(jù)公司估計(jì),到2025年全球數(shù)據(jù)總量將達(dá)到驚人的175ZB(1ZB≈10的21次方字節(jié))。全世界都在建數(shù)據(jù)中心,數(shù)據(jù)中心的能耗是驚人的。DNA存儲(chǔ)由于其高存儲(chǔ)密度與低能耗處理等特點(diǎn),被視為一種極具潛力的存儲(chǔ)技術(shù),成為應(yīng)對(duì)數(shù)據(jù)存儲(chǔ)增長(zhǎng)挑戰(zhàn)的新機(jī)遇。”元英進(jìn)院士介紹說(shuō)。
2021年8月元英進(jìn)教授團(tuán)隊(duì)取得DNA存儲(chǔ)的重大突破,從頭編碼設(shè)計(jì)合成了一條長(zhǎng)度為254886堿基對(duì)、專用于數(shù)據(jù)存儲(chǔ)的酵母人工染色體,將兩張經(jīng)典圖片和一段視頻存儲(chǔ)于人造染色體中,利用酵母繁殖實(shí)現(xiàn)了數(shù)據(jù)穩(wěn)定復(fù)制,并用納米孔測(cè)序器件實(shí)現(xiàn)了數(shù)據(jù)快速讀出與無(wú)錯(cuò)恢復(fù)。
DNA存儲(chǔ)技術(shù)概念圖
DNA存儲(chǔ)高效低耗,但作為一種鏈?zhǔn)缴锎蠓肿,在體外常溫保存時(shí)會(huì)面臨DNA斷裂降解等風(fēng)險(xiǎn),嚴(yán)重影響信息存儲(chǔ)的長(zhǎng)期可靠性,是亟待解決的關(guān)鍵科學(xué)問(wèn)題。對(duì)此,元英進(jìn)團(tuán)隊(duì)設(shè)計(jì)了基于德布萊英圖理論的序列重建算法來(lái)解決DNA斷裂等問(wèn)題。該算法結(jié)合貪婪路徑搜索和循環(huán)冗余校驗(yàn)碼來(lái)實(shí)現(xiàn)斷裂DNA片段的高效從頭組裝,從原理上支持了DNA存儲(chǔ)的長(zhǎng)期可靠性。
結(jié)合該序列重建算法(內(nèi)碼)與噴泉碼算法(外碼),團(tuán)隊(duì)設(shè)計(jì)編碼了6.8MB敦煌壁畫,合成了承載圖片信息的DNA片段21萬(wàn)條。為數(shù)據(jù)的長(zhǎng)期可靠性,團(tuán)隊(duì)制備了一個(gè)沒(méi)有任何特殊保護(hù)的DNA水溶液樣本,并在70℃下加速樣本斷裂、降解長(zhǎng)達(dá)十周。處理后的DNA片段80%以上都發(fā)生了斷裂錯(cuò)誤,依靠設(shè)計(jì)的序列重建算法依然可以準(zhǔn)確組裝并解碼96.4%以上的片段,再通過(guò)噴泉碼解決少量片段丟失的問(wèn)題,原始的敦煌壁畫圖片依然能夠完美恢復(fù)。根據(jù)理論推算,這種程度的高溫破壞相當(dāng)于實(shí)驗(yàn)室常溫25℃一千年或者9.4℃長(zhǎng)達(dá)兩萬(wàn)年的自然保存。
這是繼基于人工合成染色體的酵母體內(nèi)信息存儲(chǔ)模式取得突破后,天津大學(xué)合成生物學(xué)團(tuán)隊(duì)在DNA信息體外存儲(chǔ)模式上取得的又一重要突破。