如何將你的照片存儲(chǔ)1000年?哈佛大學(xué)最新研究:用這個(gè)
在計(jì)算機(jī)技術(shù)飛速發(fā)展、數(shù)字生態(tài)日新月異的今天,數(shù)據(jù)存儲(chǔ)技術(shù)變得愈發(fā)重要。
然而當(dāng)前,用于數(shù)據(jù)存儲(chǔ)的設(shè)備,比如光學(xué)介質(zhì)、磁介質(zhì)和閃存,使用壽命通常不到 20 年,并且還需要消耗大量能量來(lái)維護(hù)。
一直以來(lái),盡管科學(xué)家們始終在探索以高密度和無(wú)電的方式來(lái)存儲(chǔ)信息的其他方法,比如 DNA 分子或其他聚合物,但這些方法也會(huì)受到相對(duì)成本高和讀寫速度慢等因素的限制。
那么,有沒(méi)有一種更好的方法呢?近日,哈佛大學(xué)化學(xué)與化學(xué)生物系 George Whitesides 教授團(tuán)隊(duì)及其合作者,就開(kāi)發(fā)了一種全新且原理簡(jiǎn)單的光學(xué)分子存儲(chǔ)方法。
他們使用熒光染料分子編碼二進(jìn)制信息,成功將各類文字、圖像信息寫入并讀取出來(lái),讀/寫速度分別可以達(dá)到 128 bits/s 和 469 bits/s,甚至可以讀寫視頻或其他任何可以數(shù)字存儲(chǔ)的信息。
同時(shí),比起傳統(tǒng)存儲(chǔ)技術(shù),該方法還具有存儲(chǔ)密度高、存儲(chǔ)壽命長(zhǎng)(理論上可達(dá)數(shù)千年或更久)、成本可接受等優(yōu)點(diǎn)。
相關(guān)研究論文以“Storing and Reading Information in Mixtures of Fluorescent Molecules ”為題,已發(fā)表在科學(xué)期刊 ACS Central Science 上。
研究人員表示,這種光學(xué)分子技術(shù)并不要求對(duì)分子內(nèi)部的結(jié)構(gòu)或序列進(jìn)行復(fù)雜編碼,非常簡(jiǎn)單易懂,也為存儲(chǔ)能耗、成本和抗消耗能力等新興分子信息存儲(chǔ)技術(shù)面臨的重要問(wèn)題提供了解決方案。
不僅快,還“保真”
當(dāng)前,用于存儲(chǔ)數(shù)字信息的技術(shù)多種多樣,包括光盤、閃存和驅(qū)動(dòng)硬盤等,但其工作壽命大約只有幾十年。另一種可行的方法是將信息存儲(chǔ)在一些分子中,例如 DNA——受大自然將各種復(fù)雜的生物遺傳信息存儲(chǔ)在 DNA 中的啟發(fā),科學(xué)家嘗試人工創(chuàng)造類似的分子,以有目的地存儲(chǔ)數(shù)字信息。
這樣的方法在理論上具有非常高的存儲(chǔ)密度,而且無(wú)需能耗維護(hù);更妙的是,根據(jù)科學(xué)家推斷,可以存儲(chǔ)信息數(shù)千年乃至更久。 然而,這些分子系統(tǒng)也存在劣勢(shì):讀/寫速度不夠快,多次讀取容易造成信息損失,成本較高,以及尺寸縮小導(dǎo)致噪聲增加。
因此,為解決分子存儲(chǔ)技術(shù)存在的問(wèn)題,Whitesides 等人開(kāi)創(chuàng)性地使用熒光分子來(lái)將目標(biāo)信息編碼成二進(jìn)制并存儲(chǔ),并使用熒光顯微鏡來(lái)讀取信息。 使用這種方法,他們成功在一塊小至 7.2 mm^2 的基板上存儲(chǔ)了約 14KB 的數(shù)字信息,文本和圖像均可存入,空間信息密度高達(dá) 271.5 bytes/mm^2。
圖|團(tuán)隊(duì)使用噴墨打印機(jī)成功將信息存儲(chǔ)在很小的樹脂基板上,而電腦程序能夠放大看到其上各染料的點(diǎn)狀分布(動(dòng)圖素材來(lái)源:YouTube)
此外,通過(guò)重復(fù)讀取信息 1000 次以上,研究團(tuán)隊(duì)發(fā)現(xiàn)熒光信號(hào)強(qiáng)度的損失較少(低于 20%),且每次都能成功讀取。
而在讀寫速度方面,研究團(tuán)隊(duì)也取得了不菲的成績(jī)——在使用噴墨打印機(jī)將熒光分子寫入信息時(shí),速度可以達(dá)到 16 bytes/s。同時(shí),只需要簡(jiǎn)單判別某處有無(wú)熒光染料分子,就可以讀取對(duì)應(yīng)的二進(jìn)制信息。因此,該方法能夠并行多通道讀取信息,速度達(dá)到 58.6 bytes/s。
圖|用該技術(shù)將“電學(xué)之父”法拉第的圖像(3.95 KB)轉(zhuǎn)換成熒光染料圖案,并存儲(chǔ)在 4.2mm^2 大小的環(huán)氧樹脂基底上,打印錯(cuò)誤率只有 0.4%(來(lái)源:該論文)
因此,這種方法能夠以可接受的成本實(shí)現(xiàn)高密度、快速讀/寫的信息存儲(chǔ)技術(shù),以及對(duì)單個(gè)分子集的多次讀取而不丟失信息,可以說(shuō)很好地解決了一直以來(lái)分子存儲(chǔ)技術(shù)中存在的問(wèn)題。
熒光分子如何編碼數(shù)字信息?
實(shí)際上,此次的技術(shù)是一種基于數(shù)據(jù)磁帶(Write Once Read Many,WORM)的分子信息存儲(chǔ)方法,不能重復(fù)寫入且不允許修改,但可以重復(fù)讀取。
首先,研究人員選擇了 7 種可在不同波長(zhǎng)發(fā)光的熒光染料分子,這些染料都很容易買到。他們使用染料來(lái)分別標(biāo)記 ACSII 碼的每一位,如果染料存在則代表“1”,反之則代表“0”。
圖|熒光分子對(duì)文本信息“Arts”進(jìn)行二進(jìn)制編碼和打印成像示意圖(來(lái)源:該論文)
接下來(lái),該團(tuán)隊(duì)使用噴墨打印機(jī)將染料混合物根據(jù)信息編碼打印在環(huán)氧樹脂表面的小點(diǎn)中,環(huán)氧樹脂基底中含有活性氨基,會(huì)與染料發(fā)生反應(yīng)并形成穩(wěn)定的共價(jià)鍵,從而固定住染料分子并防止后續(xù)讀取時(shí)有過(guò)高損耗。
然后,他們使用配備有多通道熒光檢測(cè)器的熒光顯微鏡,讀取每個(gè)點(diǎn)上染料分子的發(fā)射光譜并解碼信息。這樣一來(lái),該檢測(cè)器可以同時(shí)且互不干擾地分辨出基底上任意點(diǎn)的染料信息組合,計(jì)算機(jī)程序再將二進(jìn)制碼還原為圖像/文本,讀取過(guò)程隨即完成。
圖 | 熒光顯微鏡讀取基板上某點(diǎn)的染料顏色,分析出對(duì)應(yīng)信息示意圖(來(lái)源:論文)
研究人員表示,以這種方式存儲(chǔ)的數(shù)據(jù)可以在數(shù)千年內(nèi)保持可讀。另外,它還不容易受到水的破壞、不能被遠(yuǎn)程黑客攻擊、不會(huì)受到現(xiàn)有存儲(chǔ)系統(tǒng)的尺寸限制,并且它的存儲(chǔ)不需要任何能源。
數(shù)字信息存儲(chǔ)技術(shù)盤點(diǎn)
從古至今,信息存儲(chǔ)從最傳統(tǒng)原始的書籍文字演變至今天的數(shù)字信息,一路變遷,如今仍在廣泛應(yīng)用的數(shù)字信息存儲(chǔ)技術(shù)有哪些?
硬盤:采用磁介質(zhì)的數(shù)據(jù)存儲(chǔ)設(shè)備,希捷(Seagate)在 1980 年生產(chǎn)了第一款 5.25 英寸硬盤(HDD),同年 IBM 推出的第一款 1 GB 硬盤則是個(gè)龐然大物,重達(dá) 550 磅。到了今天,1T 硬盤都不再新鮮,科學(xué)家們一直在努力突破磁介質(zhì)技術(shù),以提高硬盤密度、擴(kuò)充容量、降低能耗。
光盤:1960 年代,一位名叫 James T. Russel 的發(fā)明家致力于將光作為一種機(jī)制來(lái)記錄并重播音樂(lè)。直到 1975 年,索尼出資完成該項(xiàng)目,生產(chǎn)出 CD 和 DVD。
閃存:2000 年末問(wèn)世,采用電子式可清除程序化只讀存儲(chǔ)器的形式,允許在操作中被多次擦或?qū)懙姆且资源鎯?chǔ)器。主要用于手持式移動(dòng)設(shè)備,例如存儲(chǔ)卡、U 盤等。
數(shù)據(jù)孤島與數(shù)據(jù)湖:大數(shù)據(jù)的有用來(lái)源,以原始格式存儲(chǔ)數(shù)據(jù),并允許處理這些數(shù)據(jù),其用戶可以通過(guò)互聯(lián)網(wǎng)訪問(wèn)大部分信息。
云數(shù)據(jù)存儲(chǔ):互聯(lián)網(wǎng)基于云服務(wù)器進(jìn)行數(shù)據(jù)存儲(chǔ)與傳輸,云本質(zhì)上為用戶提供了無(wú)限量的存儲(chǔ)空間,同時(shí)需要加密和身份驗(yàn)證。
分子存儲(chǔ):利用 DNA、蛋白質(zhì)等分子內(nèi)部結(jié)構(gòu)原理對(duì)信息進(jìn)行存儲(chǔ)。2019 年,同樣是來(lái)自哈佛大學(xué)的一個(gè)研究團(tuán)隊(duì)開(kāi)發(fā)出一種基于寡肽的分子存儲(chǔ)技術(shù),當(dāng)時(shí)的數(shù)據(jù)寫入和讀取的平均速率分別為 8 bit/s 和 20 bit/s。值得一提的是,該團(tuán)隊(duì)正是來(lái)自 George Whitesides 實(shí)驗(yàn)室。
參考資料:
https://news.harvard.edu/gazette/story/2021/10/harvard-researchers-use-dyes-to-store-data/
https://pubs.acs.org/doi/10.1021/acscentsci.1c00728
https://www.youtube.com/watch?v=EHg2Li52qUI
https://gmwgroup.harvard.edu/
本文來(lái)自微信公眾號(hào)“學(xué)術(shù)頭條”(ID:SciTouTiao),作者:吳婷婷,36氪經(jīng)授權(quán)發(fā)布。