數位典藏壽命幾何?

去(2007)年,我和其他中央研究院數位典藏計畫的顧問同桌午餐;席間非正式的聊到數位典藏內容的保存方式,我半開玩笑的提到「要小心一點喔,最好能做出防EMP(Electro-Magnetic Pulse,電磁脈衝攻擊)的系統」,大家都笑了。

一位教授笑著說:「到那個時候,就『不用擔心』了啦。」

其實我是有點認真的。

所謂EMP,簡單的說就是用電磁波造成瞬間的超高電壓,「燒毀」有效半徑之內的電子產品,讓對方的電子設備無法操作,但(理論上)不會對生物造成損傷。

在未來的戰爭中,由於政治和人道上的壓力,EMP武器將會變得更加普遍,而且在區域性衝突之中,如果對方是高度科技化的部隊,有效的EMP攻擊可以更迅速的讓對方屈服;如果通稱C4ISR的指揮、管制、通訊、情報系統等等全當,仗也就幾乎沒得打了。

也許數位典藏計畫本身不太需要、也很難考慮到這種天災人禍的因素。然而,歷史上有太多人類的智慧和文化遺產毀於天災人禍;如果經過百年之後(不知道會發生什麼事),我們藉由科技、網路、以及一般人貢獻所累積的知識資產(相對於過去幾乎只有菁英能留下記錄),如果也像沒有「高科技」可言的宋版書、明版畫一樣,至今十不存一,那麼做數位典藏的意義是什麼呢?

所謂沒什麼意義,指的是「典藏」的部份,也就是讓往後的人能夠瞭解今天的人如何生活、思考、互動。另外一個角度,則是讓現在的人便於查閱,進而瞭解彼此、分享知識,而這個部份是比較不用擔心的。

只要有好的備份和存取技術、再加上夠用的經費,除非碰到極端狀況(例如K隆星人佔領地球),否則硬碟壞了換新的、每小時備份到地球的另外一端、有新技術出來就升級、年限到了就轉拷,延續下去不是太大的問題。

原則上,好的典藏應該能夠兼顧這兩點:能長久保存、內容存取方便。至於容量和速度上的限制,都還可以用技術來克服,而且過去二三十年來,每隔幾年都會有很大的進步,至今已經不大需要操心了。

tgdaily網站登出了一篇標題為〈Storing data for the next 1000 years〉(將資料繼續儲存1000年)的文章,其中提到一套叫做「Pergamum」、以硬碟和記憶體彼此搭配並重複配置的新系統,理論上可以儲存資料達1400年:

容量為10PB的(Pergamum系統)建造費用為US$4700,每年運轉費用約US$50;……在模擬中,使用1TB硬碟的10PB容量Pergamum系統……的MTTDL(平均資料損失間隔)是1.25×10^7小時,等於大約1,400年。當然,這只是估計值,但這個估計值已經遠比目前已知的解決方案更久,也無疑是我們所看過的概念之中,第一個真正的長時間儲存設計。

很有趣的概念,也算是除了光碟或磁帶等物理性的「持久媒體」(但不一定可靠)設計之外,以固態記憶支援、錯開機械硬碟MTBF(平均故障間隔)來延續儲存壽命的長時間儲存概念。

我對這個設計的興趣不是很大;因為:

  1. 它並沒有解決EMP損毀的疑慮;
  2. 還是得插電,沒電就嗚呼了;
  3. 這樣的概念可能在兩三年內就被其他技術(例如號稱壽命十萬年的光碟)所取代;
  4. 問題是,就算這套系統(或十萬年光碟)能夠普及,可能30年後就沒有能讀取內容的機器了。

雖說如此,這套系統仍然有它的價值,因為號稱能以低成本連續運作千年的設計,即使不用在長時間儲存,也可以用來改良現在的數位典藏系統,讓它運作成本更少、損毀機率更低。

只要能成為未來新設計的基礎、或是將許多人辛苦累積的文化成果撐到下個世代的系統出現,那就值回票價了。

當然,最好的狀況還是不要戰爭、不要EMP、也不要天災人禍,裝幾台簡單的伺服器加上RAID、每隔三年換套新的就行了。

Facebook回應