デジタルファイルを適切に保存し、長期にわたって使えるようにする方法

今日作成した「Microsoft Word」の文書は、20年後には劣化して使えなくなっている可能性がある。文書や画像など、デジタルデータ保管時に知っておきたい3つのポイントを紹介しよう。
3D illustration of transparent database files
Illustration: filo/Getty Images

英国の計算機科学者ティム・バーナーズ=リーが1989年に書いたワールド・ワイド・ウェブ(WWW)の提言書は、インターネットの歴史において重要な文書である。しかし、現代のコンピューターでは開くことができない。

2024年、英国のソフトウェアエンジニアで作家のジョン・グラハム=カミングは、提言が記されたWordの文書を開こうと試みた。しかし、ブログ記事で説明されている通り、現代のMicrosoft Wordやアップルの「Pages」ではファイルを開くことはできなかった。オープンソースのワードプロセッサーである「LibreOffice」では開くことはできたが、書式が崩れていた。結局、グラハム=カミングは欧州原子核研究機構(CERN)により、1998年にPDF形式でエクスポートされたファイルを見つけた。これが、提案書を1989年当時の形式で見る唯一の方法だった。

一般的なファイル形式であっても、こうした重要な歴史的文書が時間の経過やソフトウェアのアップデートによって完全に失われてしまう可能性があることは憂慮すべき事態だ。古いデジタル文書や画像、動画をもっている人なら、同じことが自分のファイルにも起きるのではないかと心配になるだろう。これはデジタルアーキビストが日々向き合っている問題である。そこで、今回専門家に対処法を訊くことにした。

20年前は「古代」の域

「デジタルの世界では、20年前は古代です」と、ミシガン大学のデジタル保存サービスのディレクターを務めるランス・スタチェルは言う。スタチェルのチームのもとには、古いコンピューターや記録媒体からデジタルファイルを復元する依頼が頻繁に舞い込む。「わたしたちの研究所にはフロッピーディスクドライブやCD、古いコンピューターといった古いメディアに対応できる設備があります。作業中にデータを損なわないようにしながら、ファイルをメディアから取り出し、保存システムに移します」

しかし、ドライブからファイルを取り出す作業は最初の手順に過ぎない。取り出したら、次はファイルを開き、数十年先まで使える状態にしなければならないのだ。スタチェルにとってこの仕事は文書をできるだけ長く保存する方法を考えるきっかけとなった。プロのアーキビストではない人たちは、数十年先でもファイルを使えるようにするためにはどうすべきなのだろう。この点についてスタチェルに話を訊いた。

1. オープンフォーマットを使用する

前述のWord文書がMicrosoft Wordで開けなくなった原因は、ソフトウェアが時代とともに変化してしまったからだ。これはデジタルファイルの保管における課題のひとつとなっている。

「物理的な資料の場合は、閲覧する頻度が少ないほど寿命が伸びます」とスタチェルは言う。「しかし、デジタルな資料の場合、常に古くなって使えなくなることに対処しなければなりません。ファイルの情報は時間が経つと失われてしまうのです」

Microsoft Wordなどのソフトウェアのアップデートにより、1980年代に開けたファイルは2020年代に開けなくなってしまう。原因のひとつは、ファイル形式を制御しているのがマイクロソフトであり、マイクロソフトだけがその仕組みを知っているからだ。従って、特に長期的に使えるようにしたいファイルは、オープンフォーマットでファイルをエクスポートすることをスタチェルは勧めている。

文書については、アドビのPDF形式を基にしたオープンスタンダードである「PDF/A」をスタチェルは推奨している。この形式には文書に使用されているフォントを含め、文書を開くために必要な情報がすべてが備わっている。Microsoft Office、LibreOffice、Adobe AcrobatはどこもPDF/Aへのエクスポートに対応しており、このファイル形式の文書を作成することは難しくない。スタチェルは、残しておきたい文書はPDF/Aで保存することを勧める。

「PDF/Aはオープンスタンダードです」とスタチェルは話す。ほかのすべてのファイル形式にも同じ原則をあてはめることができる。いまは問題なく「Excel」のスプレッドシートを開くことができても、20年後には開けなくなるかもしれない。しかし、そのスプレッドシートをCSV形式(CSV形式は簡単に説明すると、ほかの表計算アプリケーションでも開けるテキスト文書のこと)でエクスポートすれば、数十年先でもファイルを使える。

つまり、コンピューターにあるファイルが特定のソフトウェアでしか開けない、そしてそのソフトウェアが特定の企業によって制御されているなら、オープンフォーマットでエクスポートしておくべきということだ。これが将来にわたってデータを守る唯一の方法である。

2. 画像や動画の劣化を防ぐ

画像の場合はファイルを使用できなくなる心配は少ないと、スタチェルは言う。なぜなら、JPEG、PNG、TIFFといったファイル形式がずっと前から普及しているからだ。これらのファイル形式はすべてオープンフォーマットであり、さまざまなソフトウェアで開くことができる。

ただし、これはすべての画像がずっと使えるという意味ではない。なぜなら、写真を頻繁に編集すると画質が落ちることがあるからだ。

「JPEGは悪いファイル形式ではありませんが、編集して保存する度に少しずつ情報が失われます」とスタチェルは説明する。これは「generation loss(世代劣化)」と呼ばれる現象だ。「1回か2回の編集でわかるほど劣化することはありません。しかし、編集と保存を繰り返すなら、元画像のコピーを都度作成して、そのコピーを編集した方がいいということは覚えておいてください」

また、デジタルカメラのRAW形式など一部の画像のファイル形式は、プロプライエタリフォーマット(企業独自のフォーマット)である可能性があることを知っておく必要がある。

「多くのカメラはメーカー独自のRAW形式をデフォルトの保存形式にしています。これはその企業独自の形式なので注意が必要です」とスタチェルは言う。そうしたファイル形式の画像はDigital Negative(DNG)と呼ばれるオープンフォーマットにエクスポートすることをスタチェルは勧める。DNGはRAW形式のファイルの保存に使えるより安全なファイル形式だ。

動画もそれほど問題ではない。現時点においてほとんどの動画ファイルはオープンフォーマットでエンコードされている。しかし、画像と同じく、動画ファイルを何度も編集しないようにとスタチェルは助言している。コピーを作成して編集した方がいい。

「これがデジタルの長所です。何百万回でもコピーを作成できるのですから」とスタチェルは言う。

3. すべてのファイルをバックアップ

貴重なファイルをすべてオープンフォーマットに変換したとしても、ファイルを失っては何の意味もない。だからこそ、スタチェルはファイルをバックアップする重要性を度々強調していた。理想的にはすべてのファイルのコピーを3つ作成し、そのうちのひとつをオフサイトで保管することだ。便利なツールとして、バックアップを自動で実行するBackblazeとCrashplanなどをスタチェルは挙げていた。わたしたちのおすすめは、Backblazeとローカルバックアップ機能を組み合わせて使う方法だ

とはいえ、具体的にどんなバックアップシステムを使うかよりも、何らかのバックアップ手段を用いていることこそが重要である。

(Originally published on wired.com, translated by Nozomi Okuma, edited by Mamiko Nakano)

※『WIRED』によるハウツーの関連記事はこちら


Related Articles
Digital generated image of UI frame filled with multicolored geometric spheres.
ブラウザーに閲覧データがキャッシュとして保存されると、読み込みが高速化される。一方で、キャッシュファイルが問題の原因になることもあるので、こまめにクリアするのがおすすめだ。
Conceptual image of a red laptop resting on a yellow background with a hard shadow
非営利団体のInternet Archiveはこの度、オランダ王国の構成国であるアルバの記録資料の公式保管者となった。少ない予算で資料をデジタル化できるメリットは大きいが、民間団体に頼ることにはリスクもある。

雑誌『WIRED』日本版 VOL.53
「Spatial × Computing」 好評発売中!

実空間とデジタル情報をシームレスに統合することで、情報をインタラクティブに制御できる「体験空間」を生み出す技術。または、あらゆるクリエイティビティに2次元(2D)から3次元(3D)へのパラダイムシフトを要請するトリガー。あるいは、ヒトと空間の間に“コンピューター”が介在することによって拡がる、すべての可能性──。それが『WIRED』日本版が考える「空間コンピューティング」の“フレーム”。情報や体験が「スクリーン(2D)」から「空間(3D)」へと拡がることで(つまり「新しいメディアの発生」によって)、個人や社会は、今後、いかなる変容と向き合うことになるのか。その可能性を、総力を挙げて探る! 詳細はこちら