Scribble at 2022-03-26 11:22:55 Last modified: 2022-03-26 23:23:23

添付画像

ここ数日は過去に Firefox のアドオンである Scrapbook を使って保存したウェブ・ページや PDF などを、DVD やら Blu-Ray のメディアから１個の外付け SSD ドライブへ集約する作業を進めている。具体的には、「マルチ Scrapbook」という機能があって複数の異なるフォルダを保存先として設定できるため、保存している容量が増えてきたら新しく Scrapbook フォルダを作り、それまで使っていたフォルダは DVD-R や Blu-Ray に焼いた後で削除していたわけである。でも、これをやることで保存先としてのフォルダが分散する（それはそれで意図したことだからいいのだが）。となると、どのメディアに何のデータがあるのか、丁寧にリストでも作っておかなければ、必要に応じてどのメディアを取り出してデータを再び見たらいいのか分からなくなる。記録・再生ドライブにメディアを入れっぱなしにでもしない限りテキスト検索できないし、複数のメディアを同時に入れておくのは不可能であるため、結局は紙であれテキスト・ファイルであれ、メディアと関係のないリソースとしてリストを記録しておくという方法しか管理のしようがなく、これは当たり前だがデータを放置する心理的な原因にもなり、過去のリソースを活用できない原因でもあった。

また、一か所にデータをまとめておかないと利用する動機付けすら失われてしまう。「ああ、そういえばこういうページを保存していたな」と、フォルダの一覧を眺めることで気づかされることも多いからだ。それは、大型書店や図書館で何気なく色々な書棚を見て回るときに興味深い本を見つけるような偶然の機会でもあるが、そういうことを楽しむ余裕がなくなるのは単純に勿体ない。そのていどのチャンスを僕らのような凡庸で平凡な市民でも享受できる国であるほうが、誰だって安心して暮らせるというものだ。現今のウクライナで起きている戦争を見聞きするにつけ、改めて思う。いきなり話が大事になってしまったが、それだけ平凡な市民でも膨大なデータを気軽に扱える時代となったのだから、それを十分に活用することは有意義だし、せっかくチャンスがあるのにメディアへ焼いて保存するだけでは無意味であろう。そんなものを後生大事に保存していたところで Internet Archive の代わりにもならない。こういうわけで、Scrapbook アドオンのデータを保存するフォルダとして分散させるのではなく、今回は専用の SSD ドライブを用意して、そこへ単一の保存フォルダをつくって全てのリソースを集約すること、そして、もちろん集約したうえで十分にリソースを活用することが目的だ。

だが、困ったことに、ファイルの「インポート」が相当な割合で失敗する。"Failed to copy files" というエラーが山のように発生するのだ。そして、それはインポートしようとする Scrapbook フォルダの単位で一律にエラーを吐くのではなく、一部のページやファイルはインポートできるが、残りのページやファイルは（たとえ分類してあるフォルダが全く同じであっても）失敗するという、殆ど規則性の分からない原因で起きるらしい。これでは、たとえばインポートが順調に進んでいるように見えても、見ていないときにエラーを起こしてインポートできていないリソースがあったとしても気づかない（インポートしているプロセスを最初から最後まで眺めているバカなどいまい。だいたい、25GB の Blu-Ray からすべてのリソースをインポートするのに半日はかかるからだ）。

よって、インポートの機能は信用しかねる。いまのところ、残念ながら Scrapbook フォルダの単位で SSD にコピーして、「マルチ Scrapbook」として同じドライブに保存してある別の保存先を参照するという運用でしか十分なデータの管理ができない。しかし、マルチ Scrapbook だと異なる保存先を〈串刺し〉にして検索することはできないので、やはりどの保存先にどういうリソースがあるのか、どこかへ整理しておかなくてはいけない。異なるメディアに分散しているよりもアクセスはしやすくなったが、これでは不十分な管理だと言わざるをえない。

つまり、そろそろこのようなリソースの管理手法については限界を感じている。恐らく、15年は使わせてもらってきたツールであり、Firefox のアドオンをどれか一つ選べと言われれば躊躇なく選ぶだけの価値があるものだが、他人が手掛けている後続のアドオンも含めて開発が停止しており、そもそもサポートしているプラットフォームが Waterfox Classic という一つの、いつまで使えるかも分からないソフトウェアであるから、使い続けることにもともと不安はあった。それに、原理的な話としても特定のブラウザとアドオンがなければ管理できないリソースというものは、ただのテキスト・ファイルを大量に保存して全文検索すればいいだけの手法とは異なり、やはりペイロードに「マークアップ」を追加するという仕様の限界だと思う。確かに、ペイロードのデータだけでは〈情報〉として十分な意味を為さない場合もあり、テキストに対する論理的構造の指定としてマークアップが必要となることもあれば（たとえば、どのテキストがページの内容であり、どれがメニュー・テキストなのかを区別できなくてはいけない）、更に論理的構造だけにとどまらずセマンティックな指標も必要であることが多い（統語論的に全く同じスコープとマークアップができる「タグ」でも、要素が何を意味するかの違いを区別できなくてはいけない）。しかし、紙や画像とは違ってウェブ・コンテンツは、それを保存したり表示するブラウザの実装つまりプラットフォームや、それをコーディングする人間の実務能力への依存が強すぎるという点で、これまではその「自由」が強調されすぎたように思う。逆に言えば、ウェブ・ページは不完全・不安定なメディアなのだ。その刹那的な扱いにセンチメンタルな享楽を感じてもいいが、僕はすくなくとも自分が生きて利用するあいだは仕様や実装に振り回されるのはいやだ。

たとえば、いま大量に保有しているウェブ・ページを、すべて PDF ファイルへと変換できるとしても、PDF ファイルを管理して〈串刺し〉に内容を検索できる特別なソフトウェアがなければ、まともに管理できない。恐らく、いまの保有状態から言えば、PDF にして何万ものファイルができあがるはずだが、それを一つずつ Adobe Reader で開いてテキスト検索なんてしていたら人生が終わってしまうだろう。すると、それはつまり PDF を一括して管理するキヤノンの DocuWorks のような特殊で、開発が継続される保証もなく、動作仕様がオープンでもないソフトウェアに依存して情報を管理するということになる。もちろん、僕が保有してるデータなんて僕がくたばるまで使えたらいい。大英図書館の蔵書でもあるまいし、僕が死んだら Scrapbook アドオンの大量のデータなど消えて無くなろうと知ったことではない。だが、IT 関連のプロダクトやソフトウェアというものは、はっきり言って事業継続性も、原理なり規格としての持続性にも欠けると言わざるをえない。僕の人生に比べてすら持続性がないと思う。情報理論や情報工学という学術分野そのものが、僕ら哲学者に言わせれば「幼児期」としか言いようがない未熟な学問だからでもある。３年や５年で規格が無効になったり覆されたり、あるいは単にビジネスや政治という事情で何の優越性もなければ実用性すらない規格や実装に置き換わることすらある（XHTML がいい例だ）。

ということで、ひとまずデータは集約しているところだが、今後のことは今年の課題である。もう、こんなことは僕の年齢から言えば30年も続けられるかどうか分からないが、いまきちんと納得のゆく方針に変えて決めておけば、逆に言えば残る30年で扱う情報の管理を堅実にできるだろう。もちろん、選択肢の一つは既に考えてある。それは、ここまで書いてきたら既に予感はあるかもしれないが、「保存することをやめる」という選択だ。

冒頭に戻る