森の中で木が倒れたら、本当に音がするのでしょうか?そして、Web サイトが一夜にして変わってしまった場合、その以前のホームページはそもそも本当に存在していたのでしょうか?私たちの世界の大部分はますますデジタル化され、一時的なものになっているため、これは単なる哲学的な問題ではなく、単純な歴史の問題でもあります。だからこそ、ウェイバック マシンは、Web サイトの経年変化のスナップショットを提供し、Web の埃っぽい片隅を垣間見ることができる非常に魅力的なのです。
Wayback Machine は、時間の経過とともに永久に失われる Web ページを保存することを目的とした大規模なデジタル アーカイブです。この大量のデータがなければ、ページが更新または削除されるたびに、ページは存在しなかったかのように消えてしまいます。
ウェブページの平均寿命については、ウェイバック マシンのディレクターであるマーク グラハム氏が 2016 年の Entrepreneur の記事で述べています。これらの Web ページが消える理由は多数あります。サイト作成者は他のプロジェクトに移ります。ウェブホスティング会社が倒産する。あるいは、ページが移動されるか、新しいデータやコンテンツに置き換えられる可能性があります。
ウェイバックマシンの始まり
は、Web サイト、書籍、オーディオおよびビデオ記録、およびソフトウェア プログラムのデジタル ライブラリである を設立したブリュースター カールとブルース ギリアットの発案です。どちらのプロジェクトもサンフランシスコを拠点とする非営利団体です。 Wayback Machine は Internet Archive のプロジェクトです。 (Kahle と Gilliat は、Web トラフィック パターンを分析する Alexa Internet も作成し、Amazon に販売しました。)
「彼ら(カーレ氏とギリアット氏)は 1996 年にウェブページのアーカイブを開始し、2001 年にはそれらのアーカイブされたウェブ リソースの発見と再生をサポートするウェイバック マシンを立ち上げました」とグラハム氏は最近の電子メール インタビューで述べています。 「そして、はい、その名前は1960年代の漫画シリーズ『ロッキーとブルウィンクルのショー』からインスピレーションを得たものです。漫画では、WABAC マシン (スペルの違いに注意してください) は、登場人物であるミスター・ピーボディとシャーマンを過去に送り、人類の歴史の重要な出来事を訪れるために使用されるプロット装置でした。」
17 億を超える Web サイトがあり、その数は という世界では、これほど多くの Web ページをカタログ化することを誰が望むことができるでしょうか?ウェイバック マシンは、「クローラー」と呼ばれるものを使用します。これは、Web 上を自動的に移動し、移動中に数十億のサイトのスナップショットを取得するソフトウェアの一種です。プロセスの一部は自動化されていますが、リクエストの多くは図書館員のネットワークによって手動で生成されます。図書館員は、後世や将来の世代のために保存することが重要であると考えられる特定の種類のサイトを優先します。
クローラーはサイトの反復をすべてキャプチャするわけではありません。スナップショットの頻度はサイトの重要度によって異なります。非常に重要なサイトは数時間ごとに記録される場合があります。他のものは数週間または数か月離れて記録される場合があります。ほとんどのサイトはまったく記録されていません (だから心配しないでください。高校時代に作ったあの恥ずかしいファン ウェブサイトは、おそらくもうもうとっくになくなっているでしょう)。 Wayback Machine の重要なコンテンツは、たとえば、大手メディア企業が作成したニュース速報の見出しです。
さらに、必ずしもサイト全体が再作成されるわけではなく、ブラウザーで体験するような方法でデータが保存されるわけでもありません。数ページの数枚の画像のみがキャプチャされる場合があり、ドメイン外の他のサイトにリンクされているコンテンツは保存されません。
ウェイバックマシンの使用
Web ページ上のリンクをクリックすると、「404」または「ページが見つかりません」というメッセージが表示された経験があるでしょう。さて、あなたは最初にそのページに何があったのか疑問に思っています。そこでウェイバックマシンが役立ちます。
Wayback Machine を使用するには、https://archive.org/web/ にアクセスしてください。 「閲覧履歴」検索バーに、調査したいサイトの URL を入力します。この例では、お気に入りの Web サイト https://www.computerbasic.click/ を使用します。結果には、特定の年にサイトがクロールされた (および保存された) 回数を示す時系列の棒グラフが表示されます。
年をクリックすると、その下にさまざまな日付が強調表示された 12 か月のカレンダーが表示されます。青色のハイライトは、サイトが適切に保存されたことを意味します。赤はそうではなかったことを意味します。強調表示された日付のいずれかをクリックすると、サイトのスナップショットが表示されます。これらのスナップショットの 1 つをクリックすると、そのようにして、サイトの古いバージョンにタイムスリップします。
特定のサイトがアーカイブに記録されていることを確認したい場合は、手動で行うことができます。 [今すぐページを保存] オプションを使用して、特定のページを一度保存します。ただし、これにより保存されるのはその 1 ページのみ (Web サイト全体ではありません) であり、将来そのサイトがクロールされることが保証されるわけではないことに注意してください。
また、コンテンツ所有者が自分の素材を Wayback Machine から除外したい場合は、info@archive.org に電子メールを送信してリクエストを送信できます。
Wayback Machine ホームページの上部にある「Internet Archive」という言葉の横にあるアイコンをクリックして、書籍、ビデオ、録音、およびソフトウェア プログラムを検索することもできます。これらは、アイテムに応じて、永久にダウンロードすることも、一定期間借りることもできます。もご利用いただけます。
ウェイバック マシンの未来
グラハム氏は、Wayback Machine の最も驚くべき点は、Wayback Machine が存在すること、そして小規模なチームと予算を考慮すると、パブリック Web のどの程度を保存できることであると述べています。 (彼らはそうします。)
「より多くのサポートがあれば、より多くのパブリック Web をバックアップできるようになります」と彼は言います。 「インターネット アーカイブの資金は、サブスクリプション ベースのウェブ アーキシング サービス、主要な寄付者や財団からの「稼得収入」、および 100,000 人を超える個人寄付者からの寄付の組み合わせによって賄われています。サービスを提供しており、当社のウェブページには広告を掲載しません。」
彼は、ウェイバック マシンが将来さらに重要になると確信しています。
「人々が情報を伝達し、共有する方法の性質が進化するにつれて、私たちはこの公開情報をできるだけ多く保存するために最善の仕事をし続けるためのテクノロジー、プロセス、パートナーシップを構築する必要があるでしょう」と彼は言います。 「全員が『ウェブをより便利で信頼できるものにする』というウェイバックマシンの使命をサポートし、特にジャーナリスト、活動家、学者、歴史家、研究者、一般大衆のサポートを支援します。」
編集者注: この記事の第 13 段落は、Wayback Machine スタッフの要請により更新されました。
Mark Graham 氏は、Wikipedia の記事で参照されている 1,100 万以上の Web ページが長年にわたり破損したと述べています (言い換えれば、現在では 404 または「ページが見つかりません」というメッセージが返されます)。これらは Wayback Machine にアーカイブされていたため、そこの技術者はそれらの Wikipedia ページを編集できたので、参照は現在、それらの廃止された URL のアーカイブされたバージョンを指しています。