アーカイブWebサイトにこの便利なツールでWebページをピックアップするように強制します


のようなウェブサイトアーカイブサービスインターネットアーカイブ:ウェイバックマシン古いバージョンのサイトを見る必要があるときに非常に便利です懐かしさのためまたは、その後上書きまたは削除された特定の情報を探しているためです(たとえば、元雇用主のために書いた物語のように)。

ただし、これらのサービスは完璧ではありません。アーカイブサイトがサイトのスナップショットを作成しない場合があります。当然のことながら、そのスナップショットが最も必要なときです。または、誰かがサイトのrobots.txtファイルを構成している可能性がありますアーカイブサービスをブロックします自動クロールを実行することから。面白くない。

に感謝しますマザーボードからの新しいツール、3つの異なるアーカイブサービスの現在のバージョンのサイトを一度にアーカイブしようとすることができます:Wayback Machine、Archive.is、およびPerma.cc(無料アカウントを設定した場合)。

マザーボードのアーカイブユーティリティをインストールするには、少しのレッグワークが必要ですが、それほど難しくありません。最初にPythonをインストールする必要がありますリクエストJSON、 そしてアーキベルマザーボードのMASS_ARCHIVEツールが機能するために必要なモジュール。 (残念ながら、これは単純に実行可能なものや実行できるユーティリティだけではありません。)リクエストをインストールする最良の方法とJSONはインストールすることですピップ最初に、それを使用してモジュールをダウンロードします。 Archiveisがありますここ、PIPを使用してインストールすることもできます。

また、mass_archive.pyスクリプトを取得する必要があります前述のGithubプロジェクト。準備ができたら、MacOSまたはLinuxの端末をプルアップして入力してください(明らかに、Example.comをアーカイブにしようとしているWebサイトに置き換えます):

python mass_archive.py example.com

Python viaを使用している場合Windowsの上昇したコマンドプロンプト、 あなたはできる最初の「Python」を省略しますそのコードから。