Arcファイルを処理するツール
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/04/08 16:34 UTC 版)
「Heritrix」の記事における「Arcファイルを処理するツール」の解説
Heritrixにはarcreader と呼ばれるArcファイルを処理するコマンドラインツールが付属している。例えば、Arcファイルに保存されているすべてのURLとメタデータの一覧をCDX形式で得るには、次のように実行すればよい: arcreader IA-2006062.arc また、上記の例のhello.htmlを取り出すには次のように実行する(レコードが頭から140バイトの位置にあると仮定): arcreader -o 140 -f dump IA-2006062.arc Heritrixに付属するもの以外にも、ツールが開発されている: Arc processing tools WERA (Web ARchive Access)
※この「Arcファイルを処理するツール」の解説は、「Heritrix」の解説の一部です。
「Arcファイルを処理するツール」を含む「Heritrix」の記事については、「Heritrix」の概要を参照ください。
- Arcファイルを処理するツールのページへのリンク