収集の範囲
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/11/28 14:22 UTC 版)
「プロジェクト・グーテンベルク」の記事における「収集の範囲」の解説
2006年8月時点の公表では、プロジェクト・グーテンベルクが収集したテキストは19000点を越え、週に平均50以上の新しい電子書籍が追加されている。 これらは、ほとんど西洋文化圏の文学作品である。小説や詩、戯曲といった文学作品だけでなく、マニュアルや参考書、雑誌の類も収集の対象である。少量ではあるが、音声ファイルや楽譜といった非文書ファイルも所蔵されている。 大部分は英語のテキストだが、他の言語のテキストも非常に多い。2006年8月現在、英語以外で特に多いのは(順に)フランス語、ドイツ語、フィンランド語、オランダ語、スペイン語のテキストである。 テキストは、可能なかぎりプレーンテキストの状態で提供される。文字コードは主にUS-ASCIIであるが、拡張してISO-8859-1を使うことも多々ある。他のファイル形式での公開もよく、ボランティアによる投稿にはHTML形式が最もよく利用される。PDFのような編集が難しい形式は、プロジェクト・グーテンベルクの目標に合致しないと一般に認められているが、何点か収集に加えられているものもある。XMLを使用すべきかとの議論が何年も続けられているが、進展は遅い。
※この「収集の範囲」の解説は、「プロジェクト・グーテンベルク」の解説の一部です。
「収集の範囲」を含む「プロジェクト・グーテンベルク」の記事については、「プロジェクト・グーテンベルク」の概要を参照ください。
- 収集の範囲のページへのリンク