多言語の扱いとは? わかりやすく解説

多言語の扱い

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/03 23:37 UTC 版)

Python」の記事における「多言語の扱い」の解説

当初Pythonでは1バイト単位での文字列型のみ扱いひらがな・(全角) カタカナおよび漢字のようなマルチバイト文字サポートしていなかったが、Python 2.0からはUnicode文字型新たに導入された。 Python 3.0では、文字列型バイト列型に、Unicode文字列型文字列型変更された。これにより、文字列Python 3.0で扱う際には後述変換処理を必ず行う必要があるファイル入出力などエンコード明示しなければ標準エンコード用いて暗黙行われる場合も多い。これにより多言語の扱いを一貫したものにしている。 Pythonは文字エンコードUnicode内部表現明確に区別している。Unicode文字メモリ中に保持される抽象的なオブジェクトであり、画面表示ファイルへの入出力の際には変換ルーチンコーデックを介して特定のエンコーディングバイト表現との間で相互に変換するまた、ソースコード中の文字コード認識する機能があり、これによって異な文字コード書かれプログラム動き異なるという危険を解消している。 Pythonでは変換ルーチンモジュールとして追加することで、さまざまなエンコーディング対応できるようになっている日本語の文字コード (EUC-JP, Shift_JIS, MS932, ISO-2022-JP) に対応したコーデック作成されている。Python 2.4からは、日中韓国語用コーデック標準ディストリビューション含まれるようになったため、現在では日本語の処理に問題はほとんどなくなった。ただしGUIライブラリであるTkinter統合開発環境IDLEは、プラットフォームにもよるが、まだ日本語にきちんと対応していないものもある。 ソースコード文字コードは、ASCII互換性があり、Python対応しているものを使用するソースコードのデフォルトエンコーディングは、Python 3.xではUTF-8ソースコード以外のPython 3のデフォルトエンコーディングは複雑になっている)、Python 2.xではASCIIであるが、デフォルトエンコーディング以外の文字コードを使う場合は、ソースファイルの1行目か2行目に一定の書式コメントとして記述することになっており、しばしば以下のようにEmacsVimなどのテキストエディタにも認識可能な書式記述される次の例は Emacs認識できる書式)。 #! /usr/bin/python2# -*- coding: utf-8 -*-s = '日本語文字列'

※この「多言語の扱い」の解説は、「Python」の解説の一部です。
「多言語の扱い」を含む「Python」の記事については、「Python」の概要を参照ください。

ウィキペディア小見出し辞書の「多言語の扱い」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「多言語の扱い」の関連用語

1
4% |||||

多言語の扱いのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



多言語の扱いのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのPython (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS