文字化けとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > デジタル大辞泉 > 文字化けの意味・解説 

もじ‐ばけ【文字化け】


文字化け

読み方もじばけ
【英】character error

文字化けとは、テキストファイル送受信した際に、何らかの原因文字正しく認識されずに誤った文字表示されてしまう現象のことである。特に全角かな・漢字において発生することが多く原因によっては英数字といった半角文字化けることもある。

文字化けの主な原因としては、(1)送信側受信側とでそれぞれ異な文字コード用いているために誤変換される、(2)無手順方式などでテキスト送受信した際のノイズ混入、あるいはデータ欠落によって発生する(3)機種依存文字使っている、あるいは正しく表示するために必要なフォントがない、といったことが挙げられる


(1)送信側受信側とでそれぞれ異な文字コード用いているために誤変換される場合は、特にHTML書かれWebページ読み込む際に発生するもので、Webブラウザ文字コード勘違いする、あるいはWebページ誤った文字コード宣言埋め込まれている、などの事態原因となる。データそのものは完全な形で受信できているため、手動正しい文字コード指定すれば正しく表示させることができる。


(2)無手順方式などでテキスト送受信した際のノイズ混入、あるいはデータ欠落によって発生する場合は、特に電子メール受信する際に発生することが多い。これはデータそのもの変容する失われるかしてしまっているため、文字化けした文書直して正しく読める形にすることは難しい。データ欠落は特に文字落ち呼ばれて区別される場合もある。送信者に再送信してもらうのがよい。


(3)機種依存文字使っている場合は、受信側いかなる方法でも対応できないので、送信前に対応できる形式置き換えてもらう必要がある正しく表示するために必要なフォントない場合は、文書ファイル印刷する場合などに発生するもので、これはプリンターフォントインストールするなどの方法対処することができる。

一般的には文字化けの現象広く表示変体として捉えられるが、見方によっては、データ転送正しく行なわれた後の処理において正し表示失敗する現象厳密な意味での文字化けであるとする見方もある。このような立場では、転送経路情報欠落するといった原因よるものは文字落ちであるとして、文字化けとは厳密に区別される

情報処理のほかの用語一覧
文字コード:  区点コード  マルチバイト文字  文字コード  文字化け  日本語EUC  ニューメリック  RLO

文字化け

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/04/24 03:44 UTC 版)

文字化けの模式図。UTF-8でエンコードされた文字列「文字化け」をShift JISとしてデコードした場合、「譁?ュ怜喧縺?」と文字化けする。

文字化け(もじばけ)とは、コンピュータで文字が正しく表示・印刷されず、 本来とは異なる不規則で意味不明な記号や文字の連なりとして現れること[1]。あるシステムで符号化された文字列が、別のシステムで復号されたときに発生する[2]

用語

「文字化け」は文字が変形することを意味する日本語であるが[2]、英語においても借用されている[1]久保芳之はこれについて、「アメリカで行われた最初の日本語アプリケーション」である PageMaker の開発時、「英語で文字化けを説明するよりも、 MOJIBAKEとは何かを理解させることの方が簡単であると考え、英語としてMOJIBAKEを定着させました」と述懐している[3]

「文字化け」に相当する用語は他言語にも存在する。たとえば、中国語では同様の現象を乱碼と呼称する[4]。また、ロシア語では同様の現象をБНОПНЯと呼称した[5]

原因

文字コード

UTF-8でエンコードされたWikipedia日本語版の「文字化け」の記事をWindows-1252として表示したときの文字化け

文字化けは、特定の文字符号化方式で符号化された文字列を、異なる方式で解釈・表示しようとしたときに発生する[1][2]。たとえば、ASCIIには curly apostrophe( ’ )が収録されていないため、Unicodeに準拠する文字符号化方式で入力した「that’s」といった文字列を、ASCIIで解釈すると「thata.™ s」と表示される[2]

文字化けの問題は、特に日本語をはじめとする東アジアの言語環境において顕著に発生した[6]。日本語環境において文字化けは、電子メールの送受信で起きるケースが多かった[7]。ASCII文字が7ビットであるのに対して、コンピューターでやり取りするデータの最小単位が8ビットであったことを背景に、インターネット黎明期のメーラーは最上位ビットを無視することがあり、8ビットすべてを利用するShift JISEUC-JPで入力された文字列を送受信する際に支障をきたした。また、その後もヘッダーに記載された文字コードの情報に問題があった場合には、文字化けの問題がおこった[8]。また、HTMLを記述する際、そのメタ情報に問題があった場合[9]、ファイルを圧縮・解凍する際の文字コードが異なった場合などにも、文字化けが発生した[10]

フォント

日本語をサポートしていない環境での文字化け

文字コードの解釈に問題がなかったとしても、文字列の表示にあたって利用するフォントに問題があれば、文字化けが発生する。これはたとえば、日本語フォントがインストールされていない環境で日本語のウェブサイトを閲覧した際などに生じる[1]。また、丸囲い数字といった一部の文字(機種依存文字)は、標準化に先んじて各企業が独自に文字コードを割りふったため、互換性のうえで問題を生じさせた[11]携帯電話の絵文字についても同様であり、2006年には各キャリアが自社の絵文字を他社の絵文字に変換するサービスを公開していた[12]

ほかに、ビルマ語のコンピュータ環境においては、Unicodeに準拠しないフォントであるZawgyiが広く用いられていたため、Unicodeに準拠するフォントで入力した文字が、Zawgyiを用いた環境では文字化けする現象がおこった[13]。ミャンマー政府はZawgyiからUnicodeへの移行を実行すべく、2019年4月には政府機関で利用されるフォーマットをすべてUnicode準拠のものに変更した。政府は10月1日を「Uデー」に指定し、9月に国内メディアやプロバイダなどに、この日までにUnicodeに対応するよう指示をおこなった[14]

大衆文化への影響

廣田龍平は2020年の論考において、日本語環境において「現在では、対策が周知されていることに加え、多くの環境でUTF-8が標準となっている」ことを背景として、文字化けは珍しいものとなっている一方、ホラー作品においてはなお文字化けが広く用いられていると述べている。廣田は2ちゃんねる(5ちゃんねる)の「怖い話」を渉猟し、2000年代には「パソコンや携帯端末の表示が(心霊スポットを訪れるなど)思わぬタイミングで文字化けしていた」といった記述がほとんどであったのに対して、2009年頃より異常な世界に入ってしまった語り手が同地で判読不明な文字を見る、といったストーリーがあらわれるようになったと論じる。廣田は文字コード・文字化けの仕組みに触れながら「非人間的な視点から見れば、文字化けも世界の正常な働きの一環なのである」と論じ、同じものを異なる方式で読み取った結果、まったく判断不能なものが立ち現れる文字化けという現象は、現実世界と異世界の差異を端的に示す「多自然主義的グリッチ」として理解できると総括している[15]

脚注

  1. ^ a b c d 文字化けとは - IT用語辞典”. IT用語辞典 e-Words. 2025年4月17日閲覧。
  2. ^ a b c d King, Ritchie S. (2012-07). “Will unicode soon be the universal code? [The Data”]. IEEE Spectrum 49 (7): 60–60. doi:10.1109/MSPEC.2012.6221090. ISSN 1939-9340. https://ieeexplore.ieee.org/document/6221090. 
  3. ^ "漢字トーク KanjiTalk". 2014年3月13日時点のオリジナルよりアーカイブ。2009年8月30日閲覧久保芳之からの説明メールが掲載されている。
  4. ^ 文字化け”. www3.cuc.ac.jp. 千葉商科大学デジタル中国語教室. 2025年4月17日閲覧。
  5. ^ Что такое БНОПНЯ”. www.internetslovar.ru. 2025年4月17日閲覧。
  6. ^ Ueda, Paul; Law, Ka Fai; Chan, Marjorie K. M. (2024-08) (英語). Creating a Corpus: Issues in the Digital Text Processing of Cantonese, Hakkanese, and Taigi. ISSN 2378-9387. https://kb.osu.edu/items/d60512ea-9e01-4d87-965c-7591e5b68277. 
  7. ^ 【NTT西日本】文字化け|ICT用語集|法人・企業向けICTサービス・ソリューション”. business.ntt-west.co.jp. 2025年4月17日閲覧。
  8. ^ 柴田, 淳 (2000-10). “いんさいどまっきんとっしゅ メール・クライアントの謎:メール・クライアントの謎:【第4回】メールデータの保存形式”. 日経MAC 8 (10): 126–134. ISSN 0918-8894. https://cir.nii.ac.jp/crid/1520290883354680832. 
  9. ^ 平岡信之. “日本語文字コードについて”. www2.nagano.ac.jp. 長野大学. 2025年4月17日閲覧。
  10. ^ 圧縮・展開ソフトの文字化け対策 注目4品を比較する”. 日本経済新聞 (2020年6月24日). 2025年4月17日閲覧。
  11. ^ 日本語文字コードと変換”. はいぱーワークブック. 東京大学教養学部. 2025年4月17日閲覧。
  12. ^ 安岡, 孝一 (2007). “ケータイの絵文字と文字コード”. 情報管理 50 (2): 67–73. doi:10.1241/johokanri.50.67. https://www.jstage.jst.go.jp/article/johokanri/50/2/50_2_67/_article/-char/ja/. 
  13. ^ はた (2020年10月22日). “ミャンマー語フォント『Zawgyi-one』の問題に直面した話 - GMO Research & AI Tech Blog”. gmor-sys.com. 2025年4月17日閲覧。
  14. ^ Su, Eaint Thet (2019年9月28日). “Zawgyi to Unicode: the big switch” (英語). Frontier Myanmar. 2024年10月21日閲覧。
  15. ^ 廣田, 龍平 (2020-12). “非人間的な文字列 : 譁・ュ怜喧縺代・螟夊・然主義的概念化”. ユリイカ = Eureka 52 (15): 319–326. ISSN 1342-5641. https://cir.nii.ac.jp/crid/1523669555997433472. 

関連項目

  • 絶頂集 - 椎名林檎のライブ・シングル集。一部の曲名を演出的意図として文字化けさせている。
  • 清水義範 - 文字化けを題材とした小説「文字化けの悦楽」を発表している(講談社文庫『私は作中の人物である』収録)。
  • 幽霊語
  • -「実在しない、あるいはコードが割り当てられていない」の意味を持つ記号
  • Bush hid the facts(ブッシュは事実を隠蔽した)

文字化け

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/08/28 14:43 UTC 版)

トラックバック」の記事における「文字化け」の解説

トラックバック文字コード送信先ブログシステムのそれと一致しないために起き現象。例として、トラックバック送信側ブログEUC-JPなのに対し受信先のブログUTF-8用いているため文字判読不能になる、といったケース該当する。 この問題は、多バイトでかつ複数文字コード体系を持つ地域特有の問題ともいえる。

※この「文字化け」の解説は、「トラックバック」の解説の一部です。
「文字化け」を含む「トラックバック」の記事については、「トラックバック」の概要を参照ください。

ウィキペディア小見出し辞書の「文字化け」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ

「文字化け」の例文・使い方・用例・文例

Weblio日本語例文用例辞書はプログラムで機械的に例文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「文字化け」の関連用語

文字化けのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



文字化けのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2025 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリの【文字化け】の記事を利用しております。
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの文字化け (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのトラックバック (改訂履歴)、エンコード (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。
Tanaka Corpusのコンテンツは、特に明示されている場合を除いて、次のライセンスに従います:
 Creative Commons Attribution (CC-BY) 2.0 France.
この対訳データはCreative Commons Attribution 3.0 Unportedでライセンスされています。
浜島書店 Catch a Wave
Copyright © 1995-2025 Hamajima Shoten, Publishers. All rights reserved.
株式会社ベネッセコーポレーション株式会社ベネッセコーポレーション
Copyright © Benesse Holdings, Inc. All rights reserved.
研究社研究社
Copyright (c) 1995-2025 Kenkyusha Co., Ltd. All rights reserved.
日本語WordNet日本語WordNet
日本語ワードネット1.1版 (C) 情報通信研究機構, 2009-2010 License All rights reserved.
WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved. License
日外アソシエーツ株式会社日外アソシエーツ株式会社
Copyright (C) 1994- Nichigai Associates, Inc., All rights reserved.
「斎藤和英大辞典」斎藤秀三郎著、日外アソシエーツ辞書編集部編
EDRDGEDRDG
This page uses the JMdict dictionary files. These files are the property of the Electronic Dictionary Research and Development Group, and are used in conformance with the Group's licence.

©2025 GRAS Group, Inc.RSS