外字とは? わかりやすく解説

がい‐じ〔グワイ‐〕【外字】


外字

読み方:がいじ
別名:ユーザー定義文字
【英】external fonts

外字とは、コンピュータ文字システムにあらかじめ登録されていない文字のことである。文字コード割り当てられておらず、ユーザーまたはメーカー独自に作成して追加登録する。

外字には、漢字異字体特殊記号などが含まれるJISコード含まれず、コンピュータ文字形状など情報標準備えてない場合には、その文字が外字として扱われる。外字を扱う際には、外字エディタなどを用いて字形作成しコンピュータ個別登録する必要がある。どんな字形であっても登録・使用できるが、その外字を登録したシステムでした正しく扱うことができないという欠点がある。

外字エディタ」はWindows標準搭載されているソフトウェアで、自由に文字作成登録することができるようになっている外字エディタは[プログラム]の一覧から[アクセサリ]を開くことによって起動することができる。

産業・技術のほかの用語一覧
情報処理:  フォント  符号拡張  フィルタ  外字  キャメルケース  コード  五心

外字

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/05/16 08:10 UTC 版)

外字(がいじ)とは、特定の文字集合(文字コードなど)に含まれない文字のことをいう。日本で一般には、JIS規格文字コード(通常はJIS X 0208、稀にJIS X 0213JIS X 0221)に含まれない文字のことをさし、「表外字」、「拡張漢字(ベンダ選定拡張漢字)」とも呼ばれる。常用漢字に含まれない文字のことを外字ということもある。

外字の弊害

文字コードによるテキストデータの流通という意味では、外字の使用は好ましくない。一つの文字コードが異なるシステム間で同じ文字イメージであることが保証されないためである。

文字情報基盤事業などの成果として外字を使用しなくてよいように異体字セレクタを利用したUnicode IVD/IVSで定義された文字への包括が推進されている。文字情報基盤事業では、日本政府の戸籍/住民票業務で必要となる文字を整理して包括させた結果として戸籍統一文字と住基統一文字をとりまとめ、それらをまとめて文字情報基盤として文字セットを定義した。この文字情報基盤の文字を中心としてUnicode IVD/IVSで扱えるように文字コードが定義されている。日本政府では、行政のIT化のために戸籍/住民票業務を中心とした公文書で使える異体字を文字情報基盤で定義したものに包括して限定していく方針である。 MicrosoftもWindowsでの外字のサポートを縮小し、Unicode IVD/IVSによる異体字の利用を推進している。

文字コードにおける外字

日本語1バイト文字集合における外字

PC98シリーズなどでは、JIS X 0201の文字以外に記号などが個別に定義されていた。これらは98文字などと呼ばれ、外字の一種である。

JIS X 0208における外字

1979年にJIS X 0208に含まれない文字を使用するために、未定義領域と呼ばれるエリアに独自の文字を作成する手段がとられていた。

メーカなどがシステムにあらかじめ組み込んでいた外字をシステム外字ベンダ定義文字と呼び、個々のユーザが作成した外字はユーザ外字ユーザ定義文字と呼ぶ。

ワードプロセッサなどでも、外字の作成が可能な製品も多数存在した。Microsoft Windowsの場合は、標準で附属する外字エディタというアプリケーションでユーザ外字が作成可能である。

一般にはShift_JISにおける0xF000〜0xFFFCの領域がユーザ外字領域として広く用いられてきた(以下「JIS X 0221 (Unicode)における外字」に詳細)。

このユーザ外字領域にあらかじめ各種の文字を入れておいたフォントなどもあり、外字領域の文字しか含まれないフォントのことを外字フォントと呼ぶ。

JIS X 0208の1997年における改訂でこの未定義領域に外字を入れることが原則禁止された。

JIS X 0213における外字

2000年に規格化されたJIS X 0213では、Shift_JIS-2004(Shift_JISX0213)というShift_JISの符号化表現を拡張した規格が定義された。この文字コードでは、実装水準3(第3水準の文字までしか含まない)で実装する場合には、0xF000〜0xFFFCの領域を外字領域として使用してよいこととした。

JIS X 0221 (Unicode)における外字

Unicodeでは、外字エリアとして「私用領域」という名称でU+E000〜U+F8FF、U+F0000〜U+FFFFD、U+100000〜U+10FFFDに外字領域を設けてある。このうち、あとの2つは面単位で用意されているので、私用面と呼ばれる。

Windowsのユーザ外字領域であるShift_JISの0xF040〜0xF9FCはUnicodeのU+E000〜U+E757に順番に対応付けられている。(Shift_JISのコードポイントでない0xF07Fなどは飛ばす。)

Windows付属の外字エディタではU+E758〜U+F8FFにも外字を作成可能であるが、そこに作成したものはWindowsにおけるUnicode環境でのみ使用可能となる。

Windowsのシンボルフォントである「Wingdings」などのグリフにおいて、UnicodeではU+F020〜U+F0FFの一部に対応付けられている。

日本におけるFM文字多重放送や字幕放送などで使用する文字ARIB外字や携帯電話の絵文字などこれまでは外字でしか使用できなかった文字についても、企業ロゴ等を除いて順次Unicodeに含めることが進められている。

ユーザ外字領域(Shift_JIS) 私用領域(Unicode) 文字数
0xF040 - 0xF07E U+E000 - U+E03E 63文字
0xF080 - 0xF0FC U+E03F - U+E0BB 125文字
0xF140 - 0xF17E U+E0BC - U+E0FA 63文字
0xF180 - 0xF1FC U+E0FB - U+E177 125文字
0xF240 - 0xF27E U+E178 - U+E1B6 63文字
0xF280 - 0xF2FC U+E1B7 - U+E233 125文字
0xF340 - 0xF37E U+E234 - U+E272 63文字
0xF380 - 0xF3FC U+E273 - U+E2EF 125文字
0xF440 - 0xF47E U+E2F0 - U+E32E 63文字
0xF480 - 0xF4FC U+E32F - U+E3AB 125文字
0xF540 - 0xF57E U+E3AC - U+E3EA 63文字
0xF580 - 0xF5FC U+E3EB - U+E467 125文字
0xF640 - 0xF67E U+E468 - U+E4A6 63文字
0xF680 - 0xF6FC U+E4A7 - U+E523 125文字
0xF740 - 0xF77E U+E524 - U+E562 63文字
0xF780 - 0xF7FC U+E563 - U+E5DF 125文字
0xF840 - 0xF87E U+E5E0 - U+E61E 63文字
0xF880 - 0xF8FC U+E61F - U+E69B 125文字
0xF940 - 0xF97E U+E69C - U+E6DA 63文字
0xF980 - 0xF9FC U+E6DB - U+E757 125文字
対応なし U+E758 - U+F8FF 4,520文字
対応なし U+000F0000 - U+000FFFFD 65,534文字
対応なし U+00100000 - U+0010FFFD 65,534文字

DRCS外字

日本のデータ放送、文字放送、字幕放送などではDRCS外字という外字が使用可能である。ARIBの文字コードではJIS X 0208の文字やARIB外字などを使用できるが、これ以外に任意の外字が自由に使用可能である。ARIBの規格で任意の外字を送信する仕組みが仕様として規定されており、この仕様をすべての受信機がサポートしていることが保障されているため、自由な外字を使用することが可能となっている。

外字登録

ワープロ専用機ワープロソフトWindows などのオペレーティングシステムでは、ユーザが自分で外字(ユーザー定義外字)を登録できるようになっている。

常用漢字表外字

常用漢字表に含まれない文字のことを表外字と呼ぶ。平成12年に表外漢字字体表国語審議会が発表し、常用漢字に含まれない漢字の字形のよりどころを規定した。

人名・地名用外字

人名を扱うシステムにおいて人名用外字が使われていた。日本の人名に使われる文字 (漢字や変体仮名など) は住基ネット統一文字戸籍統一文字の中に殆ど含まれており、これらの文字はユニコードコンソーシアムやISOでの標準化が行われ、2017年6月のUnicode 10.0及び2017年12月のISO/IEC 10646:2017でほぼ全てが収録されるに至った。これらの文字に対応するフォントには、IPAmj明朝花園明朝が存在する。

中国語を表記できないシステムにおいて、中国や韓国の人名・地名を表記するために多くの外字が使われてきたが、現在はUnicode及び中国語フォントが普及したため外字の使用も減っている。また、日本語と中国語の両方に対応する多言語フォントも登場している (源ノ角ゴシック源ノ明朝Notoフォント、ヒラギノ角ゴ、UD新ゴ、金剛黒体、Droidフォントなど)。

その他、民生向け人名外字フォントには、DynaFont 人名記号外字 (DynaComware)、筆まめ人名外字 (SOURCENEXT)、人名外字1500/人名外字PRO (イースト)、Super名字太郎 (ビープラス)などが存在する。

入管正字・入管外字

日本では法務省が漢字圏の氏名の表記のために入管正字を定めているが、入管正字にはかつてUnicodeに含まれない文字も含まれていた。しかし、Unicode 10.0でCJK統合漢字拡張Fが追加され、入管正字の全ての文字が収録されるに至った。

入管正字に置き換える元の漢字(簡体字等)の一部はUnicodeに収録されていないため入管外字として管理している。入管外字は、Unicodeの私用領域(U+E000 ~ U+F8FF)を使用している。具体的な文字コードと漢字の関係は法務省告示第五百八十二号 在留カード等に係る漢字氏名の表記等に関する告示 別表第二参照。ただし、別表第二には、この告示後にUnicodeに収録された漢字も含まれている。そのため、入管正字の一部も含まれている(文字コード等 = e5d4、e5d5、e5d6、e5d7)。

登記用外字

登記用の文字集合として法務省の登記統一文字が存在していた。

  • 登記統一文字は、戸籍統一文字と登記固有文字で構成される。登記統一文字番号の8桁で管理する。[1]
  • 戸籍統一文字の登記統一文字番号は、戸籍統一文字コード(6桁)の先頭に00を追加して8桁に拡張する。
  • 登記固有文字の登記統一文字番号は、先頭01で始まる8桁の番号とする。

著名な外字集合

JIS X 0208の外字として使用された文字集合の一部は、標準化されたりデファクトスタンダードになった外字集合がある。

ARIB外字
社団法人電波産業会によりデータ放送などでの使用を規定した外字集合。多くの文字はUnicodeに収録されたが、モザイク集合などの一部の文字は収録されていない。
レコード用文字符号
レコード協会がRIS506-1996としてまとめた外字集合であり、Music Shift-JISとしてCDDVD-Audioなどに使われている。
iモード絵文字
DoCoMoのiモード用に作られた外字集合。多くの絵文字はUnicodeに収録されたが、一部の文字は収録されていない。
EZweb絵文字
KDDIのEZweb用に作られた外字集合。同上。
SoftBank絵文字
SoftBankの携帯電話(当初はJ-Phone)用に作られた外字集合。同上。
歯科用外字
歯科用の記号をまとめた外字集合
ビブロス外字
もともとBiblosが定めていた外字集合で、一般化した
K-JIS外字
共同通信がU-PRESSよりも前に定めた外字集合。U-PRESSに取り込まれなかった文字が残っており、イワタ製のU-PRESS向けフォントは残存K-JIS文字を外字として搭載している[3]
共同通信外字 (U-PRESS外字)
共同通信が定めた外字集合。Adobe-Japan1-6に取り込まれたが、Unicodeに含まれていない文字も存在する。
案内用図記号
JIS Z8210で制定されたピクトグラムだが、文字コードが割り当てられていないため外字として実装されることがある。対応フォントには、一般案内用図記号フォント (外字神社)[4]、人名記号外字3 (ダイナコムウェア)[5]などがある。

Adobe-Japan1-6対応フォントで表示できる外字集合

Unicode (結合文字を含む) 及びOpenType Feature Tagの組み合わせで表示できるが、正しく表示するためにAdobe-Japan1-6対応フォントが必要となる文字集合。

通産省外字/Apple外字
通産省主導の文字フォント開発普及センターがJIS X 0208外で必要な記号定めた外字集合であり[6]、Macintoshなどで使用されている。

過去の外字集合

既にUnicodeに含まれるものなど。

IBM外字
汎用機用にIBMが制定した外字集合であり、JIS X 0208に含まれない記号および漢字を定義した外字集合(IBM漢字・IBM拡張漢字)。Microsoft外字に含まれている。
NEC外字/98外字[7]
汎用機用にNECが制定した外字集合であり、JIS X 0208に含まれない記号および漢字を定義した外字集合(NEC特殊文字、NEC選定IBM特殊文字)。Microsoft外字に含まれている。
Microsoft外字
MicrosoftのOS上でIBM外字とNEC外字を使用可能にした外字集合。JIS X 0221で「通用日本文字集合」として規格化された。
JIS2004外字
JIS X 0203:2004で規定された文字をJIS X 0208の外字として実装した外字集合

その他の外字

裁判所外字
裁判所で使われている外字[8]
エヌフォー外字集合[9]
漫画用外字
写研の写植記号に由来し、主に漫画で使われる外字。イワタアンチック体、GL-アンチックなどに搭載されている。

医学用

  • Win 外字辞書セット 医学バージョン[10]
  • エヌフォー外字DXオプションパック医学用[11]
  • エヌフォー外字DXオプションパック歯科用[11]

関連項目

出典

  1. ^ LEGALブログ(リーガル社員のここだけの話): 「登記統一文字」とはなにか
  2. ^ 登記統一文字01009670を含む神社 | yasuokaの日記 | スラド
  3. ^ 拡張文字セット イワタ U-PRESS Ver.2.1 イワタ
  4. ^ 一般案内用図記号フォント 窓の杜 2005年12月19日
  5. ^ ダイナコムウェア、183種のピクトグラムを追加した外字対応フォントパッケージ「人名記号外字3」 MdN Corporation 2018年10月4日
  6. ^ Foreign System Fonts kotobank
  7. ^ 98外字 kotobank
  8. ^ 第4回:弁護士の使う文字をペン越しに……の巻 大日本タイポ組合
  9. ^ 『CJKV日中韓越情報処理』 P.584 ケン ランディ著 小松章/逆井克己訳 2002年12月
  10. ^ Win 外字辞書セット 医学バージョン
  11. ^ a b エヌフォー外字DX オプションパック

外部リンク


外字

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/02/21 08:12 UTC 版)

EDICOLOR」の記事における「外字」の解説

日本語の書籍制作当たっては、人名などJIS第2水準外の異体字や、また丸付き数字記号類など、通常の文字コードにない文字必要になることが多い。

※この「外字」の解説は、「EDICOLOR」の解説の一部です。
「外字」を含む「EDICOLOR」の記事については、「EDICOLOR」の概要を参照ください。

ウィキペディア小見出し辞書の「外字」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ

外字

出典:『Wiktionary』 (2020/07/23 23:28 UTC 版)

名詞

(がいじ)

  1. 外国語文字外国語書かれ文章
  2. 常用漢字表にない漢字表外字
  3. コンピュータ用語)ある文字集合含まれない文字。特に、そのような標準では使えない文字について、ユーザー字形独自登録したもの

発音(?)


「外字」の例文・使い方・用例・文例

Weblio日本語例文用例辞書はプログラムで機械的に例文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「外字」の関連用語

外字のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



外字のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2025 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリの【外字】の記事を利用しております。
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの外字 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのEDICOLOR (改訂履歴)、文字コード (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。
Text is available under Creative Commons Attribution-ShareAlike (CC-BY-SA) and/or GNU Free Documentation License (GFDL).
Weblioに掲載されている「Wiktionary日本語版(日本語カテゴリ)」の記事は、Wiktionaryの外字 (改訂履歴)の記事を複製、再配布したものにあたり、Creative Commons Attribution-ShareAlike (CC-BY-SA)もしくはGNU Free Documentation Licenseというライセンスの下で提供されています。
Tanaka Corpusのコンテンツは、特に明示されている場合を除いて、次のライセンスに従います:
 Creative Commons Attribution (CC-BY) 2.0 France.
この対訳データはCreative Commons Attribution 3.0 Unportedでライセンスされています。
浜島書店 Catch a Wave
Copyright © 1995-2025 Hamajima Shoten, Publishers. All rights reserved.
株式会社ベネッセコーポレーション株式会社ベネッセコーポレーション
Copyright © Benesse Holdings, Inc. All rights reserved.
研究社研究社
Copyright (c) 1995-2025 Kenkyusha Co., Ltd. All rights reserved.
日本語WordNet日本語WordNet
日本語ワードネット1.1版 (C) 情報通信研究機構, 2009-2010 License All rights reserved.
WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved. License
日外アソシエーツ株式会社日外アソシエーツ株式会社
Copyright (C) 1994- Nichigai Associates, Inc., All rights reserved.
「斎藤和英大辞典」斎藤秀三郎著、日外アソシエーツ辞書編集部編
EDRDGEDRDG
This page uses the JMdict dictionary files. These files are the property of the Electronic Dictionary Research and Development Group, and are used in conformance with the Group's licence.

©2025 GRAS Group, Inc.RSS