SlideShare a Scribd company logo
1 of 8
Download to read offline
漢和辞典 Unicode 
角川文化振興財団 
田中弘一(事務局長)〒坂倉基 
1
2 
「角川新字源」について 
•「角川新字源」とは? 初版発行1968年1月 以来50版、450万部以上を誇るロングセラー。 現行版は親字約10000字、用例60000余語。 「増補字源」「漢和中辞典」以来の、かつ、 現在は「大字源」とともに角川の主要漢和辞典。 しかし長いあいだ更新が停滞(1994年以来)。 
•現在、鋭意改訂作業中! 
字義(語釈)の全面的な見直し 
親字および熟語の再選定 
文字コードの取り込み,etc. 
& 
ボーンデジタル で再構築
3 
「角川新字源」オープン化計画 
•ボーンデジタルって? 要はデータで作ること! 
編纂システムの構築 
専用フォントの制作 
自動組版の採用 
タグ(マークアップ)テキスト化,etc. 
<p>■熟語</p><div class=“leftMargin“><p><font face=” 新字源外字,新字源外字 Regular”></font></p>…………… 
•オープンなデータとして提供できるのでは? デジタルメディアでのマルチユースだけではなく。 角川文化振興財団として、 オープンなアカデミックリソースとしての活用法を研究中。 (時期や範囲については、まだ未定……。)
4 
「角川新字源」フォント&コード 
•専用フォントの制作 基本は従来使用していた凸版明朝。 “世界観”に合わせて大幅修正。 電子版でも字形を正確に再現可能。 
•Unicodeによる符号化 当然、“字母”を用意しただけでは無意味。 使える活字にするためには、符号化が必要。 Unicodeから始めた符号化の作業。 
U+0001 
U+0002 
U+0003U+0001U+0002 
U+0003 
U+0001 
U+0002 
U+0003 
U+0001 
U+0002 
U+0003 
U+0001 
U+0002U+0003 
U+0001 
U+0002 
U+0003
5 
「角川新字源」フォント&コード2 
•異体字とデザイン差の取り扱い →字体弁別粒度*と包摂基準の問題 用語、基準の問題。辞書での「異体字」と文字コードでの「異体字」。 辞書での「デザイン差」と文字コードでの「包摂」。 字形がマッチしないものについては、コードを割り振らないのか? それとも一番近いものに割り振るのか? 利用者が求めているものは何か? 
•Unicodeの採用字形を読み解く なぜこの字形が採用されたのか? 同じ意図で、「新字源」が採用した字形はどれなのか? (理想を言えば……。)
6 
「角川新字源」フォント&コード3 
•こういう字はどうしようか? 
「新字源」親字表 
(採用字形) 
Unicode表 (The Unicode Standard, Version 7.0 ) 他にも……「亭」など。 見出字U+4EAD 異体字U+20158? 
……「像」など。 
見出字U+50CF 
異体字U+2F80B 
(IVDならU+50CF U+E0103 )
7 
解決のために 
結局のところ…… 
•どのコードをどこまで載せるのか、 基準をしっかり決める。 
•Unicodeをきちんと知る。
8 
未来のために 【漢和辞典の宿題】 
•IVDを取り入れるのか? 
•正字(≒康煕字典体)、国語施策、 そして例示字形〒デジタルフォント。 
•かつては漢文を読むためのもの、今は? 
•国語辞典が担えない機能は?

More Related Content

More from Japan Electronic Publishing Association

2017年の電子出版関連ニュース 振り返りと、2018年の動向予測──jepaセミナー資料 by 鷹野凌 2018.1.9
2017年の電子出版関連ニュース 振り返りと、2018年の動向予測──jepaセミナー資料 by 鷹野凌 2018.1.92017年の電子出版関連ニュース 振り返りと、2018年の動向予測──jepaセミナー資料 by 鷹野凌 2018.1.9
2017年の電子出版関連ニュース 振り返りと、2018年の動向予測──jepaセミナー資料 by 鷹野凌 2018.1.9Japan Electronic Publishing Association
 
情報アクセシビリティの現状とマイクロソフトの取り組み
情報アクセシビリティの現状とマイクロソフトの取り組み情報アクセシビリティの現状とマイクロソフトの取り組み
情報アクセシビリティの現状とマイクロソフトの取り組みJapan Electronic Publishing Association
 

More from Japan Electronic Publishing Association (20)

出版ビジネスとブロックチェーン
出版ビジネスとブロックチェーン出版ビジネスとブロックチェーン
出版ビジネスとブロックチェーン
 
Net Galleyのご紹介
Net Galleyのご紹介Net Galleyのご紹介
Net Galleyのご紹介
 
2017年の電子出版関連ニュース 振り返りと、2018年の動向予測──jepaセミナー資料 by 鷹野凌 2018.1.9
2017年の電子出版関連ニュース 振り返りと、2018年の動向予測──jepaセミナー資料 by 鷹野凌 2018.1.92017年の電子出版関連ニュース 振り返りと、2018年の動向予測──jepaセミナー資料 by 鷹野凌 2018.1.9
2017年の電子出版関連ニュース 振り返りと、2018年の動向予測──jepaセミナー資料 by 鷹野凌 2018.1.9
 
電子書籍・電子雑誌市場ハイライト2017
電子書籍・電子雑誌市場ハイライト2017電子書籍・電子雑誌市場ハイライト2017
電子書籍・電子雑誌市場ハイライト2017
 
米国電子書籍産業動向2017
米国電子書籍産業動向2017米国電子書籍産業動向2017
米国電子書籍産業動向2017
 
APL EPUB WG報告
APL EPUB WG報告APL EPUB WG報告
APL EPUB WG報告
 
APL JLreq WG報告
APL JLreq WG報告APL JLreq WG報告
APL JLreq WG報告
 
APL Accessibility WG報告
APL Accessibility WG報告APL Accessibility WG報告
APL Accessibility WG報告
 
APL LCPと従来のDRM
APL LCPと従来のDRMAPL LCPと従来のDRM
APL LCPと従来のDRM
 
Web時代の 出版ビジネスモデルを考える JEPA金原会長
Web時代の 出版ビジネスモデルを考える JEPA金原会長Web時代の 出版ビジネスモデルを考える JEPA金原会長
Web時代の 出版ビジネスモデルを考える JEPA金原会長
 
TIMEMAPとインプレスグループ
TIMEMAPとインプレスグループTIMEMAPとインプレスグループ
TIMEMAPとインプレスグループ
 
TIMEMAPができるまで 時間情報をもつデータの扱い⽅
TIMEMAPができるまで 時間情報をもつデータの扱い⽅TIMEMAPができるまで 時間情報をもつデータの扱い⽅
TIMEMAPができるまで 時間情報をもつデータの扱い⽅
 
朝日新聞メディアラボの取り組みと人工知能研究
朝日新聞メディアラボの取り組みと人工知能研究朝日新聞メディアラボの取り組みと人工知能研究
朝日新聞メディアラボの取り組みと人工知能研究
 
電子コミック・コミックアプリ動向
電子コミック・コミックアプリ動向電子コミック・コミックアプリ動向
電子コミック・コミックアプリ動向
 
Word talkerご紹介
Word talkerご紹介Word talkerご紹介
Word talkerご紹介
 
情報アクセシビリティの現状とマイクロソフトの取り組み
情報アクセシビリティの現状とマイクロソフトの取り組み情報アクセシビリティの現状とマイクロソフトの取り組み
情報アクセシビリティの現状とマイクロソフトの取り組み
 
電子書店概況 2017(jepaセミナー資料 by鷹野凌)
電子書店概況 2017(jepaセミナー資料 by鷹野凌)電子書店概況 2017(jepaセミナー資料 by鷹野凌)
電子書店概況 2017(jepaセミナー資料 by鷹野凌)
 
デジタル時代の明治20年問題 橋口氏
デジタル時代の明治20年問題 橋口氏デジタル時代の明治20年問題 橋口氏
デジタル時代の明治20年問題 橋口氏
 
米国電子出版動向2017
米国電子出版動向2017米国電子出版動向2017
米国電子出版動向2017
 
モリサワ LayoutSquare のご紹介 村山氏
モリサワ LayoutSquare のご紹介  村山氏モリサワ LayoutSquare のご紹介  村山氏
モリサワ LayoutSquare のご紹介 村山氏
 

漢和辞典とUnicode 角川文化振興財団

  • 1. 漢和辞典 Unicode 角川文化振興財団 田中弘一(事務局長)〒坂倉基 1
  • 2. 2 「角川新字源」について •「角川新字源」とは? 初版発行1968年1月 以来50版、450万部以上を誇るロングセラー。 現行版は親字約10000字、用例60000余語。 「増補字源」「漢和中辞典」以来の、かつ、 現在は「大字源」とともに角川の主要漢和辞典。 しかし長いあいだ更新が停滞(1994年以来)。 •現在、鋭意改訂作業中! 字義(語釈)の全面的な見直し 親字および熟語の再選定 文字コードの取り込み,etc. & ボーンデジタル で再構築
  • 3. 3 「角川新字源」オープン化計画 •ボーンデジタルって? 要はデータで作ること! 編纂システムの構築 専用フォントの制作 自動組版の採用 タグ(マークアップ)テキスト化,etc. <p>■熟語</p><div class=“leftMargin“><p><font face=” 新字源外字,新字源外字 Regular”></font></p>…………… •オープンなデータとして提供できるのでは? デジタルメディアでのマルチユースだけではなく。 角川文化振興財団として、 オープンなアカデミックリソースとしての活用法を研究中。 (時期や範囲については、まだ未定……。)
  • 4. 4 「角川新字源」フォント&コード •専用フォントの制作 基本は従来使用していた凸版明朝。 “世界観”に合わせて大幅修正。 電子版でも字形を正確に再現可能。 •Unicodeによる符号化 当然、“字母”を用意しただけでは無意味。 使える活字にするためには、符号化が必要。 Unicodeから始めた符号化の作業。 U+0001 U+0002 U+0003U+0001U+0002 U+0003 U+0001 U+0002 U+0003 U+0001 U+0002 U+0003 U+0001 U+0002U+0003 U+0001 U+0002 U+0003
  • 5. 5 「角川新字源」フォント&コード2 •異体字とデザイン差の取り扱い →字体弁別粒度*と包摂基準の問題 用語、基準の問題。辞書での「異体字」と文字コードでの「異体字」。 辞書での「デザイン差」と文字コードでの「包摂」。 字形がマッチしないものについては、コードを割り振らないのか? それとも一番近いものに割り振るのか? 利用者が求めているものは何か? •Unicodeの採用字形を読み解く なぜこの字形が採用されたのか? 同じ意図で、「新字源」が採用した字形はどれなのか? (理想を言えば……。)
  • 6. 6 「角川新字源」フォント&コード3 •こういう字はどうしようか? 「新字源」親字表 (採用字形) Unicode表 (The Unicode Standard, Version 7.0 ) 他にも……「亭」など。 見出字U+4EAD 異体字U+20158? ……「像」など。 見出字U+50CF 異体字U+2F80B (IVDならU+50CF U+E0103 )
  • 7. 7 解決のために 結局のところ…… •どのコードをどこまで載せるのか、 基準をしっかり決める。 •Unicodeをきちんと知る。
  • 8. 8 未来のために 【漢和辞典の宿題】 •IVDを取り入れるのか? •正字(≒康煕字典体)、国語施策、 そして例示字形〒デジタルフォント。 •かつては漢文を読むためのもの、今は? •国語辞典が担えない機能は?