正規化
正規化
別名:ノーマライズ,カノニカライズ
【英】normalize, canonicalize, canonicalization
正規化とは、データの冗長性をなくしたり、混在している等価な表現をある統一形式に整形したりすることによって、同じ形式でデータを扱えるようにすることである。英語の「normalize」と「canonicalize」(canonicalization)両方の訳語として正規化という表現が用いられており、リレーショナルデータベース(RDB)やオーディオファイル、テキストファイルなど、様々な分野で正規化が行われている。
リレーショナルデータベースにおける正規化とは、リレーションを一定の形式に準拠させることによってデータを構築することである。正規化を行うことによって、データの冗長性を省き、メンテナンス性を高めることができる。リレーショナルデータベースでは正規化の種類や程度によって分けられた第一正規形、第二正規形、第三正規形~第五正規形の形式が知られている。
オーディオの分野における正規化とは、オーディオファイルの音量を一定レベルで補正することを指す。様々な音源から得た音量の異なるオーディオファイルを、同じ音量レベルに統一したり、あるいは音質を劣化させることなく音量レベルを最大化したりすることができる。
また、unicodeやXMLといったテキストファイルにおける正規化は、使用上許容されている表記のゆれをある一定の表記に統一することを指す。特にXMLでは、電子署名などで暗号化を行う際に表記ゆれ(一例として、要素や属性の順番などのゆれ)によって異なる内容に変換されてしまい、照会が失敗する可能性がある。そのためXMLでは「Canonical XML」と呼ばれる統一的記法が策定され、W3Cによって勧告されている。
参照リンク
Canonical XML - (英文)
正規化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/03/13 03:04 UTC 版)
![]() | この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。(2019年3月) |
正規化(せいきか、英語: normalization)とは、データなどを一定の規則に基づいて変形し、利用しやすくすること。言い換えると、正規形でないものを正規形(比較・演算などの操作のために望ましい性質を持った一定の形)に変形することをいう。多くの場合、規格化と訳しても同義である。
用語「正規化」は、非常に多くの分野で使われていて、分野によって意味も大きく異なるので、頻度が高い分野についてそれぞれ個別に説明する。
ベクトル
ノルムが定義されたベクトル空間のベクトル v に対し、それにノルムの逆数 ‖ v ‖−1 を掛けてノルムが 1 であるベクトルにすることを、正規化という。
なお、数学的なベクトルでなく、情報科学分野で数列を意味するベクトルの正規化は、この意味での正規化ではなく、後で述べる数量の正規化になる。多変量データをベクトル空間に表した場合などはどちらの意味にもとれ、結果が定数倍異なるので、注意が必要である。
波動関数
量子力学で現れる波動関数 Ψ は二乗可積分関数の空間のベクトルとみなすことができる。この意味でベクトル Ψ は正規化されることが多い。物理的には、この操作は全空間での存在確率の合計を 1 にすることと解釈される。
代数多様体の正規化
ネーターの正規化定理
数量
数量を代表値で割るなどして無次元量化し、互いに比較できるようにすることを、正規化という。
正規化した結果は単位系によらない。したがって、正規化することによって、たとえば身長と体重など、次元が異なりそのままでは比較できない数量が比較できる。次元が同じでも、夏と冬の1日の気温変化のように、条件が異なるデータも正規化によって比較しやすくなる。
正規化は特に多変量解析の前処理として行われ、この用途の正規化を特徴軸の正規化という。
正規化の方法には様々なものがあり、次の2つが基本的である。
どちらが適しているかは、どのようなデータをどのような解析のために正規化するかによる。多変量解析には2.が用いられる。
用途によっては、同じように比例変換やアフィン変換をするのでも、最大値が 1、最小値が 0(または −1)となるように正規化をすることもある。また、べき乗して歪度を 0 にする、あらかじめ与えられた分布に一致させるなど、もっと強い正規化が用いられることもある。
パターン認識
パターン認識の前処理として、対象の特徴をあらかじめ定められた基準に沿うように加工することを、正規化という。
文字など2次元情報の場合、平行移動して位置をそろえる位置の正規化と、伸縮で大きさをそろえる大きさの正規化(縦の伸縮と横の伸縮とは個別に調整する)が、最も基本的な正規化である。これは、各標本点のX座標とY座標をデータ列とみなし、それぞれに「特徴軸の正規化」を施したことに相当する。
確率分布
確率密度関数については、横軸をアフィン変換して平均を 0、分散を 1 にすることを正規化という。正規化することによって、標準正規分布関数との、または確率密度関数どうしの比較が容易になる。
確率密度関数の正規化定数
関数を台で定積分した逆数を正規化定数 (normalizing constant) という。確率密度関数は台で定積分した値が 1 でなければならない。関数に正規化定数を掛けることによって、(確率密度関数の他の要件も満たせば)確率密度関数が作れる。
例えば、次の関数と台があったときに、
- このページは数学の曖昧さ回避のためのページです。一つの語句が複数の意味・職能を有する場合の水先案内のために、異なる用法を一覧にしてあります。お探しの用語に一番近い記事を選んで下さい。このページへリンクしているページを見つけたら、リンクを適切な項目に張り替えて下さい。
正規化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/01/27 06:16 UTC 版)
水平方向の周波数軸は、ゲイン線図でも位相線図でも周波数の比である ω ω c {\displaystyle {\omega \over {\omega _{\mathrm {c} }}}} に正規化(無次元化)できる。そのような図を正規化されていると呼び、周波数の単位は使わなくなり、遮断周波数 ω c {\displaystyle \omega _{\mathrm {c} }} を 1 とした比率で表される。
※この「正規化」の解説は、「ボード線図」の解説の一部です。
「正規化」を含む「ボード線図」の記事については、「ボード線図」の概要を参照ください。
「正規化」の例文・使い方・用例・文例
- 数値を正規化する。
- 正規化のページへのリンク