ふごう‐か〔フガウクワ〕【符号化】
符号化
エンコード
【英】encode
エンコードとは、データの符号化、つまり、他形式へのコードの変換を行うことである。
エンコードは、データの圧縮や暗号化の際に用いられる。例えば、CDから取り込んだ音楽データをMP3プレイヤーに転送する際には、WAV形式からMP3形式へのエンコードが行われる。また、電子メールにファイルを添付する際には、バイナリ形式からテキスト形式へのエンコードが行われる。
エンコードされた情報を元に戻すことは、デコードと呼ばれる。エンコードの方法ととデコードの方法が食い違うと、正しくファイルを開けなくなってしまう。電子メールやWebページにおける文字化けなどは、その一例である。
符号化
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/12 03:57 UTC 版)
「リード・ソロモン符号」の記事における「符号化」の解説
符号化は以下のような手順で行われる。まず送る情報 K × r ビットを前述の方法でシンボル化して K-1次の多項式を生成し、これを情報多項式と呼び I(x) で表す。次に以下の式で表される生成多項式を用意する。 G ( x ) = ∏ i = b 2 t − 1 + b ( x − α i ) {\displaystyle G(x)=\prod _{i=b}^{2t-1+b}(x-\alpha ^{i})} 上記の式中における b は適当な整数を入れる。例として b=0 で2シンボルの誤りを訂正する符号を生成する。このとき t= 2となり、生成多項式は G ( x ) = ( x − 1 ) ( x − α ) ( x − α 2 ) ( x − α 3 ) = x 4 + α 75 x 3 + α 249 x 2 + α 78 x + α 6 {\displaystyle \left.G(x)=(x-1)(x-\alpha )(x-\alpha ^{2})(x-\alpha ^{3})=x^{4}+\alpha ^{75}x^{3}+\alpha ^{249}x^{2}+\alpha ^{78}x+\alpha ^{6}\right.} となる。このとき情報多項式と生成多項式を用いて以下のような演算を行う。 C ( x ) = x N − K × I ( x ) + P ( x ) {\displaystyle C(x)=x^{N-K}\times I(x)+P(x)} ただし P ( x ) ≡ x N − K × I ( x ) mod G ( x ) {\displaystyle P(x)\equiv x^{N-K}\times I(x)\mod G(x)} である。ここで生成される C(x) に対応するビット列が送信される符号である。
※この「符号化」の解説は、「リード・ソロモン符号」の解説の一部です。
「符号化」を含む「リード・ソロモン符号」の記事については、「リード・ソロモン符号」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/27 02:37 UTC 版)
符号化とは対象を上限のある整数に変換することで有り、様々な分野でそれぞれ適切な表現形式を用いてデータを符号化している。 数値の場合、上限(範囲)の定められた整数は既に符号化されている。小数以下を含む数値の場合、指数表記として符号化する浮動小数点型、任意の位置を小数点とする固定小数点型などとして扱える。記数法を用いずに全ての数字に独自の命名をして扱うことや、十進数や十六進数や六進数や九進数といった「1/3が割り切れる」「一の位が3または0ならば3の倍数」の記数法を用いたりすることが出来る。 文字は既に符号化されている。必要であれば文字コードで文字とコード(取り扱いやすい任意の整数)を対応させることができる。 音声は、任意の時間とその地点の音量でPCMなどによる方法で符号化できる。 音楽は、楽譜によって周波数、時間軸、音色などをデジタル化出来る。楽譜を電子化した物としては、機械演奏用のMIDIやMML、電子出版や配布用としてPDFなどがある。演奏した物を音声と同じ方法で符号化できる。 絵、映像は、平面を等間隔で区切り、光をRGBなど色の成分に分解し、各色の明るさなどを数値化する。その情報を任意の時間で連続記録すれば動画となる(一般的な動画には音声がついているが、技術的には関連は無く、応用技術として単に動画と音声を同時に再生している。)。 図形は、ベクタ形式による。この形式は、狭義には線分の始点と終点の座標を数値で記録する。広義には、各種の図形に対して、例えば円なら、「図形コード=円、中心座標、半径」を記録する。これらのデータからの例えば円を描くことは図形表示ソフトウェアに任せる。また、絵や、映像と同じ方法でも符号化できる。
※この「符号化」の解説は、「デジタル」の解説の一部です。
「符号化」を含む「デジタル」の記事については、「デジタル」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/02/13 23:30 UTC 版)
UTF-16では、Unicodeの代用符号位置を除いた符号位置(Unicodeスカラ値という)を、16ビット符号なし整数を符号単位とした符号単位列で表す。符号単位列は1つまたは2つの符号単位からなる。すなわち、合計は16ビットまたは32ビットである。 BMPに含まれるU+0000..U+D7FFとU+E000..U+FFFFは、そのまま符号単位1つで表す。 BMP以外のU+10000..U+10FFFFは、表のようにビットを配分して、符号単位2つで表す。 スカラ値UTF-16備考xxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx 000uuuuuxxxxxxxxxxxxxxxx 110110wwwwxxxxxx 110111xxxxxxxxxx wwww = uuuuu - 1 このとき使われる、U+D800 ~ U+DFFF の符号位置を、代用符号位置(Surrogate Code Point)と呼び、BMP外の1つの符号位置を表す連続した2つの代用符号位置のペアをサロゲートペアと呼ぶ。代用符号位置に使うため、BMPのこの領域には文字が収録されておらず、UTF-16以外のUTF-8、UTF-32では使用されない。 Unicodeの符号位置の最大がU+10FFFFなのは、それがUTF-16で表せる最大だからである。 UTF-16符号化フォームで表現された文字は、16ビット符号なし整数の符号単位列でありプログラム内部での処理には都合がよいが、情報交換のためにファイルの読み書きや通信を行う場合は、適当な符号化スキームによりバイト直列化する必要がある。 符号化スキームにはUTF-16、UTF-16BE、UTF-16LEの3種類ある。UTF-16BEは16ビット整数をビッグエンディアンで直列化する。UTF-16LEはリトルエンディアンで直列化する。UTF-16BE、UTF-16LEの場合はバイト順マーク (BOM) の付与は許されない。UTF-16の場合はBOMでエンディアンを明示するか、上層のプロトコルで指定されておらずBOMも付与しない場合はビッグエンディアンにするよう決められている。
※この「符号化」の解説は、「UTF-16」の解説の一部です。
「符号化」を含む「UTF-16」の記事については、「UTF-16」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/04/22 02:58 UTC 版)
最も単純で一般的なASKの使用形態は、スイッチにより搬送波が存在する場合をバイナリーの1、存在しない場合をバイナリーの0として表す方法である。この形の変調方法はオンオフ変調と呼ばれており、モールス信号を無線周波数で送信する際にも使用される(CW:連続波を参照)。 更に複雑な符号化では、複数のデータ(ビット)をグループにして、振幅の違いとして表す方法がある。例えば、4段階の振幅の違いでは、各変調波形で2ビットを表すことができ(4値ASK)、8段階の振幅の違いでは3ビットを表すことが可能(8値ASK)である。これは、PSKにおけるQPSKや8PSKと同様の手法である。信号に沢山ビットを詰め込むことで伝送効率を上げることが可能であるが、正確に復号するためには高いS/N比が必要となる。 ここに、振幅偏移変調で使用する送受信システムの典型的な例をダイアグラムで示す。 図は3つのブロックに分けられる。1つ目は送信部。2つ目は線形化した送信経路のモデル、3つ目が受信部であり、各ブロックでは、次の表記が使用される。 ht(t) :送信時の搬送波 hc(t) :送信経路のインパルス応答 n(t) :送信経路へのノイズ hr(t) :受信機のフィルタ L :送信時に使用される振幅のレベル数 Ts :2つのシンボルの作成にかかる時間 異なるシンボルは異なる電圧で表される。最大の電圧値をAで表すとすると、全ての電圧値は、[-A,A]の間に入ることになり、次の式で表される。 v i = 2 A L − 1 i − A ; i = 0 , 1 , … , L − 1 {\displaystyle v_{i}={\frac {2A}{L-1}}i-A;\quad i=0,1,\dots ,L-1} 各レベル間の電圧の差は次の式で表される。 Δ = 2 A L − 1 {\displaystyle \Delta ={\frac {2A}{L-1}}} 図において、送信信号のシンボルv[n]が信号源Sでランダムに出力されると考えると、波形生成装置(impulse generator )は、面積v[n]のインパルス波形を作り出す。このインパルス波形はフィルタhtに経由して、チャネルを通して送信される。別の言葉で言えば、各シンボルごとに、対応する振幅の異なる搬送波が送信される。 送信機から出力された信号s(t)は、次の形で表される。 s ( t ) = ∑ n = − ∞ ∞ v [ n ] ⋅ h t ( t − n T s ) {\displaystyle s(t)=\sum _{n=-\infty }^{\infty }v[n]\cdot h_{t}(t-nT_{s})} 受信器で、hr (t)を通してフィルターされた後、信号は、次の形になる。 z ( t ) = n r ( t ) + ∑ n = − ∞ ∞ v [ n ] ⋅ g ( t − n T s ) {\displaystyle z(t)=n_{r}(t)+\sum _{n=-\infty }^{\infty }v[n]\cdot g(t-nT_{s})} ただし、次の関係がある。 n r ( t ) = n ( t ) ∗ h r ( t ) {\displaystyle n_{r}(t)=n(t)*h_{r}(t)} g ( t ) = h t ( t ) ∗ h c ( t ) ∗ h r ( t ) {\displaystyle g(t)=h_{t}(t)*h_{c}(t)*h_{r}(t)} ここで、*は2つの信号の畳み込みを示す。A/D変換後、信号z(k)は、次の形で表される。 z [ k ] = n r [ k ] + v [ k ] g [ 0 ] + ∑ n ≠ k v [ n ] g [ k − n ] {\displaystyle z[k]=n_{r}[k]+v[k]g[0]+\sum _{n\neq k}v[n]g[k-n]} この関係において、2項目は、復号されるシンボルを表している。他の項は必要がない項である。第1項はノイズの効果で、第3項目はシンボル間干渉によるものである。 もし、シンボル間(ISI)のナイキスト基準を満たすことのできるg(t)を持つフィルターを選ぶことができれば、シンボル間の干渉は存在せず、合計の値は0となる。したがって、以下の式となる。 z [ k ] = n r [ k ] + v [ k ] g [ 0 ] {\displaystyle z[k]=n_{r}[k]+v[k]g[0]} この場合、送信信号はノイズのみの影響を受ける。
※この「符号化」の解説は、「振幅偏移変調」の解説の一部です。
「符号化」を含む「振幅偏移変調」の記事については、「振幅偏移変調」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/03/10 23:31 UTC 版)
第三漢字面の文字は、2バイト固定長方式のUCS-2では使用することが出来ず、UTF-8、UTF-16、UTF-32のいずれの符号化方式でも4バイトで符号化される。UTF-16ではサロゲートペア(代用対)を使う必要がある。
※この「符号化」の解説は、「第三漢字面」の解説の一部です。
「符号化」を含む「第三漢字面」の記事については、「第三漢字面」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/12/28 13:45 UTC 版)
追加漢字面の文字は、2バイト固定長方式のUCS-2では使用することが出来ず、UTF-8、UTF-16、UTF-32のいずれの符号化方式でも4バイトで符号化される。UTF-16ではサロゲートペア(代用対)を使う必要がある。
※この「符号化」の解説は、「追加漢字面」の解説の一部です。
「符号化」を含む「追加漢字面」の記事については、「追加漢字面」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/03/11 08:41 UTC 版)
「ノーブレークスペース」の記事における「符号化」の解説
規格ノーブレークスペースの表現Unicode・ISO/IEC 10646 U+00A0 no-break space UTF-8 C2 A0 ISO/IEC 8859 A0 JIS X 0213 1面9区2点(ラテン1互換) CP1252(ほとんどのゲルマン諸語とロマンス諸語におけるWindowsのデフォルト) A0 KOI8-R 9A EBCDIC 41 – RSP, Required Space CP437, CP850, CP866 FF HTML(Wikitextを含む) (文字参照#文字実体参照) または (文字参照#数値文字参照) TeX ~(チルダ) ASCII (使用不可。ただし、拡張ASCIIのバージョンの中には、文字255 (0xFF) をノーブレークスペースとして提供しているものがある。)
※この「符号化」の解説は、「ノーブレークスペース」の解説の一部です。
「符号化」を含む「ノーブレークスペース」の記事については、「ノーブレークスペース」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/12/13 23:56 UTC 版)
追加多言語面の文字は、2バイト固定長方式のUCS-2では使用することが出来ず、UTF-8、UTF-16、UTF-32のいずれの符号化方式でも4バイトで符号化される。UTF-16ではサロゲートペア(代用対)を使う必要がある。
※この「符号化」の解説は、「追加多言語面」の解説の一部です。
「符号化」を含む「追加多言語面」の記事については、「追加多言語面」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/31 18:49 UTC 版)
「100ギガビット・イーサネット」の記事における「符号化」の解説
100ギガビット・イーサネットではPCS副層(英語版)の符号化方式としていくつかの方法が提案されている。その多くは10G・25G・50Gなど低いデータレートの通信路(レーン)に伝送し、それを並列に複数束ねることで全体で100Gbpsを実現している。レーン性能向上に伴い、各方式は以下のように世代として区分されている。 第1世代 - 10.3125 Gbaud, NRZ × 64b/66b 10Gbpsベースの符号化。最初期のもので、シングルレーン10GbEで使用される符号化方式を用いてこれを4・10レーンに並列伝送して40/100GbEを実装する。100GBASE-SR10, 40GBASE-SR4などで採用された。シンボルレートが小さいためエラーの影響を受けにくく比較的長距離伝送が可能であるが、束ねた本数分のケーブルを必要とするためコストがかかる。これに加え、40GBASE-LR4/ER4などの長距離通信では4波長のWDMを、100GBASE-CR10などの銅線接続ではFECを併用している。この符号化方式はIEEE 802.3により段階的に廃止が予定されている。 第2世代 - 25.78125 Gbaud, NRZ × 64b/66b 25Gbpsベースの符号化。上記を2.5倍速した信号を送受4レーン束ねて100GbEを実装したもの。100GBASE-LR4/ER4でWDMを用いて採用された。一部の実装ではFECを併用するものがある。 第2世代(改) - 25.78125 Gbaud, NRZ × 256b/257b × RS-FEC (528,514) 25Gbpsベースの符号化。このシンボルレートではマルチモードファイバーでエラーが大きく出てしまうため、誤り訂正を適用したもの。10GBASE-SR4で採用された。ここではビット変換方式も256b/257bに差し替えられ、その後にRS-FEC適用が続く。これにより、RS-FECのオーバーヘッドを含めても64b/66bとまったく同じデータレートになる。一部の実装では条件によってFECなしで採用しているものがある。 第3世代 - 26.5625 Gbaud, PAM4 × RS-FEC (544,514) 50Gbpsベースの符号化。送受2レーンを束ねて100GbEを実装する。100GBASE-SR2で採用された。4つの異なる電圧レベルでパルス振幅変調を採用し、1シンボルに2ビットを伝送することでレーンあたりのデータレートが2倍となった。符号誤り率を維持するために、FECオーバーヘッドも倍となり(2.7%→5.8%)、これによりシンボルレートがわずかに大きくなっている。 第4世代 - 53.125 Gbaud, PAM4 × RS-FEC (544,514) 100Gbpsベースの符号化。半導体の進化により倍速動作が可能となったため、1レーンで完全な100GbE動作を実現した。100GBASE-DRで採用され、200/400GbEにも採用されている。
※この「符号化」の解説は、「100ギガビット・イーサネット」の解説の一部です。
「符号化」を含む「100ギガビット・イーサネット」の記事については、「100ギガビット・イーサネット」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/05/26 15:41 UTC 版)
2019年2月現在、Unicodeには収録されていない。 2015年10月に485個の文字がUnicodeに登録申請された。 2017年10月にUnicodeのコードポイントが暫定的に決定した。その位置はU+1B300からU+1B4FFまでとなっており、またその直後のU+1B500からU+1B52Fまでの位置に「Shuishu Radical」として部首を収録する予定である。Unicodeの水書の予定されている配列は部首・画数順によるが、部首・画数で分類しがたいものは、擬人化・動物・鳥・魚・植物といった分類によっている。
※この「符号化」の解説は、「水書」の解説の一部です。
「符号化」を含む「水書」の記事については、「水書」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2015/10/10 16:23 UTC 版)
多くのプロセスでは注入できるデータには制限(フィルター)があるため、シェルコードはその制限内で書く必要があり、それにはコードを小さくすること、ヌル文字を途中に含めないこと、英数字のみにすることなどが含まれる。このような制限に対処する方法はいくつかある。 設計と実装の最適化により、シェルコードを大きさを減らす。 シェルコードで使えるバイトの範囲の制限に対応するため、実装を修正する。 通常なら注入できないバイトのパターンを生成するため、自己書き換えコードを使う。 命令コードをネットワーク経由でそのまま送信するとセキュリティソフトによって検出されるため、自己解凍コードやポリモルフィックコードで符号化されることが多い。
※この「符号化」の解説は、「シェルコード」の解説の一部です。
「符号化」を含む「シェルコード」の記事については、「シェルコード」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/06/19 14:23 UTC 版)
追加特殊用途面は、2バイト固定長方式のUCS-2では使用することが出来ず、UTF-8、UTF-16、UTF-32のいずれの符号化方式でも4バイトで符号化される。UTF-16ではサロゲートペア(代用対)を使う必要がある。
※この「符号化」の解説は、「追加特殊用途面」の解説の一部です。
「符号化」を含む「追加特殊用途面」の記事については、「追加特殊用途面」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/06/19 14:17 UTC 版)
追加面の文字は、2バイト固定長方式のUCS-2では使用することが出来ず、UTF-8、UTF-16、UTF-32のいずれの符号化方式でも4バイトで符号化される。UTF-16ではサロゲートペア(代用対)を使う必要がある。
※この「符号化」の解説は、「追加面」の解説の一部です。
「符号化」を含む「追加面」の記事については、「追加面」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2018/11/17 07:32 UTC 版)
記号列 ababaabaaab をもとに、符号化の手順を説明する。 まず、単語を登録するための辞書を次のように初期化する。ここで、辞書番号0は、未出記号を意味する空列となる。 番号単語0 (空列) 符号化は、対象となる記号列の prefix (先頭から見た部分列)に最長一致する辞書の単語を見つけることから始まる。符号化対象の先頭は a... だが、a から始まる単語は辞書に登録されていない単語である。そこで、未出を表す 0 がまず得られる。符号語は、得られた辞書番号と次の記号列の先頭記号とを組み合わせて、 (0,a) として出力する。 a babaabaaab(0,a) 続いて辞書の更新を行う。得られた辞書番号 0 の単語の末尾に、次の記号列の先頭記号である a を加えたものを辞書番号 1 に登録する。ここで、辞書の番号は現在までの最大値に +1 したものとなる。上記の場合は 0 の単語が空列であるため、 a を辞書の 1 番に登録する。 番号単語0 (空列) 1 a 次の b も未出なので、(0,b) を出力して、 b を登録する。 a b abaabaaab(0,a)(0,b) 番号単語0 (空列) 1 a 2 b 次の ab... は、a が辞書に登録されているため、その番号 1 と続く1記号 b を符号語として出力する。 a b ab aabaaab(0,a)(0,b)(1,b) 辞書には、a と b を連接した ab を登録する。 番号単語0 (空列) 1 a 2 b 3 ab 同様に、次の aa... は、a が辞書に登録されているため、その番号 1 と続く1記号 a を符号語として出力する。 a b ab aa baaab(0,a)(0,b)(1,b)(1,a) 辞書には、a と a を連接した aa を登録する。 番号単語0 (空列) 1 a 2 b 3 ab 4 aa 残りは、ba と aab がそれぞれ切り出されて、最終的に次のような符号語の列が得られる。 (0,a)(0,b)(1,b)(1,a)(2,a)(4,b) またこの時点での辞書は、次のようになる。 番号単語0 (空列) 1 a 2 b 3 ab 4 aa 5 ba 6 aab 符号語の列を別の何らかの符号で符号化したものが、最終的な出力となる。辞書は、符号語の列から再構成できるため、特に保存する必要はない。
※この「符号化」の解説は、「LZ78」の解説の一部です。
「符号化」を含む「LZ78」の記事については、「LZ78」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/02/27 03:31 UTC 版)
BMPの符号位置は、UTF-16やUTF-8では、他の面より少ないオクテット(バイト)数で符号化される。 UTF-8では、1〜3オクテットで符号化される。 UTF-16では、2オクテットで符号化される。サロゲートペア(代用対)は必要がないため使われない。 UTF-32では、他の面と同様、4オクテットで符号化される。
※この「符号化」の解説は、「基本多言語面」の解説の一部です。
「符号化」を含む「基本多言語面」の記事については、「基本多言語面」の概要を参照ください。
符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/02/27 07:10 UTC 版)
私用面は、2バイト固定長方式のUCS-2では使用することが出来ず、UTF-8、UTF-16、UTF-32のいずれの符号化方式でも4バイトで符号化される。UTF-16ではサロゲートペア(代用対)を使う必要がある。
※この「符号化」の解説は、「私用面」の解説の一部です。
「符号化」を含む「私用面」の記事については、「私用面」の概要を参照ください。
「符号化」の例文・使い方・用例・文例
符号化と同じ種類の言葉
- 符号化のページへのリンク