倍精度浮動小数点数
![]() | この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。(2019年7月) |
英: double-precision floating-point number)は、64ビットの浮動小数点数表現である。
(ばいせいどふどうしょうすうてんすう、倍精度とは単精度に対する表現であり、これは32ビットを1ワードとする32ビットアーキテクチャをもとにしている。
昔[いつ?]のFORTRANでは、単精度(REAL
型)よりも精度が高ければ倍精度(DOUBLE PRECISION
型)を名乗ることができた(そもそもワードの長さも浮動小数点のフォーマットも機種ごとにまちまちだった)。IBM社のSystem/360が採用して同社の大型計算機とその他社の互換機種における事実上の標準となった、基数を16とするIBM浮動小数点形式では、32ビット単精度では最悪の場合の精度が十進で6桁程度となり、精度を要する科学技術計算では倍精度以上を使わねばならないという問題があった。(注:FORTRAN言語ではREAL
型が1ワード、DOUBLE PRECISION
型が2ワードを記憶上で占めるという前提だった)
システムで実数を表現する際に基本となる1語を用いて表現される数値を単精度(single-precision)であるといい、基本となる2語を用いて実現されたより高い精度の数値を倍精度(double-precision)であるという。基本となる実数型の語長はシステムに依存していて,32ビット、36ビット、48ビット、64ビットなどと様々だった。たとえば、CDC社の実数が64ビットの語長のシステムでは、FORTRAN言語でREALと宣言するとそれは1語が64ビットであり、DOUBLE PRECISIONと宣言するとそれは128ビットである。しかし、IEEE 754規格が制定された1980年頃からしだいに、規格で定義された内部2進で語長32ビットの形式の浮動小数点数および演算のことを単精度と呼び、規格で定義された内部2進で語長64ビットの形式の浮動小数点数とその演算のことを倍精度と呼ぶことが一般的になってきた。
浮動小数点算術に関する標準であるIEEE 754では、単精度は32ビット(4オクテット)、倍精度は64ビット(8オクテット)である。いずれにしろ、「倍」というのは、精度に関係する仮数部(後述)の長さが正確に2倍である、といったような意味ではなく、全体の長さが2倍である所から来ているので、実際の所「倍精度」というのはかなり大雑把な言い方に過ぎない。
倍精度浮動小数点数の形式
倍精度浮動小数点数は単精度浮動小数点数に比べて性能や帯域幅のコストがかかるが、表現できる数値の範囲が広いためPCでもよく使われている。浮動小数点方式一般に言えることであるが(単精度の場合と同様)指数部に使われる部分があるために、同じサイズの固定長整数が表現可能な値のうち、ある範囲より絶対値が大きいものについては、その全てを正確に表現することはできない。IEEE 754:2008でbinary64として標準化されたパラメータは次の通りである。
- 符号ビット (
64ビットの「倍精度」データで表される実際の数値は、符号を
カテゴリ
- 倍精度浮動小数点数のページへのリンク