傾向+ノイズとしてのデータ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/11/26 14:58 UTC 版)
「傾向推定」の記事における「傾向+ノイズとしてのデータ」の解説
時系列データを解析するため、データ列は傾向要素とノイズ要素から成ると仮定する。 x i = a t i + b + e i {\displaystyle x_{i}=at_{i}+b+e_{i}\,} a {\displaystyle a} と b {\displaystyle b} は(通常、未知の)定数であり、 e {\displaystyle e} は無作為な誤差である。 e {\displaystyle e} が何らかの特殊な性質を持つと判明するまでは、正規分布であると仮定する。 e {\displaystyle e} が常に同じ分布であると仮定するのが最も単純だが、そうでない場合(いくつかのデータの分散が非常に大きいなど)、最小二乗法においてそれらのデータの分散の逆で重み付けすることで考慮することができる。 1つの時系列を分析するとき、傾向推定によって e {\displaystyle e} の分散を推定することができる。つまり、傾向推定で求めた a t + b {\displaystyle at+b} に従って残差として e {\displaystyle e} を取り出し、そこから分散を求める。多くの場合、これが e {\displaystyle e} の分散を求める唯一の方法である。 特殊な例として気温の時系列がある。気温データは時間に対して均質でないことが分かっている。一般に気象観測データは最近になるに従って増えており、従って気温の推定に関わる誤差は時と共に減少している。このため気象データの傾向推定を行うにはこれを考慮する。 データ列のノイズが明らかになると、傾向 a {\displaystyle a} が 0 とほとんど差異がないという帰無仮説によって傾向を検定することができる。上述の無作為データ列の傾向の分散の話から、無作為な(本来傾向のない)データからも傾向が得られることがあることが分かる。もし計算された傾向 a {\displaystyle a} が V {\displaystyle V} より大きければ、その傾向は S {\displaystyle S} の水準においてゼロと有意な差があると言える。
※この「傾向+ノイズとしてのデータ」の解説は、「傾向推定」の解説の一部です。
「傾向+ノイズとしてのデータ」を含む「傾向推定」の記事については、「傾向推定」の概要を参照ください。
- 傾向+ノイズとしてのデータのページへのリンク