はじめに
過去の記事で、順序回帰の予測量
や
がある条件のもとで、下記の(3)式を満たすと書きました(文字の意味は該当の記事をご覧ください)。本記事ではこのことを証明しようと思います。
(1)式が(3)式を満たすための十分条件と証明
(1)式が(3)式を満たすための十分条件は下記の通りです。
1.は、説明変数
からロジスティックモデルによって得られるとする。つまり、パラメータの推定量
を用いて
とする。
2.を
の二値に変換する関数を、閾値
を用いて
とする。
3.の真値
に対して、
とする。このとき、
が成り立つ閾値の列を設定できる。
4.は一致推定量である。つまり、
が成り立つ。
本節では、上の4つの条件を用いた下記の命題を証明しようと思います。
上記の条件1~4を満たすとき、(1)式で定義された
(命題1の証明)
一般にのとき、連続関数
について
が成立します。このことは命題2として、後で証明します。
いま、とすることで、後述の命題2から
が成立します。
また、
となります。ここで、条件2を使うと
となるので、
となります。
(i) のとき
(4)式よりとすることで、
となります。これと、
を用いると、
となります。
(ii) のとき
(4)式よりとし、
を使い、(i)と同様に議論すると
となります。
以上で得られた(5)、(6)、(7)式を用いることで
となります。(命題1の証明終わり)
以上で命題1を証明することができました。以下では、命題1の証明中に出てきた下記の命題2を証明します。
一般に
(命題2の証明)
は連続関数なので、
となります。ただし、はEuclid距離です。
したがって、
となります。のとき、
なので(これは命題3として後で証明)、
となります。すなわち、
となります。(命題2の証明終わり)
以上で命題2を証明することができました。以下では、命題2の証明中に出てきた下記の命題3を証明します。
(命題3の証明)
がEuclid距離であることと、三角不等式を用いると
となります。よって、
が成り立ちます。ここで、
であること(これは命題4として後で証明)を用いると、
が成り立ちます。以上より、
となります。最後にであることを用いると、
で
なので、
となります。つまり、
が成り立ちます。(命題3の証明終わり)
以上で命題3を証明することができました。以下では、命題3の証明中に出てきた下記の命題4を証明します。
(命題4の証明)
命題4の対偶は、
です。これは明らかに成り立つので元の命題4も成り立ちます。(命題4の証明終わり)
以上より、順序回帰の際に用いられる予測量
の性質を表した命題1を証明することができました。
(2)式が(3)式を満たすための十分条件と証明
(2)式が(3)式を満たすための十分条件は下記の通りです。
5.はソフトマックス関数を用いた線形回帰モデルによって予測されるとする。つまり、
として、
と表せる。
6.の真値
を用いて
としたときに、
が成り立つ。
7.は一致推定量である。つまり、
が成り立つ。
本節では、上の3つの条件を用いた下記の命題を証明しようと思います。
上記の条件5~7を満たすとき、(2)式で定義された
(命題5の証明)
より、
となります。
また、条件5を用いると、
となります。
ここで、条件7と命題2からが成り立つことと、条件6を用いると、
となります。これと(8)式を用いると
が成り立ちます。(命題5の証明終わり)
まとめ
本記事では順序回帰で用いられる予測量について、ある一定の条件を満たしたときに期待値が真値に収束することを示しました。