FC2ブログ

頭と尻尾はくれてやる!

パソコンおやじのiPhoneアプリ・サイト作成・運営日記


解答の範囲検討

機械学習で株価予測、最初1銘柄でやってみたらさっぱりだった(内部的にはこれをver1)ので今回(ver2)いくつか変更してる。その一つが解答の範囲の見直し。
機械学習で株価予測やってみたが
↑ver1ではここに書いてあるようにテキトウに区切って9分割してた。
0 +6%超
1 +4%〜+6%
2 +2%〜+4%
3 0%〜+2%
4 変化なし
5から8はマイナス側の9分割

さすがにテキトウなのはよろしくないのかな?と思ってまずはばらつきぐらいを確認してみた。
なお、上記の記事にも書いてるように日計りを想定しているので
終値 / 始値
の値がどうなの?というのを確認したい。なお、わかりやすいように変化なしの場合が0になるよう-1しておく。これをrateとしとく。
rate = 終値 / 始値 - 1
対象銘柄は現在日経平均に採用されてる225銘柄。

株価変化のばらつき1
↑横軸がrate、縦軸がデータ数なんだけど、横幅をいくつにするかで見え方はどうにでもなる、、、

株価変化のばらつき2
↑幅を広げるとこんな感じにもなる。
なお、全データ数は1,681,289個、うち変化なしが152,567個(9.07%)。

解答分割方法
↑こんな感じで9分割したい。変化なし(4番)は数が決まってるのでどうしようもないんだけど、他はなるべく同じような個数になるようにしたい。図で言えば同じ面積になるように決める。
標準偏差(SD)を求めておいて、正規分布とみなして標準正規分布表を使えばおおよそどう区切れば同じような個数になるかわかる。
SD = 0.0199
L1 = SD * 0.32
L2 = SD * 0.675
L3 = SD * 1.04

実際に分けてグラフで確認してみる。

分割結果1
↑うーん、なんか差が大きいやん。気に入らねえってことで、、、

分割結果2
↑結局手動で微調整して決定した。
最終的には下のような範囲(5から8はマイナス側)で9分割することにした。
0 +3.1%超
1 〜+1.42%
2 〜+0.775%
3 〜+0.31%
4 変化なし

ver1の区切り方がいかにテキトウだったか、だな。

<< 機械学習で株価予測の結果  TopPage  TensorFlowのtfrecordファイル内のデータ数を数える >>

コメント


管理者にだけ表示を許可する
 

トラックバック

トラックバックURL
http://ringsbell.blog117.fc2.com/tb.php/1120-c6ed411f




Copyright ©頭と尻尾はくれてやる!. Powered by FC2 Blog. Template by eriraha.

FC2Ad