書くことがない人生ってもったいないかも

ないわけではないこともないのだがまあなかったんだな。

最近また時間が出来てきたので株予測を再開した。しかししばらく触っていないうちにいろいろ変わってしまい色々作り直している。プログラムは大きく3つあり(株データ取得、学習、判別)そのうち、株データ取得が完全にダメになっていた。株データの取得にはyahooファイナンスのページを利用している。データベースに直接アクセスできれば話は早いのだがやり方がわからない(多分無理なんじゃないかと)ので、HTMLを落としてタグ解析して必要な部分だけ抜き出すという荒業を使っている。しかしどうやらページフォーマットが更新されたらしく落とせなくなった。というわけでプログラムを書き直したのだがかなり苦労した。一つは文字コードC++で開発していたのだがかなりゴチャゴチャになってお手上げ状態になってしまった。というわけで思い切って全て破棄してC#に移行した。そしたら今までの苦労がアホかと思えるほど楽になった。文字コードもそうだが、HTMLダウンロード、HTMLタグ解析もライブラリがそろっているのでコード量も激減した。その他細かい苦労(株のコードにTとかくっついているとか株価に小数が入ったとか)を乗り越えてようやくデータ取得が出来るようになった。というわけでとりあえず機械学習用に東証1部の全銘柄を1000日分落とそうと思って走らせたら途中から取得できなくなった。いろいろ調べたら途中からアクセス制限がかかったっぽい。おそらくyahooファイナンス側で弾かれている模様。これは困った。自分のプログラムの問題なら努力でなんとかなるが相手側だとどうしようもない。仕方ないので回避策を考えているが思いついた方法は毎日差分だけ落としてくるという方法。これならダウンロードの量がかなり減るのでアクセス制限がかかる前に全部落とせるはずだがまあいろいろ面倒くさそうではある。

本格的な再開はまだ先になりそうです。