こんにちは。年末から年始にかけて、「データ解析のための統計モデリング入門」を読んでました。今度、その輪講会をします。
僕の担当は1章〜6章までだったので、「自分でスライド全部作ってるのは流石に無理んご」ってなったので、slideshareなどに上がっている資料をおもっクソ使う予定です。
先人の皆さん、ありがとうございます。
○データ解析のための統計モデリング入門とは
この本です。よく「緑本」と略されるやつですね。
機械学習系の勉強会をやっている人たちとPRMLを読んだ後にこれをみんなで読もうとなったんですが「完全に読む順番間違えたw」っていう話になっていました笑。なので、これから読む方はぜひこっちから読むといいと思います。特にMCMCの説明なんかは、PRMLより5万倍わかりやすいと思います。
○参考になった資料まとめ
以下が参考になった資料のまとめです。
■読書会の資料
以下のサイトに読書会で行われたときに使われた資料のまとめっぽいのがありました。これは普通に参考になりました。
connpass.com
一部ではあるが、動画による解説もあるみたいです(自分は確認していないが)
■3章
www.slideshare.net
www.slideshare.net
この後に読むと良さそうな本は以下。これは、本でも紹介されている。
あとは、今はこの第3版が出ているらしいけど、第2版がPDFであるので、こっちでもいいのかも。
An introduction to generalized linear models
■9章
www.slideshare.net
この後に読むと良さそうな本は以下。これは、本でも紹介されている。
Bayesian Data Analysisの本に関しては、pdfもあるので、そちらでもいいかも。
○この本を読んで次にやった方が良さそうな本やサイト
以下の分野に関して、それぞれもう少し深掘りした内容の本を読んだりするべきだと思いました。
・線形モデル/一般化線形モデル/一般化線形混合モデル/階層ベイズモデル
・サンプリング手法(MCMC/ギブスサンプリングなど)
・WinBUGS→Stan
この本のレベル感として「入門としてはいいけどもう少しが足りない」というイメージなので、更に深くやるのがいいかなと思いました。また、個人的にはBUGSよりも、Stanの方が今勉強するならいいと思うので、そっちをやって実装を試すのがいいかな、と。
以下、それぞれ読んだ方がいい感じのものを上げておきます。
■線形モデル/一般化線形モデル/一般化線形混合モデル/階層ベイズモデル
とりあえずさーっと調べたところでは、以下の本を読んでおけばいいかな、という感じです。
上の本は、かなり評判のいい一般化線形モデルに関する入門書。翻訳ものなので、英語版は第三版が出ているようなので、そっちを最初から読むのはアリかと。とりま、これは必ず押さえておきたい。
次にRでの実装しながらモデルについて勉強するやつ。実装の面ではこっちも押さえておきたい感はある。
■サンプリング手法(MCMC/ギブスサンプリングなど)
主にMCMCに関して抑えるには、以下の2冊があれば十分かと。鈍器クラスのレベルの本だが、これを抑えれば基本的に怖いものはないと思う。
以下のブログでは、MCMCなどをPythonで実装している。これも写経したい。あとは、Stanとかで書き直してみたい感もある。
■WinBUGS→Stan
BUGSは今はもうさほどアップデートもされていない様子なので、Stanで実装を試してみるのはワンチャンかなぁと。
これについては、以下のサイトを参照。
st-hakky.hatenablog.com
それでは。