読書ログ 完全独習 統計学入門

データ分析や機械学習といった分野に興味があり、まずは統計とか勉強したほうがいいのかな?と思い、入門っぽい本を探していたところ中学数学がわかれば理解できるように書いてあるという触れ込みだったので読んでみることにしました。

完全独習 統計学入門 | 小島 寛之 |本 | 通販 | Amazon

内容としては標準偏差について非常に丁寧に説明されているように感じました。高専在学中に授業で触れて以来、10年ぶりくらいに標準偏差と再会しましたが説明が丁寧だったためよく理解できたような気がしています。標準偏差が株価のリスク指標(ボラティリティ)として利用されているといったことも書かれていました。正規分布や検定、信頼区間等も後半にかけて出てくる感じで、在学中に学んだことを必死に思い出すような感じで読みました。特に信頼区間については説明がなかなか腑に落ちず、何度もお風呂で同じ場所を読み直しました。このあたりの考え方は他の本とかも読んでいくうちに体に馴染んでくるのかなぁと思っています。(わかりませんがw)

座学的な感じの本なので実際に本に書かれていることがデータ分析等の業務のどの辺りに関わってくるのか?といった部分はわからなかったため、別の本で補完していく必要があるなと感じています。とりあえず難しい数式は出てこないので統計についてほぼ知らない状態で手始めに読むにはちょうどよかったのかなと感じます。色んな本を見つつ徐々に知識を深められればいいのかなと感じました。

WSL上でpyenv virtualenvの環境を構築

WSL上にpython 3.7の環境が欲しかったので、pyenv virtualenvをインストールしてpython 3.7をインストールしました。

pyenv virtualenvの取得

git cloneで下記を取得します。

$ git clone https://github.com/pyenv/pyenv.git ~/.pyenv
$ git clone https://github.com/pyenv/pyenv-virtualenv.git ~/.pyenv/plugins/pyenv-virtualenv

設定の追加

  • ~/.bashrcに下記の設定を追加
# python
export PYENV_ROOT="$HOME/.pyenv"
export PATH="$PYENV_ROOT/bin:$PATH"
if command -v pyenv 1>/dev/null 2>&1; then
  eval "$(pyenv init -)"
  eval "$(pyenv virtualenv-init -)"
fi
  • 設定の読み込み
$ source ~/.bashrc

python 3.7.0のインストール

  • python3.7.0をインストールするために必要なパッケージをインストール
$ sudo apt-get update
$ sudo apt-get install git \
    gcc \
    make \
    openssl \
    libssl-dev \
    libbz2-dev \
    libreadline-dev \
    libsqlite3-dev \
    zlib1g-dev \
    libffi-dev
  • python 3.7.0のインストール
$ pyenv install 3.7.0
$ pyenv versions 
$ pyenv shell 3.7.0
$ python -V

virtualenvで仮想環境の作成

$ pyenv virtualenv <利用するpythonバージョン> <仮想環境名>

下記を参考にさせていただきました。