スマレジエンジニアyushiのブログ

スマレジエンジニアのブログ

【機械学習入門 #2】環境構築

前回より、機械学習に入門しています。

yushi-dev.hatenablog.com

今回は、環境を構築していきます。

pyenv

pythonの複数バージョンを簡単に切り替えられるように、pyenvを導入します。

GitHub - pyenv/pyenv: Simple Python version management

導入手順は、公式ドキュメントの通りです。

https://github.com/pyenv/pyenv#installation

ライブラリ

pythonでは、pipコマンドによって様々なライブラリを導入して利用できます。

phpのcomposer、node.jsのnpmに近いものです。

今回の開発では、下記のようなライブラリを利用します。

(導入手順は後述します)

jupyter notebook

jupyter.org

ブラウザで表示するIDEのようなライブラリです。

numpy

numpy.org

数値計算を簡単・高速にするライブラリです。

matplotlib

matplotlib.org

グラフ描画用のライブラリです。

pandas

pandas.pydata.org

表計算用のライブラリです。

すごくざっくり言うと、Excel的な操作をプログラミング的に解決するようなものです。

今回はCSVからのデータ読み出しやデータ整形で使います。

anaconda

前章で紹介したライブラリを一括で導入できる仕組みです。

www.anaconda.com

pyenvから簡単に導入できます。

# pyenvでインストール可能なバージョン一覧を表示する
pyenv install -l

# anacondaの最新版を導入する
pyenv install anaconda3-2021.05

# defaultで利用するpythonを、anacondaに変更する
# 環境ごとに切り替えたい場合は、`pyenv local`を利用すること
pyenv global anaconda3-2021.05

notebookの起動

実際に環境を触ってみます。

# jupyterを起動する
jupyter notebook

ブラウザにて、下記のような画面が表示されます。

f:id:yushi0:20220404025357p:plain

notebookを作成します。新規 > Python3をクリックします。

f:id:yushi0:20220404025447p:plain

動かしてみる

試しに、グラフを描画してみます。

  • セル1つ目
# ライブラリの導入
import matplotlib.pyplot as plt
  • セル2つ目
# データ作成
x = range(1, 10)
y = [_x ** 2 for _x in x]

for _x, _y in zip(x, y):
    print(_x, _y)
  • セル3つ目
# グラフを描画する
plt.plot(x, y)

こんな感じになったでしょうか?

f:id:yushi0:20220404030443p:plain

まとめ

pythonやデータ処理を自由に行える環境が、簡単に構築できました。