前回より、機械学習に入門しています。
今回は、環境を構築していきます。
pyenv
pythonの複数バージョンを簡単に切り替えられるように、pyenvを導入します。
GitHub - pyenv/pyenv: Simple Python version management
導入手順は、公式ドキュメントの通りです。
https://github.com/pyenv/pyenv#installation
ライブラリ
pythonでは、pipコマンドによって様々なライブラリを導入して利用できます。
phpのcomposer、node.jsのnpmに近いものです。
今回の開発では、下記のようなライブラリを利用します。
(導入手順は後述します)
jupyter notebook
ブラウザで表示するIDEのようなライブラリです。
numpy
数値計算を簡単・高速にするライブラリです。
matplotlib
グラフ描画用のライブラリです。
pandas
表計算用のライブラリです。
すごくざっくり言うと、Excel的な操作をプログラミング的に解決するようなものです。
今回はCSVからのデータ読み出しやデータ整形で使います。
anaconda
前章で紹介したライブラリを一括で導入できる仕組みです。
pyenvから簡単に導入できます。
# pyenvでインストール可能なバージョン一覧を表示する pyenv install -l # anacondaの最新版を導入する pyenv install anaconda3-2021.05 # defaultで利用するpythonを、anacondaに変更する # 環境ごとに切り替えたい場合は、`pyenv local`を利用すること pyenv global anaconda3-2021.05
notebookの起動
実際に環境を触ってみます。
# jupyterを起動する
jupyter notebook
ブラウザにて、下記のような画面が表示されます。
notebookを作成します。新規 > Python3をクリックします。
動かしてみる
試しに、グラフを描画してみます。
- セル1つ目
# ライブラリの導入 import matplotlib.pyplot as plt
- セル2つ目
# データ作成 x = range(1, 10) y = [_x ** 2 for _x in x] for _x, _y in zip(x, y): print(_x, _y)
- セル3つ目
# グラフを描画する
plt.plot(x, y)
こんな感じになったでしょうか?
まとめ
pythonやデータ処理を自由に行える環境が、簡単に構築できました。