Wednesday, October 15, 2014

python prepare for DataSience Mac Yosemite

Mac OS X 10.9(Maverics) python prepare for DataSience
(Python で DataSienceの準備)

YosemiteのPythonでデータサイエンス環境を整える
Shell が公開されています。下のページを見てください。
pipが入るのでパッケージの追加も便利です。
Pythonは2系で最新になるようです。

refer for: (参照)
http://fonnesbeck.github.io/ScipySuperpack/
install_superpack.sh for Yosemite Mac OS X 10.10   Xcode6  is release

Environment--------------------------------------------------
  • Mac OS X 10.10 (Yosemite)
  • Xcode 6
  • command_line_tools
  • Homebrew 
 Yosemite default Python is Python 2.7.6
do install_superpack.sh
 ------------------------------------------------------
auto installed pip

$ python -V
Python 2.7.8

$ pip freeze        #installed packege
Cython==0.21.1
Flask==0.10.1
Jinja2==2.7.3
Markdown==2.5.1
MarkupSafe==0.23
PyYAML==3.11
Pygments==1.6
Sphinx==1.2.3
Theano==0.6.0
Werkzeug==0.9.6
backports.ssl-match-hostname==3.4.0.2
bokeh==0.6.1
certifi==14.05.14
colorama==0.3.2
docutils==0.12
gevent==1.0.1
gevent-websocket==0.9.3
greenlet==0.4.5
ipython==3.0.0-dev
itsdangerous==0.24
matplotlib==1.5.x
mock==1.0.1
nose==1.3.4
numpy==1.9.0
pandas==0.15.0-6-g403f38d
patsy==0.3.0
pymc==2.3.4
pyparsing==2.0.3
pystache==0.5.4
python-dateutil==2.2
pytz==2013b
pyzmq==14.4.0
requests==2.4.3
scikit-learn==0.16-git
scipy==0.15.0.dev-28301fc
six==1.8.0
statsmodels==0.6.0-rc1
tornado==4.0.2
websocket==0.2.1
wsgiref==0.1.2


======================================================
check
--------------------------------------------------------------------------------------------------
$ ipython --pylab
In [1]: import numpy
In [2]: import scipy
In [3]: import pandas
In [4]: x = randn(1000)
In [5]: hist(x,100)
-------------------------------------------------------------------------------------------------------
Draw Histgram is OK   こんなヒストグラムが描ければOK


機能

Numpy      Pythonで科学計算を行うための拡張モジュール 多次元配列,行列 演算処理
Scipy      NumPy base 科学技術計算用の統計関数、画像、信号処理などのライブラリ
Matplotlib  2次元のグラフ描画用のモジュールで、Ipythonとの組み合わせで
Pandas     パフォーマンスに優れたデータ分析モジュールで、 時系列データ得意
IPython   補完ができたりOSのコマンドライン・シェルとしても利用できる拡張
Statsmodels 統計解析パッケージ
scikit-learn  機械学習ライブラリで、分類や回帰、クラスタリング評価尺度や
                  クロスバリデーション、パラメータのグリッドサーチ
PyMC         Pythonのベイズ統計用ライブラリです 特にMCMCに重点を置いています