読者です 読者をやめる 読者になる 読者になる

データ サイエンティスト のための新しい Python 環境 Rodeo がなかなかいい / Watch & try out python new IDE for data scientist

python machine learning anaconda jupyterlab ipython notebook PyDev

データ サイエンティスト のための新しい Python 環境 Rodeo がなかなかいい / Watch & try out python new IDE for data scientist

** Sorry, this note is Japanese only, but please take a look at some code snippets. Hope it helps you a bit!

唐突ですが、このブログの読者のみなさんってどんな環境でコード書いたり データ分析 したりしてるんでしょうか?
たぶん、RStudio が一番メジャーかな?で、Jupyter / IPython notebook がそれに続き、以下、Anaconda とも縁の深い Spyder とかなんでしょうか。最近だと PyCharm とか使ってる人もいるのかも。
そんな環境に悩める子羊ならぬ データサイエンティスト のみなさん、(これまで R 使ってる人なら特に)朗報です。
Python のデータサイエンティスト向け開発環境に新しい選択肢「Rodeo」が加わりました。
英語版しかないせいか、まだ日本の方で使っていそうな人はちらほら、ぐらいみたいなので、レビューしてみたいと思います!

Rodeo ってなに?美味しいの?

End-to-End Data Science Platform(リンク先英語) を合言葉に、データサイエンティストのためのプロダクトを開発している yhat というアメリカのベンチャー企業が開発している、Python の開発環境です。
特にデータサイエンティストの環境として最適なものを目指しているらしく、ユーザーインターフェースのかんじがかなり RStudio に似ています。
ハッキリ言って美味しいですw
特に、RStudio 使っている人にとっては、かなりとっつきやすいんじゃないでしょうか。

例の、緑の本の著者として有名な久保先生もいちはやく察知されてるようです。

Rodeo のイイところ

わたしはそんなにプロの データサイエンティスト ってわけでもないので、本職の方々にどれくらい響くかわかりませんが、使っていてイイなぁと感じたところを画像付きで紹介していきます。

Rodeo のイイところ1:環境構築が超かんたん・らくちん

Rodeo を使う際の環境構築は・・・Rodeo をインストールするだけです!
Windows も、MacOSX も、Linux まで、バイナリパッケージが配布されてるので、ここから Rodeo をダウンロード -> インストールですぐ終わります。しかも、主婦にもカンタン嬉しいインストーラー付き。

Rodeo のイイところ2:すべてのコードを一カ所にそのままかける!

これ、Jupyter / IPython とか使ってると地味ーにありがたいなぁって思う機能です。
Jupyter / IPython とかだと、パッケージのインストールとかしようと思ったら、シェルのコマンドを呼び出さないといけないので、セルを区切って、マジックスクリプトで云々・・・という感じになるのですが、Rodeo だったらそんなめんどくさいことは必要ありません。
pip install pandas, numpy, scikit-learn とかってのと、普通のコードの部分をまとめて書くことができます。
パッケージ インストールとコードが同時に書ける! ~ データ サイエンティスト のための新しい Python 環境 Rodeo / Watch & try out python new IDE for data scientist

しかも、実行の時には、一行ずつ・複数行まとめて・スクリプト全体、と、実行範囲を変えられるので、サクサク作業が捗ります。
これって、RStudio だと当たり前にできてたんですよね・・・Python でできるようになったのは需要があるような気がします。

Rodeo のイイところ3:コード補完賢いよ!美しいよ!!

ガチのエンジニアさんからすると「何ぬるいこと言ってるんじゃい!」というツッコミどころなのかもしれませんが、わたしはコードを書いてると関数やメソッドの名前がうる覚えで「あれ・・・f・・・何だっけ」みたいなことが多々あるわけですが、そんな時コード補完はやっぱりありがたいです。
コード補完自体はすでに珍しいものではないと思いますが、Rodeo のコード補完はとってもキレイで見やすいです。
賢いコード補完がステキ! ~ データ サイエンティスト のための新しい Python 環境 Rodeo / Watch & try out python new IDE for data scientist

Rodeo のイイところ4:実行履歴を簡単に確認できる!

直前に実行してたコードってどんなだっけ??・・・ってこと、ありますよね?
そんな時みなさんはどうやって確認してますか??コマンドヒストリー? Python だと readline でファイルに保存とか・・・?
Rodeo ならたったの1クリックでほら、このとおり。履歴も簡単確認できる、そう、Rodeo ならね。
履歴やパッケージ一覧も ~ データ サイエンティスト のための新しい Python 環境 Rodeo / Watch & try out python new IDE for data scientist

Rodeo のイイところ5:もちろんグラフやチャートもバッチリです

右下の Plot 専用の場所があるので、seaborn や matplotlib で描くグラフやチャートもバッチです。
学習曲線とコードとデータをキレイにまとめられる ~ データ サイエンティスト のための新しい Python 環境 Rodeo / Watch & try out python new IDE for data scientist

Rodeo のイイところ6:Anaconda と併用可能

Rodeo で実行する Python の場所を自由に設定できるので、Anaconda で使っている virtualenv の Python を指定してやれば、Anaconda 環境との併用もバッチリです。

ここがヘンだよ Rodeo ~ ちょっぴり残念なところ

ステマのような勢いでイイところばっか紹介しましたが、まだ発展途上なのか、残念なところもあります。

残念なところ1:実行時のカレントディレクトリが変

これが今の所一番困ってます・・・
設定で、ワーキングディレクトリってのを自由に選べるようになってるのですが、そのワーキングディレクトリとやらは起動時のファイルエクスプローラーに表示されるディレクトリってだけで、実行中の Python にとってのカレントディレクトリはなぜかドroot / になってます。Windows だと C:¥ とかなのかなぁ・・・
なので、pandas.read_csv('./data.csv') とかやっても、data.csv なんかないよ!って怒られてしまいます・・・

sys.path.dirname(filepath) とかも試したんですが、なかなかうまくいかず・・・orz
issue として指摘されてるみたいなので、今の所これに対応されるのを待つしかないんでしょうか・・・
github.com

残念なところ2:プロジェクトごとにワーキングディレクトリを設定したい!

さっきのワーキングディレクトリですが、全体で1つしか設定できません。
Eclipse の実行設定みたいに、プロジェクトごとにどの環境で実行するのか選べるとかなり便利なんだけどなぁ・・・

おまけ:機械学習 や データサイエンティスト のためのチュートリアルもあるよ

とまぁ、いろいろ書いてみましたが、まだまだこれからの製品だと思うので、これからもいろいろ試しながら応援していきたいと思ってます。

最後に、この Rodeo にはいろんなチュートリアルが付いていて、わたしのような 機械学習 や データサイエンティスト の初心者にはうってつけのコンテンツがあります。
残念ながらチュートリアルは今のところ英語だけですが、インタラクティブなチュートリアルで、英語がわからなくてもなんとなく読みながら、コードを追って自分でも実行していくだけでも理解が深まります。ついでに 英語の勉強 にもなって一石二鳥!?
f:id:shinhaito:20160727182314g:plain

その他開発環境関係の記事もどうぞ

datalove.hatenadiary.jp datalove.hatenadiary.jp datalove.hatenadiary.jp datalove.hatenadiary.jp datalove.hatenadiary.jp datalove.hatenadiary.jp