前処理〜モデリングまで対応可能なETL+アナリティクスツールであるSPSS Modelerですが、近年のトレンドをうけてサブスクリプションモデルが登場しています。
予算のある大企業しか使えなかったこのツールが、サブスクモデルの登場により「トライアル的に導入したい企業」「フリーランスのアナリスト・マーケッター」などに広がるのは言う間でもないでしょう。
そんなこんなでツールの概要です。
ライセンス形態は2種類
・買い切り型
従来型の買い切り型です。金額は税抜き180万ぐらいです。最初の1年はサポートが付きます。インストール型なのでWindowsメイン。
・サブスクリプション
インストール型とクラウド版(MacOSも可能)があり料金は¥27,600です。以前までは「SPSS Modeler Subscription」という製品名でしたが、先日より同社IBMの保有するWatson Studio Desktopというサービスに統合されました。
・https://www.ibm.com/jp-ja/products/spss-modeler
・https://www.ibm.com/jp-ja/products/watson-studio-desktop/pricing
簡単に電卓をはじいたところ、66ヶ月で1,821,600円となりますので、6年6ヶ月使用で、買い切り型のライセンスと支払い金額が並ぶ形になります。半年ぐらい使ってみてよかったら買い切り型を買うのも良いですし、ずっとサブスクモデルを使い続けるのもありでしょう。
ボリュームライセンスについては直接問い合わせしていただけたらと思います。
※前職で入れてましたが数ライセンスではお安くはなりません、営業目線で年度末なら可能性あるかも。
インフラ環境について
・ローカル処理の場合
クライアント側で計算処理(ローカル処理)をするのはお薦めではないですが、私の経験上テキストファイルで2000万行程度、容量で1GB以下程度がストレスを感じずに集計できるデータ容量かと思います。※1億レコード超えでも固まらずに動きますが2h以上データが帰って来ないこともザラにあります。
事業の特性上サンプルデータが少ない場合は良いですが、ビッグデータ界隈の人は計算処理を任せられるクラウド環境が別途必要です。
・クラウド処理の場合
SPSS Modeler Server(有償)を使ってインフラを整備するか、他社DWH(AWS等)にModelerを接続し分析をするケースです。私の場合はRedshiftに接続して使用しています(OracleやMySQLなどの各種DWHにも勿論使用可能です)
RedShiftの場合、Spectrum経由でS3上にあるデータ(AthenaなどでCREATE TABLEしたもの)もModelerから読みに行けますので、色々と汎用性が高いです。料金はdc2.largeの数ノードを契約したとして、ミニマム3万円/月〜から。
つまりサブスクとAWSを使えば月5万ちょっとで分析環境ができてしまうんです。予算に余裕がある方は、Tableauが年10万ほどなので、手持ちのツールがかなり充実しますよね。
ModelerはPythonやR連携ができるので、大抵のことは上記出費とちょっとキビキビ動くパソコンさえあれば、アナリティクス領域の業務は大抵カバーできるでしょう。
まずは体験版を!
と色々説明しましたが、まずは使ってみたほうが早いです。IBMさんが太っ腹なのか無料体験は機能制限がほぼ無しで30日間の利用が可能です。
簡単な紹介動画もありますので、興味のある方はぜひお試しを。決定木分析もサクッとできますよ彡
↓基本操作になれてきたら、コチラもオススメです。