7-1-2 CRISP-DM・CRISP-ML・アジャイル・ウォーターフォール AIプロジェクトの進め方と方法論

AIプロジェクトを「なんとなく進める」と、どこかで必ず迷子になります。
どの順番でデータを集めるのか、モデルの評価はいつ行うのか、うまくいかなかったときにどこに戻るのか——こうした問いに答えるための「地図」が、プロジェクトの方法論です。

この章では、AIプロジェクトを進めるための代表的な四つの方法論を見ていきます。
それぞれ生まれた背景と得意な場面が異なります。
どれが「正解」かではなく、どれが「この状況に合っているか」を考えながら読んでみてください。

ウォーターフォール

ウォーターフォール(Waterfall)は、プロジェクトを「要件定義→設計→開発→テスト→リリース」という段階に分け、上から下へ順番に進める開発手法です。
滝(ウォーターフォール)が上から下へと流れるように、前の工程が完了してから次の工程に進みます。

ウォーターフォールの強みは、計画が明確で管理しやすい点にあります。
何をいつまでに完成させるかが最初から決まっているため、大規模なプロジェクトや、要件が最初から明確な場合に向いています。

しかし、AIプロジェクトとの相性はあまりよくありません
AIの開発では、データを集めてみて初めてわかることが多く、モデルを作ってみて初めて「要件が間違っていた」と気づくことがよくあります。
ウォーターフォールは一度前の工程に戻ることが難しいため、AIのような「試行錯誤が前提」のプロジェクトには窮屈な方法論といえます。

アジャイル

アジャイル(Agile)は、小さな単位で開発・評価・改善を繰り返しながら進める開発手法です。
「アジャイル」とは「素早い・機敏な」という意味で、変化への対応力を重視します。

アジャイルでは、最初から完璧な計画を立てようとしません。
小さな機能を短い期間(スプリントと呼ばれる1〜4週間のサイクル)で作り、実際に使ってもらいながらフィードバックを受け、次のサイクルで改善していく——この繰り返しがアジャイルの本質です。

AIプロジェクトとの相性は、ウォーターフォールより良好です。
データを集めながら方針を修正し、モデルを試しながら要件を調整する——そういった柔軟な進め方がアジャイルの枠組みの中で自然にできます。
ただし、計画が流動的になりやすいため、ステークホルダーとの密なコミュニケーションが欠かせません。

CRISP-DM

CRISP-DM(Cross-Industry Standard Process for Data Mining)は、データ分析・機械学習プロジェクトのための標準的なプロセスモデルです。
1990年代に策定され、業界を超えて広く使われてきました。

CRISP-DMは六つのフェーズで構成されています。
①ビジネス理解——何を解決したいのか、ビジネス上の目標を明確にする。
②データ理解——使えるデータは何か、データの質と量を把握する。
③データ準備——データを学習に使える形に加工・整理する。
④モデリング——機械学習モデルを構築・調整する。
⑤評価——モデルがビジネス目標を達成しているか検証する。
⑥展開——モデルを実際のシステムに組み込み、運用を開始する。

CRISP-DMの重要な特徴は、各フェーズを行き来できることです。
モデリングをしていて「データが足りない」と気づいたらデータ理解に戻り、評価をしていて「そもそも目標設定が間違っていた」と気づいたらビジネス理解に戻る——現実のデータ分析の試行錯誤を、プロセスの中に組み込んでいます。

CRISP-ML

CRISP-ML(CRISP-ML(Q)とも呼ばれる)は、CRISP-DMを機械学習プロジェクトに特化させた発展版です。
2020年代に提唱され、CRISP-DMでは十分にカバーされていなかった品質管理(Quality)の観点を強化しています。

CRISP-DMが「データ分析」全般を対象にしていたのに対して、CRISP-MLは「機械学習モデルの開発と運用」に焦点を絞っています。
モデルの公平性・信頼性・モニタリングといった、現代の機械学習プロジェクトで特に重要なテーマが組み込まれている点が特徴です。

CRISP-DMが「地図の初版」だとすれば、CRISP-MLは「AIの時代に合わせてアップデートされた改訂版」といえます。

四つの方法論を使い分ける

四つの方法論は、それぞれ得意な場面が異なります。

ウォーターフォールが力を発揮するのは、要件が最初から厳密に決まっていて、途中で変更が難しいプロジェクトです。
銀行の基幹システムや航空機の制御システムのように、安全基準や法的要件が厳しく、段階的な承認が必要な開発に向いています。「後から変えられない」という制約が強い場面では、最初にすべてを決めきるウォーターフォールの厳密さが強みになります。

アジャイルが力を発揮するのは、ユーザーの反応を見ながら柔軟に方向を変えていく必要があるプロジェクトです。
スマートフォンアプリの開発やECサイトの機能改善のように、小さな改善を繰り返しながらユーザー体験を高めていく場面に向いています。「作ってみて初めてわかる」ことが多いAIプロジェクトとも、相性が良い方法論です。

CRISP-DMは、顧客の購買データを分析して離脱予測モデルを作るプロジェクトのように、データ分析・機械学習プロジェクト全般の進め方の枠組みとして使われます。
ビジネス理解からスタートして展開まで、六つのフェーズを行き来しながら進められる点が強みです。

CRISP-MLは、医療画像の診断AIを開発・運用するプロジェクトのように、品質・公平性・モニタリングが特に重要な機械学習プロジェクトに向いています。
CRISP-DMより厳密な品質管理の観点が求められる場面で選ばれます。

現実のAIプロジェクトでは、CRISP-DM・CRISP-MLの枠組みを使いながら、各フェーズの中ではアジャイル的に小さく試して改善を繰り返す——という組み合わせがよく見られます。

まとめ

ウォーターフォール → 要件定義→設計→開発→テスト→リリースという段階を順番に進める開発手法。計画が明確で管理しやすい反面、AIのような試行錯誤が前提のプロジェクトとは相性が悪い
アジャイル → 小さな単位で開発・評価・改善を繰り返しながら進める開発手法。変化への対応力を重視し、AIプロジェクトとの相性が良い
CRISP-DM → データ分析・機械学習プロジェクトのための標準的なプロセスモデル。ビジネス理解→データ理解→データ準備→モデリング→評価→展開の六フェーズで構成され、各フェーズを行き来できる
CRISP-ML → CRISP-DMを機械学習プロジェクトに特化させた発展版。品質管理の観点を強化し、モデルの公平性・信頼性・モニタリングなどの現代的なテーマを組み込んでいる

next ▶ Python・Docker・Jupyter Notebook・クラウド AIを世に出すための技術基盤