さんしょこ

朝倉山椒の個人的メモ

【書籍レビュー】機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック

この分野に対する投稿者 (私) の知識レベル

  • 紹介されている方法論の名前と意義のイメージを大体掴めている
  • 実際に外部ライブラリを利用して、当該の方法論をちょっとは使ったことがある

本の要約

機械学習モデルの解釈手法として有名な4種類の方法論 (PFI・PD・ICE・SHAP) に対して、それらの意義、理論の概略、仕組み (アルゴリズム)、使い方、注意点を簡潔にまとめている。

  • (参考)
    • PFI (Permutation Feature Importance): 特徴量の重要度
    • PD (Partial Dependence): 特徴量と予測の平均的な関係
    • ICE (Individual Conditional Expectation): 特徴量と予測の関係 (for 個別のインスタンス)
    • SHAP (SHapley Additive exPlanations): モデルが何故そのような予測値を出しているのか

誰にオススメか?

  • 実務でRandom Forestなどの機械学習モデルを構築できる人 (読むための要件)
  • 情報学・コンピュータサイエンスの非専門家 (でも読める)
  • 4種の解釈手法 (PFI・PD・ICE・SHAP) について、何も知らない人〜なんとなくライブラリを利用している人

良かった点

  • 機械学習の実務者 (非専門家) にとって、記述のレベルがちょうど良い。過度に丁寧であったり、厳密性を求めすぎていない。適度な量の数式と、それを直截的に反映したコードが記載されており、理系出身者であれば比較的スッと入ってくると思う。
  • 独自に実装したコードで仕組みが解説された後、実問題に対して外部ライブラリを利用した解析方法も紹介されているため、手法の理解と実用性の両方を取れる。
  • 各章では、それぞれの手法の意義および使い方を説明した後、手法の短所や使用上の注意点が解説されている。伏線を回収するごとく、前章のウィークポイントを後続の手法でカバーする構成になっており、全体の流れを理解しやすい。
  • 脚注がちょいちょいタメになる。アドバンス過ぎる話や、トリビア的なこぼれ話というより、知っていると実務で役立ちそうな豆知識が豊富。

気になった点

  • 個人的に、線形回帰モデルに当てはめて理解を深めるパートは、自明で冗長感があったり、自明なことを丁寧に説明しようとして逆に説明が煩雑に感じる箇所もあった。内容としては確かに理解を深める効果はあると思うので、もう少しあっさりでも読みやすかったかもしれない。

この本でカバーされていない点

あくまで4種の解釈手法 (PFI・PD・ICE・SHAP) の解説に絞っているため、それ以外のExplainable AIの手法、当該領域の全体感、当該領域における4手法の立ち位置などはわからない。相補的な資料としては、たとえば、少し前に話題になった "Interpretable Machine Learning" の邦訳版が参考になる。

総合評価

★★★★☆