/note/tech

「そもそも生成AIでやるべきでない問い」に、企業が挑んでしまう問題

要約:

■ 1. 問題提起

  • わりと複数の企業のお悩みが「そもそも生成AIでやるべきでない問い」にチャレンジして疲弊している
  • 大企業が生成AIを導入してうまくいかないケースの多くはツールの性能不足というより業務設計がズレている印象がある
  • もう少し正確に言うと「AIが苦手な問い」をそのまま投げている
  • 当然苦戦している

■ 2. AIが苦手な仕事の特徴1:完璧性を要求する仕事

  • 生成AIは確率分布で未来を予測したり答えを予測するマシーンである
  • つまり「確率的に間違えが発生する」ことは仕様の一部である
  • そもそも100%の正しさを前提とする業務は苦手である
  • 正解が一意で厳密な業務(数式の厳密計算・機械語や厳密仕様のコード生成など1文字違いで壊れる領域)
  • 誤りのコストが致命的な業務(医療・法務・安全領域の最終判断・断定的なファクトチェック)
  • 見た目の細部が品質を決める業務(複雑な手指・ポーズなど局所の破綻がそのまま品質事故になる制作)
  • この場合AIがイケてないのではなく我々がAIにあたえる業務設計が間違っている
  • 「細部の品質が100%でなくてもいいから成果がでる」や「成功率100%を要求されない」をみつけてAIに与えることが大事である

■ 3. AIが苦手な仕事の特徴2:長く連鎖する仕事

  • もうひとつの落とし穴がこれである
  • 例えば精度90%の仕事を10回連続成功する確率は34%である
  • つまり操作ステップが長すぎて全てのステップで成功しないといけない問題も相性が悪い
  • 要は各ステップの成功確率が高くても鎖の長さが増えれば落ちる
  • 「単発なら正確」なのに「沢山連結すると精度がでない」という問題である
  • なのでAIに仕事を渡すなら「短い単位の仕事」で「途中で人間が介入できる」構造にしておく
  • 冷蔵庫をあけ食材をとりだしカットして火をいれて調味料で味をととのえるようなロボットは非推奨である
  • レトルト食品をレンチンしてくれるロボを作りましょう

■ 4. AIが得意な仕事:全体感が正しければうまくいく仕事

  • 逆に生成AIが得意なのは「全体感が正しければ成果になる仕事」である
  • 適切な情報が渡されているならば多くの場合うまくいく
  • 例えばイベントの進行案(台本たたき台・タイムテーブル案・想定Q&A・盛り上げポイント・リスク分岐など)
  • 企画提案書へのフィードバック(論点漏れ・反論想定・構成・比較軸・刺さる言い回しの案出)
  • 金融商品のポートフォリオの運用原則の策定
  • 共通点は「厳密さ」より「筋の良さ」「網羅性」「比較軸」「言い回し」「観点」が価値になるところである
  • つまり確率的なブレを下流のエクスキューションで吸収できる領域である

■ 5. AIで正確性を出せる分野:大数の法則が効く仕事

  • ここまで「AIは完璧性が苦手」と書いたが逆にAI単体でも運用しだいで正確性を出せる分野もある
  • ポイントはシンプルで「大数の法則」や「平均回帰」が効くタイプの仕事である
  • つまり一発勝負じゃなくて試行回数を増やすほどブレが相殺されて平均が安定していく領域である
  • 「1回の正解」ではなく「1000回の平均」が正解になる仕事である
  • たとえばマトを鉄砲で撃つ作業をイメージする
  • 1発だけだと確率的に外れることがあるが1000発撃ったらどうか
  • 1000発の平均の着弾点を測定したら1000発撃った平均値は実質的にマトの中心に寄っていく
  • これがAIで正確性を作れるパターンである
  • 具体例として要約の精度を「集合知」で上げる・文章の改善(推敲)を反復で収束させる・分類タグ付け優先順位付けみたいな集計系・A/Bテストや広告文案など統計で勝ちが決まる領域がある

■ 6. AIに精度を持たせる方法:治具(ジグ)の活用

  • それでもどうしてもAIで精度がほしいなら人間がまっすぐの直線を引くときに定規をつかったり円を完璧にかくときにコンパスが必要である
  • こういった道具を治具(ジグ)という
  • どうしてもAIに精度100%を目指す仕事をさせたい場合は同様にAIのための定規・分度器となるようなツールをつくりそれをAIに操作させる
  • 計算が苦手ならPythonや計算機をコールさせるようにする
  • 完璧な時系列情報の列挙なら資料から引っ張ってくる
  • このように厳密でなければならないこと(数字計算やファクト)はAIから100%正確さが保証できる機械にアウトソースする
  • AIが担当するのは「ここで計算が必要かどうか」というより曖昧性の高い問にシフトさせることで問題を解決できる
  • AIに正確に答えさせるのではなくAIに正確な道具を使わせるこれが現実的な解法である

■ 7. AIと人間の役割分担

  • 「AIが考えて人間が完璧に執行する」のほうがたいていうまくいく
  • イラストでいうならば「AIがテーマを決め必要な構成要素の素案を出しプロがしっかり描く」ほうが「プロがテーマを決め必要な構成要素の素案を出しAIがしっかり描く」よりも品質がよくなる
  • そういうことを考えると「経営者が考えてAIが完璧に執行する」よりも「AIが経営を考えて人間が道具を使って完璧に執行する」ほうが多くの場合うまくいく
  • 経営判断は「全体感」が求められ執行は「細部の完璧性」が求められるからである
  • あるいは経営は「確率論」が大事な処理であり執行は「決定論」が要求されるからである

■ 8. 皮肉な結論

  • つまり生成AIの特性を考えると皮肉にも「数字だけを見て現場をコストカットしようとする経営者」が「最もAIで代替しやすい人材」で「最も費用対効果がよい」DX施策となる
  • 我々マネジメント層のほうがあとがない
  • AIに最初にリプレイスされないためにも経営者もマネージャーも現場やユーザーともっとふれあって業務ドメインの解像度を高めていく
  • 手を動かす人は思ってるより重要である
  • リストラとかを考えてる場合じゃない

■ 9. まとめ

  • まずは業務フローをできる限りシンプルに
  • 正確性が必要なところには正規表現やプログラムなど生成AIでない仕組みを
  • そもそも正確性に依存しない業務で自社をドライブするにはという問いにコミットする
  • わりと今の現場で起きている「AI導入したけどつかえない」系の議論の大半はこれで説明できるのではないか
  • 過渡期の生みの苦しみだと思うがみんながぶつかる課題なのでナレッジシェアできるといい