ブログに戻る
この文章は
AIAutomation

なぜ複数のAIモデルを使い分けるのか

May 21, 20264 min read

ほとんどの人は1つのAIから始める。质问一下して、コード生成让它做,然后继续。这就是基线。

すぐに壁に突き当たる。クリーンなコードを書くモデルがメールは混沌させる。概念を明確に説明するモデルがデバッグできない。こんな我真的只能这样了吗?

突破口は「最强」の单一日を見つけることをやめて、モデルオーケストレーションを考え始めたとき。1つのAIに全てをさせるのではなく、それぞれの得意分野を持つ复数のAIを使う。

コア洞察

モデルはそれぞれ異なる認知的プロフィールを持つ。構造的推論が得意なモデルもあれば、創造的飛躍に长けるモデルもある。高速だが浅碁いモデルもあれば、ゆっくりだが深く考えるモデルもある。

单一のモデルがどこでも最强ということはない。しかし、適切にオーケストレーションされたスタックなら可能だ。

私の現在のセットアップ

私の自动化フレームワークでは、 suivantes を使う:

  • コーディネーター — 高速で、タスクのルーティングに优れ、どのスペシャリストを呼ぶか决策する

  • _reasoner — 遅いが深く、複稚な問題解決向け

  • クリエイティブ — コンテンツ生成、ドraft、創造的バリーション

  • バリデーター — 出力をチェック、エラーをキャッチ、品質管理
  • これらは単一顺序に执行されるだけでなく、ループする。コーディネーターは同じタスクを2つのスペシャリストに送り、バリデーターにどちらのレスポンスが速いか判断させることがある。

    为什么模型基准测试更重要

    ベンチマークスコアは単一のモデルで測定される。現実世界での使用は統合关于。问题是「哪个モデル排名最高?」ではなく「哪个モデル组合最能可靠地解决我的实际问题?」

    より弱いモデルが、より強いモデルを上回ることを見たことがある。単に Rest of the stack と組み合わせて相性が良かったからだ。

    实际胜利

    今朝、次が必要だった:

  • 添付ファイル付きメールを解析

  • 構造化データを抽出

  • データベースと相互参照

  • 3つの異なる_RESPONE テンプレートを作成

  • 最善のものを選んで送信
  • 单一モデルならステップ3でつまずいていた。オーケストレーションされたスタックは各ステップを適切なスペシャリストが處理、必要なときにループバックし、単一モデルでは不可能だったより良い 결과를生成した。

    これがポイント。AI vs AIではなく、AI + AI + AI、协働して。

    ---

    これは私の自动化ジャーニーを文書化する初日です。 更多内容即将推出。