『株式会社ずんだもん技術室AI放送局 podcast 20260611』のカバーアート

株式会社ずんだもん技術室AI放送局 podcast 20260611

株式会社ずんだもん技術室AI放送局 podcast 20260611

無料で聴く

ポッドキャストの詳細を見る
youtube版(スライド付き) 関連リンク Claude Fable 5 のプロンプティング 本ドキュメントは、新モデル「Claude Fable 5」および「Claude Mythos 5」を効果的に活用するための、プロンプティングと設計(スキャフォールディング)のベストプラクティスを解説したガイドです。旧モデル(Opus 4.8)からの進化を踏まえ、エンジニアが押さえるべき要点をまとめました。 1. Claude Fable 5 の主な進化 Fable 5は、従来は複雑すぎたり長時間を要したりしたエンドツーエンドの課題で真価を発揮します。 長期の自律性と正確性: 数日間にわたる目標に向け、指示を保持したまま自律実行します。複雑なタスクでも、一回の実行(シングルパス)で正確に実装する能力が向上しました。ビジョンとデバッグの強化: 技術的な画像や図の解釈、リポジトリ全体を対象としたデバッグ精度が大幅に向上しています。高度な並列協調: 複数の並列サブエージェントをディスパッチし、非同期に通信させながらタスクを進行させることが得意です。 2. プロンプティングのコツ 指示追従能力が大幅に向上したため、プロンプトの設計思想をアップデートする必要があります。 エフォート(Effort)レベルの調整: high(デフォルト)や最難関タスク用のxhighだけでなく、日常のタスクにはlowやmediumを活用します。低設定でも旧モデルを凌駕するパフォーマンスを発揮し、速度とコストを節約できます。指示はシンプルに: 指示追従が極めて高いため、細かなルールを列挙せず「簡潔に記述して」などの一言で余計な説明を排除できます。境界(制約)の明示: 自律性が高く、依頼していない不要な関連作業まで実行することがあるため、「やってはいけないこと」を明示的に定義します。メモリの提供: Markdownファイルなどのシンプルな履歴ファイルを用意し、これまでの実行の教訓を記録・参照させるとパフォーマンスがさらに向上します。 3. 推奨されるシステム設計の変更 応答テキスト内での思考(推論)再現の禁止: プロンプトで「思考プロセスを回答に書き出して」と要求すると、拒否(refusal)を誘発する原因になります。思考過程が必要な場合は、専用の「適応的思考(adaptive thinking)」ブロックを読み取ります。非同期実行とタイムアウトの調整: 深い推論や自律実行には数分〜数時間かかる場合があります。クライアント側での接続タイムアウトを防ぐため、非同期ジョブとして進捗を確認できる設計に切り替えます。古いプロンプトのリファクタリング: 旧モデル向けの細かすぎるスキル指示は、Fable 5本来の力を抑制してしまうため、不要な指示は積極的に削除します。 Fable 5は、細かくAIを誘導するのではなく「適切な目標と制約を与えて自律的に解決させる」という、次世代のエージェント開発に適したモデルです。 引用元: https://platform.claude.com/docs/ja/build-with-claude/prompt-engineering/prompting-claude-fable-5 DiffusionGemma: 4x faster text generation Googleは、テキスト生成の推論速度を最大4倍に高速化する実験的なオープンモデル「DiffusionGemma」を発表しました。Apache 2.0ライセンスで公開されており、GPUの処理能力を最大限に引き出す新しいアプローチ「テキスト拡散」を採用しています。 ■ 従来のモデルとの違いと「テキスト拡散」の仕組み 従来の一般的な大規模言語モデル(LLM)は「自己回帰型」と呼ばれ、文字(トークン)を左から右へ1つずつ順番に出力します(タイプライターのような動作)。この方式は、ローカル環境で1人のユーザーが実行する場合、GPUが次の文字の計算を待つ状態になり、ハードウェアの性能を活かしきれない課題がありました。 一方、DiffusionGemmaが採用する「テキスト拡散」は、画像生成AIのように「ノイズ状態から徐々に鮮明な画像を浮き上がらせる」プロセスをテキストに応用したものです。256トークン分のテキストブロックを並列かつ同時に生成・推敲し、一気に書き上げる(印刷機のような動作)ことで、GPUの計算リソースを無駄なく使い切り、圧倒的な高速化を実現しています。 ■ 主な特徴とメリット 圧倒的な推論速度:専用GPUを用いることで最大4倍の高速化を達成。NVIDIA H100で毎秒1000トークン...
adbl_web_anon_alc_button_suppression_t1
まだレビューはありません