『株式会社ずんだもん技術室AI放送局 podcast 20251211』のカバーアート

株式会社ずんだもん技術室AI放送局 podcast 20251211

株式会社ずんだもん技術室AI放送局 podcast 20251211

無料で聴く

ポッドキャストの詳細を見る

このコンテンツについて

youtube版(スライド付き) 関連リンク Agent Engineering: A New Discipline AIエージェントを開発している皆さん、自分のPCでは動いていたのに、いざ本番環境にデプロイすると予期せぬ挙動をして苦労した経験はありませんか?従来のソフトウェア開発では、入力と出力がある程度予測できましたが、AIエージェントはユーザーがどんな入力をしてくるか分からず、挙動も広範囲にわたるため、開発が非常に難しいのが現状です。 そこで、LangChainのチームは、AIエージェントを本番環境で信頼性高く運用するための新しい開発手法として、「エージェントエンジニアリング」という専門分野を提唱しています。これは、予測不可能な大規模言語モデル(LLM)ベースのシステムを、信頼できるプロダクトへと継続的に改善していくための反復的なプロセスです。そのサイクルは、「構築(Build)」「テスト(Test)」「リリース(Ship)」「観察(Observe)」「改善(Refine)」「繰り返し(Repeat)」が基本となります。ここで大切なのは、リリースがゴールではなく、新たな知見を得てエージェントを改善するための出発点である、という考え方です。 エージェントエンジニアリングを実践するには、主に3つのスキルセットが連携する必要があります。 プロダクト思考: エージェントが「何を解決すべきか」を定義し、ユーザーの課題を深く理解します。具体的なプロンプト作成や、エージェントが期待通りに動くかを評価する指標作りも含まれます。エンジニアリング: エージェントが利用するツール(外部サービス連携など)を開発したり、ユーザーインターフェース(UI/UX)を構築したり、エージェントの実行を安定させるための基盤(エラー処理、メモリ管理など)を作ります。データサイエンス: エージェントの性能や信頼性を測定するシステム(A/Bテスト、モニタリングなど)を構築し、実際の利用データから改善点を見つけ出します。 なぜ今、この分野が必要なのでしょうか? LLMは今や複雑な多段階のタスクをこなせるほど強力になりましたが、その強力さゆえに予測不可能な挙動も増えました。従来の開発では「すべてテストしてからリリース」でしたが、AIエージェントの場合、ユーザーの自然言語入力は「すべてがエッジケース」になり得ます。また、モデル内部のロジックが多いため、従来のデバッグ方法では対応しきれません。「動いている」だけでは不十分で、「意図通りに、適切に動いているか」を常に監視・評価する必要があります。 エージェントエンジニアリングでは、「完璧にしてからリリースする」のではなく、「リリースして現実世界での挙動から学ぶ」という考え方が重要です。まずエージェントの土台を作り、想定シナリオでテストし、すぐにリリースして実際のユーザー入力を観察します。そこから得られた情報をもとに、プロンプトやツール定義を改善し、このサイクルを素早く繰り返すことで、信頼性の高いエージェントシステムを構築できるのです。 AIエージェントは、これまで人間が行っていた複雑な作業をこなす大きな可能性を秘めています。この新しい開発手法をチームに取り入れることで、LLMの真の力を引き出し、信頼できるプロダクトを生み出すことができるでしょう。 引用元: https://blog.langchain.com/agent-engineering-a-new-discipline/ GitHub Copilot サブエージェントによるオーケストレーター パターンの実践 この記事は、GitHub CopilotのrunSubagentという機能を使って、ソフトウェア開発のワークフロー全体を自動化する「オーケストレーターパターン」について、新人エンジニアにも分かりやすく解説しています。 GitHub CopilotのrunSubagentとは? これは、AIエージェントが別のAIエージェントに仕事を依頼できる便利な機能です。まるで、会社で上司が部下に具体的な業務を指示するようなイメージです。 オーケストレーターパターンとは? この記事で紹介されているオーケストレーター(指揮者)エージェントは、ソフトウェア開発の最初から最後まで、すべてを自動で進めるシステムです。具体的には、ユーザーが「こんな機能が欲しい」と要望を出すと、以下の...
まだレビューはありません