『私立ずんだもん女学園放送部 podcast 20260220』のカバーアート

私立ずんだもん女学園放送部 podcast 20260220

私立ずんだもん女学園放送部 podcast 20260220

無料で聴く

ポッドキャストの詳細を見る

概要

youtube版(スライド付き) 関連リンク Measuring AI agent autonomy in practice Anthropicが、AIエージェントが実務環境でどの程度の「自律性」を持って活用されているかを分析した、非常に興味深い調査結果を公開しました。本記事は、エンジニア向けツール「Claude Code」と公開APIの膨大な利用データを匿名化して分析したもので、現場でエージェントがどのように使われ、人間との関係がどう変化しているかを解き明かしています。 まず、エージェントの自律的な連続稼働時間が大幅に増加していることが分かりました。Claude Codeのデータによると、人間が介入せずに作業を続ける時間は、わずか3ヶ月の間に約25分から45分超へとほぼ倍増しました。これはAIモデルの能力向上だけでなく、ユーザーがより難易度の高いタスクをエージェントに任せるようになり、システムとしての信頼性が高まっていることを示しています。 特に注目すべきは、経験豊富なユーザーほど監視のスタイルを「逐次承認」から「アクティブな監視」へと変化させている点です。初心者はエージェントの行動を一つずつ確認して承認する傾向にありますが、経験を積むにつれて自動承認をオンにする割合が増えます。一方で、エージェントがミスをしそうになった時の「割り込み(介入)」の頻度は高まっており、熟練ユーザーは「手放しにする」のではなく「要所で見守り、必要に応じて軌道修正する」という、より高度な連携を実現しています。 また、AI自身が「自分の分からないこと」を認識し、自ら作業を止めて人間に質問する回数は、人間が割り込む回数よりも多いことが判明しました。タスクが複雑になるほどAIからの質問が増えており、安全な自律性を保つためには、AIが不確実性を自覚して適切に「相談」する能力が不可欠であることが強調されています。 活用ドメインについては、現在は全体の約50%がソフトウェアエンジニアリング(コードの修正やビルドなど)に集中しています。多くのアクションは「やり直しが可能」な低リスクなものですが、金融やヘルスケアなどの高リスクな領域でも実験的な活用が始まっており、今後の課題として挙げられています。 新人エンジニアやエージェント開発者への提言として、Anthropicは「全ての操作に承認を求める」ような制約を設けるのではなく、ユーザーが挙動をリアルタイムで把握でき、いつでも介入できる「監視・介入の仕組み」を設計することが重要であると結論付けています。AIと人間がチームとして動く未来において、この「自律性の管理」は設計上の大きなテーマとなるでしょう。 引用元: https://www.anthropic.com/research/measuring-agent-autonomy Claude Code の Agent Skills を活用してリポジトリのオンボーディングを効率化する Wantedly Engineer Blog 本記事は、Wantedlyのエンジニアが社内ハッカソンにおいて、Anthropic社の開発者向けAIツール「Claude Code」の新機能である「Agent Skills」を活用し、新人エンジニアがプロジェクトに加わる際の「オンボーディング(導入・環境構築)」を効率化した事例を紹介するものです。 マイクロサービス開発の現場では、新しくチームに入ったメンバーが「ドキュメントが古くて全体像が掴めない」「環境構築で謎のエラーが出る」といった問題に直面し、多くの時間を費やしてしまうことがよくあります。著者はこの課題を解決するため、Claude Codeに「リポジトリの地図」と「自動化された手順」をSkillとして組み込み、AIがメンターのように新人をガイドする仕組みを構築しました。 1. Agent Skillsによる「自走型」オンボーディングの仕組み 具体的には、2つの主要なスキルを備えたClaude Codeプラグインを作成しています。 /onboarding: 対話を通じてリポジトリの設計思想やディレクトリ構成を学習する。/setup: 開発環境のセットアップを半自動で実行する。 2. AIを賢いメンターにするための3つの工夫 単にドキュメントを読み込ませるだけでなく、Agentが適切に動くための工夫が凝らされています。 リポジトリの「お作法」をコンテキスト化する: READMEには書かれない「どの処理をどこに書くべきか」という設計規約や、推奨・非推奨の...
まだレビューはありません