『マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20260309』のカバーアート

マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20260309

マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20260309

無料で聴く

ポッドキャストの詳細を見る

概要

関連リンク 手動でのコーディングをやめていく際のメモ 本書は、圧倒的な能力を持つ「Claude Opus 4.6」の登場をきっかけに、エンジニアのアイデンティティであった「自らコードを書くこと」を手放し、AIエージェント(Coding Agent)と全面的に協働するスタイルへ移行した実践的な記録です。新人エンジニアの方にとっても、これからの開発の「当たり前」を知る上で非常に示唆に富む内容となっています。 移行にあたり、著者は以下の2つの大きな方針を立てました。 あらゆる業務のドキュメント化 AIは人間と比べてコンテキスト(文脈)を保持し続ける能力が劣るため、実装方針のブレを防ぐ必要があります。そのため、あらゆる情報を/docsディレクトリに保管し、AIが常に参照できるようにしました。さらに、過去のセッション情報をAIが自ら検索できる仕組みを構築し、情報の非対称性を解消しています。 人間とAIの役割分担(境界線)の明確化 AIに丸投げするのではなく、責任の所在と得意分野を整理しています。 人間の役割: 要件・仕様の整理、ビジネスの核となる「ドメイン設計」、AIへの指示と成果の受け入れ、そしてコードの最終的なレビューです。AIには「良いものを作りたい」という内発的な動機がないため、人間が明確な信念を持って成果物をジャッジする必要があります。AIの役割: アプリケーションの具体的な設計・実装・デプロイ、および自分自身が動きやすいようにするための環境整備(静的解析やテストの自動化など)を担当します。 実際の運用では、開発ツールを「Cursor」から「Claude Code(AI本体)」を主軸に据え、Cursorはコードを確認するための「ビューワー」として利用するスタイルに変更されました。Git操作やデプロイといったCLIで行う作業もすべてAI経由で行うことが推奨されています。 このスタイルに移行した結果、1日あたりのプルリクエスト(PR)作成数が従来の2倍(1〜2個から3〜4個)に増加し、コード品質も維持できているという驚くべき成果が出ています。 一方で、人間がやらなければならない「退屈な作業」も浮き彫りになりました。それは、AIがアクセスできない情報(口頭でのやり取りやCLIで触れない外部サービスの情報)をAIに伝達する「橋渡し」の作業です。 これからのエンジニアには、単にコードを書くスキル以上に、AIを「部下」や「パートナー」として使いこなし、システムの全体像を設計・管理する「監督」のような視点が求められるようになるでしょう。 引用元: https://zenn.dev/koyo_k0/articles/c4f90b2ff722e0 New Research Reassesses the Value of AGENTS.md Files for AI Coding AIコーディングエージェント(ClaudeやCursor等)にプロジェクトの文脈を伝えるため、AGENTS.mdや.cursorrules、CLAUDE.mdといった「指示ファイル」をリポジトリに配置する手法が急速に普及しています。しかし、チューリッヒ工科大学(ETH Zurich)の最新の研究により、これらのファイルが必ずしもAIのパフォーマンスを向上させず、場合によっては逆効果になるという衝撃的な実証結果が報告されました。 研究チームは、既存のベンチマークがAIに学習されている可能性を考慮し、138件のリアルなPythonタスクを含む独自のデータセット「AGENTbench」を構築。Claude 3.5 SonnetやGPT-5(プレビュー版)などの主要モデルを用い、「指示ファイルなし」「AI生成のファイルあり」「人間が書いたファイルあり」の3パターンで、タスク成功率と推論コスト(ステップ数)を検証しました。 1. 研究で明らかになった驚きの事実 AI生成の指示ファイルは「有害」な場合も:AIが自動生成したコンテキストファイルを使用すると、タスクの成功率が平均3%低下しました。それだけでなく、AIが無駄な手順を踏むようになり、推論コストが20%以上も増大しました。人間が書いたファイルでもコスト増:人間が作成したファイルは成功率を平均4%向上させましたが、手順数は増え、コストが最大19%増加しました。「過剰な思考」の罠:AIの思考プロセスを分析したところ、AIが指示ファイルの記述を忠実に守ろうとするあまり、不要なテストの実行、過度なファイル探索、冗長なコード品質チェックを繰り返...
まだレビューはありません