『株式会社ずんだもん技術室AI放送局』のカバーアート

株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局

著者: 株式会社ずんだもん技術室AI放送局
無料で聴く

概要

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。(MC 月:春日部つむぎ、火水木:ずんだもん、金:お嬢様ずんだもん)
エピソード
  • 私立ずんだもん女学園放送部 podcast 20260123
    2026/01/22
    youtube版(スライド付き) 関連リンク Mackerel MCPサーバーを活用してAIでISUCONを解いてみよう——問題発見から改善まで全部AIで! 本記事は、Webアプリケーションのパフォーマンス改善を競う「ISUCON」を題材に、MackerelのAPM(Application Performance Management)機能と、新たに提供開始された「Mackerel MCPサーバー」を活用して、AIが自律的に問題を解決できるかを検証したレポートです。 「推測するな、計測せよ」をAIで実践 パフォーマンス改善の鉄則は、当てずっぽうでコードを直すのではなく、まず「どこが遅いのか」を正確に把握することです。今回の検証では、Mackerelを通じて以下のデータを収集し、AI(Claude Code等)がMackerel MCPサーバー経由でこれらのデータにアクセスできる環境を構築しました。 インフラ情報: CPUやメモリの使用率(ホストメトリック)アプリ情報: どのエンドポイントやDBクエリが遅いか(OpenTelemetryによるトレース) 特に、コードを書き換えずに計装できる「OBI(OpenTelemetry eBPF Instrumentation)」の活用についても触れられており、既存のシステムに手を加えにくい現場でも役立つTipsが紹介されています。 AIが自律的にスコアを27倍に向上 AIに対して「スコアの最大化」を目標とし、「Mackerel MCPサーバーなどのツール活用」と「改善プロセスの記録」を指示した結果、驚くべき成果が得られました。 結果: 初期状態の1,810点から、最終的には50,280点までスコアが上昇。改善の内容: AIは「特定のAPIレスポンスが遅いこと」と「その処理中にDBロックを保持していること」を特定。外部APIリクエストをトランザクション外に移動させるという、熟練エンジニアのような的確な判断を下しました。 新人エンジニアへのメッセージ この事例の重要なポイントは、AIにただ「直して」と頼むのではなく、「判断材料となる正確なデータ(観測性)」を与えた点にあります。Mackerelのような監視ツールでシステムを可視化することは、人間がデバッグしやすくなるだけでなく、AIを強力なパートナーとして活用するための必須条件になりつつあります。 ISUCONの過去問とMackerelの無料枠を活用すれば、誰でもこの「AIによる自律改善」を体験できます。最新のAI技術と「計測」の重要性を学ぶ第一歩として、非常に示唆に富む内容となっています。 引用元: https://mackerel.io/ja/blog/entry/tech/ai-isucon Human-in-the-Loop な AI エージェントを支えるガードレール設計 Wantedly Engineer Blog ビジネスSNS「Wantedly」が提供する、スカウト業務を自動化する「AIエージェントモード」を題材に、AIの安全性を担保する「ガードレール設計」の実践的な手法を解説した記事です。新人エンジニアの方でも理解しやすいよう、AIを実務に組み込む際の「信頼性の高め方」と「エラー対策」に焦点を当てて要約します。 1. なぜ「ガードレール」が必要なのか AIエージェントがユーザーの指示に従って動作する際、その出力が不適切だったり、安全性を欠いたりしてはいけません。そこで、AIの出力をチェックする「ガードレール層」を設けます。 一般的なサービス(AWSのマネージドサービス等)や単純なNGワード設定だけでは、採用業務特有の「文脈に沿った細かいニュアンス」を判定しきれません。そのため、Wantedlyでは「ドメイン知識をプロンプトとして与えた、ガードレール専用のLLM」を用意する設計を採用しました。 2. 回答の揺らぎを抑える「Self-consistency」 LLMは確率的に動作するため、同じ質問でも回答が毎回異なる「揺らぎ」が発生します。この不安定さを解消するために採用されたのがSelf-consistency(自己整合性)という手法です。 仕組み: 1回だけの判定で決めつけず、同じ指示に対して複数回(例:5回)推論を行います。判定方法: 各回の結果をスコアリングし、その「平均値」が一定の閾値を超えた場合にのみ「不適切(Unsafe)」と判断します。 これによって、1回の偶然の誤判定に左右されない、安定したガードレールが実現できます。 3. レート制限を回避する「リトライ戦略」 Self-consistencyで複数回のAPIコールを行うと、APIプロバイダーのレート制限(回数制限)に当たりやすくなります。これを回避するために、...
    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20260122
    2026/01/21
    youtube版(スライド付き) 関連リンク Agent SkillsがVercelに乗っ取られそうになっている件について AIエージェントの機能を拡張するためのオープン規格「Agent Skills」が、Vercelの強力なエコシステムによって急速に塗り替えられようとしています。本記事は、Anthropicが提唱したこの規格を、Vercelがどのように自社エコシステムへ取り込もうとしているか、その動向と懸念点を解説しています。 1. Agent Skillsとは何か? AIエージェントが利用できる「再利用可能な機能(スキル)」の共通規格です。一度インストールすれば、エージェントに特定の知識や実行能力を付与できます。Claude Code、Cursor、GitHub Copilotなど、主要なAIツールで急速に採用が広がっています。 2. Vercelの波状攻撃:ツールとマーケットプレイスの提供 Vercelは、スキルのインストールを劇的に簡略化するnpx add-skillや、管理用のnpx skillsというツールを次々と公開しました。さらに、2026年1月21日にはスキルのマーケットプレイス「Skills.sh」を発表しました。 これまでのマーケットプレイスはGitHubのスター数による評価でしたが、Skills.shは実際のインストール数に基づいたランキングを提供しており、実用性の高いスキルが見つけやすくなっています。 3. 背景にある「ディレクトリ分散問題」の解決 現在、Agent Skillsは「AIツールごとにスキルの保存場所がバラバラで管理しにくい」という課題を抱えています。本来は開発者コミュニティで合意形成が必要な部分ですが、Vercelは独自のツール群でこの問題を強引に解決し、デファクトスタンダード(事実上の標準)の座を奪おうとしています。 4. 今後の展望と懸念:セキュリティと仕様の独占 現在はGitHub上のスクリプトを直接インストールする形式のため、悪意のあるコードが含まれるセキュリティリスクがあります。今後、Vercelはnpmのような「専用レジストリ(パッケージ配布所)」を構築する可能性がありますが、これには以下の懸念が伴います。 仕様の主導権の移転: 本来の策定者であるAnthropicではなく、配布プラットフォームを持つVercelが独自に仕様を改定できてしまう。特定環境への依存: Next.jsやNode.jsといった、Vercelが得意とする技術スタックへの依存が強まる恐れがある。 まとめ 新人エンジニアの皆さんは、Next.jsなどで馴染み深いVercelが、AIエージェントの分野でも「使いやすさ」を武器に急拡大している点に注目してください。非常に便利になる一方で、特定の企業が規格を独占するリスクも含んでおり、今後のエージェント開発において無視できない大きな動きとなっています。 引用元: https://zenn.dev/tkithrta/articles/b7afbf76e7bb31 The Agentic AI Handbook: Production-Ready Patterns 2025年末から2026年年始にかけて、AIエージェント界隈では「静かな革命」が起きました。Linus Torvalds氏やShopify CEOのTobias Lütke氏といった著名な技術者たちが、AIエージェントを実務に深く取り入れ始めたのです。本記事は、GitHubで大きな反響を呼んだ「Awesome Agentic Patterns」をベースに、AIエージェントをデモレベルから「本番環境(プロダクション)」で通用するレベルに引き上げるための113の設計パターンを解説したガイドです。 なぜ「パターン」が必要なのか 多くのエンジニアが「デモでは動くが、本番では失敗する」という壁に直面します。これは、エッジケース、コンテキスト制限、セキュリティ、そして「人間との協調」といった現実世界の複雑さが原因です。本ハンドブックでは、これらの課題を解決するために、実務で検証済みのパターンを以下の8つのカテゴリーに分類しています。 オーケストレーションと制御: エージェントの「脳」となる、計画や実行順序の制御。ツール利用と環境: APIやDBなどの「手」となる外部インターフェースの設計。コンテキストとメモリ: 限られた記憶容量の中で知識を管理する「精神」。フィードバックループ: 自己修正や評価を通じて出力を改善する「成長」。UXとコラボレーション: 人間とエージェントが連携するための「パートナーシップ」。信頼性と評価: テストや評価、観測可能性を担保する「品質保証」。学習と適応: 経験からスキルを蓄積する「進化」。...
    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20260121
    2026/01/20
    youtube版(スライド付き) 関連リンク Cisco and OpenAI redefine enterprise engineering with AI agents CiscoとOpenAIが提携し、AIエージェント「Codex」をエンタープライズ規模のソフトウェア開発に本格導入したという、非常にエキサイティングなニュースです。これまでの「コード補完ツール」としてのAIから一歩進み、「自律的にタスクを遂行するチームの一員」としてAIを活用するフェーズに入ったことを示しています。 新人エンジニアの皆さんが注目すべきポイントは、以下の3点に集約されます。 1. 「補助」ではなく「自律(エージェント)」への進化 従来のAIは、エンジニアが書いているコードの続きを提案する「補完」が主流でした。しかし、今回Ciscoが導入したCodexは「エージェンシー(自律性)」を備えています。 複数のリポジトリを跨いでコードの依存関係を理解する。CLI(コマンドライン)を操作し、「コンパイル→テスト→エラー修正」というループを自律的に回す。既存のセキュリティやガバナンスのルールに従って行動する。 このように、エンジニアが日常的に行う「一連のワークフロー」を肩代わりできるのが大きな特徴です。 2. 驚異的な実務成果 Ciscoの複雑な大規模システム(特にC/C++主体のコードベース)において、具体的な成果が出ています。 ビルドの最適化: 15以上のリポジトリを分析し、ビルド時間を約20%削減。月間1,500時間もの工数を削減しました。バグ修正の自動化: 「CodeWatch」という仕組みにより、数週間かかっていた修正作業を数時間に短縮。バグ修正の処理能力は10〜15倍に向上しました。大規模移行: UIフレームワーク(React)のバージョン移行など、単調で膨大な作業をAIが代行し、数週間かかるはずの工程を数日で完了させました。 3. AIとの新しい働き方 現場のエンジニアは、「AIをツールではなくチームメイトとして扱うことで最大の利益が得られた」と語っています。AIに「計画書」を作成させ、人間がその計画と成果物をレビューするというスタイルです。 これからのエンジニアには、自分でコードを書く力に加え、「AIエージェントに的確な指示を出し、そのプロセスを監督・検証する能力」がますます求められるようになります。AIにルーチンワークを任せ、人間はよりクリエイティブな設計や、重要な判断を伴う業務に集中できる、ポジティブな未来が描かれています。 引用元: https://openai.com/index/cisco [翻訳] Anthropic ハッカソン優勝者による Claude Code 完全ガイド 本記事は、Anthropicが開発したCLIベースのAIエージェント「Claude Code」を10ヶ月間使い込み、ハッカソンでの優勝経験も持つエンジニアによる実践的なカスタマイズガイドです。新人エンジニアの方でも、これを読むことでClaude Codeを単なるチャットツールではなく、強力な「開発パートナー」へと進化させる方法が理解できます。 主な要点は以下の通りです。 効率化を支える「Skill」と「Slash Command」 特定の指示や定型ワークフロー(リファクタリング、テスト駆動開発など)をプロンプトの短縮形として登録できます。例えば、コードの整理を /refactor-clean というコマンド一つで実行できるようになり、何度も同じ指示を書く手間を省けます。 自動化を仕組み化する「Hooks」 「ファイル編集後」や「特定のコマンド実行前」といったイベントをトリガーに動作を自動化できます。例えば、編集後に自動でフォーマッタ(Prettier)を動かしたり、型チェック(tsc)を走らせたりすることで、ケアレスミスを防ぎながら開発の質を保てます。 精度を向上させる「Sub Agent」 全ての作業を一つのAIで行うのではなく、設計担当、レビュー担当、テスト担当といった「役割を絞った子エージェント」にタスクを委譲します。範囲を限定することで、AIの思考がより鋭くなり、より正確なアウトプットが得られます。 外部ツールと繋がる「MCP」と「Plugin」 GitHubやデータベース、ブラウザ操作などの外部サービスと連携するための仕組みです。また、LSP(Language Server Protocol)のプラグインを導入することで、AIがコードの文脈を深く理解し、型チェックや補完を強力にサポートしてくれます。 最重要ポイント:...
    続きを読む 一部表示
    1分未満
まだレビューはありません