『株式会社ずんだもん技術室AI放送局』のカバーアート

株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局

著者: 株式会社ずんだもん技術室AI放送局
無料で聴く

概要

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。(MC 月:春日部つむぎ、火水木:ずんだもん、金:お嬢様ずんだもん)
エピソード
  • 株式会社ずんだもん技術室AI放送局 podcast 20260310
    2026/03/09
    youtube版(スライド付き) 関連リンク Copilot Cowork: A new way of getting work done Microsoftが発表した「Copilot Cowork」は、AIとの関わり方を「単なるチャット」から「自律的なアクションの実行」へと進化させる画期的な新機能です。これまでのAIアシスタントは質問に答えたり文章の下書きを作ったりするのが主な役割でしたが、Copilot Coworkはユーザーに代わってMicrosoft 365上の複雑なタスクを計画・実行する「エージェント」としての側面を強く持っています。 技術的な基盤として、Microsoft 365全体の信号(メール、会議、ファイル、データなど)を統合して理解する「Work IQ」を活用しています。これにより、AIはユーザーの業務背景を深く理解した状態で、以下のような具体的なアクションを自律的に進めることが可能になります。 カレンダーの自動整理: 優先順位に基づき、会議の調整や集中時間の確保を自動で行います。会議の準備とフォロー: 関連資料からブリーフィング文書やスライドを生成し、チームへの共有まで完了させます。高度なリサーチ: 公開情報や社内データを収集・分析し、引用元を明示したレポートやExcelワークブックとしてまとめます。プロジェクト計画の策定: 競合分析から資料作成、マイルストーンの設定までを一貫して行います。 特筆すべきは、これらの作業が「バックグラウンド」で進行する点です。ユーザーがAIの提案した実行プランを承認すると、AIは裏側でタスクを進め、必要に応じてユーザーにチェックポイントでの確認を求めます。これにより、エンジニアやビジネスパーソンは「自分にしかできない創造的な仕事」に集中できるようになります。 また、インフラ面ではAnthropic社の「Claude Cowork」の技術を統合しており、特定のAIモデルに依存せず、タスクごとに最適なモデルを選択して実行するマルチモデル戦略をとっています。セキュリティ面でもエンタープライズレベルのガバナンスが適用され、サンドボックス環境で安全に動作します。 新人エンジニアにとって、このニュースは「AIをどう使いこなすか」から「AIというチームメンバーにどう仕事を任せるか」という、次世代のソフトウェア活用の形を示唆しています。本機能は2026年3月末より、Frontierプログラムを通じて順次提供が開始される予定です。 引用元: https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/09/copilot-cowork-a-new-way-of-getting-work-done/ Qwen3.5-9B:9Bクラスで異常な高性能を発揮するマルチモーダル軽量モデル 2026年3月、AlibabaのQwenチームが公開した「Qwen3.5-9B」が、AIコミュニティで「バグレベルの高性能」と大きな注目を集めています。このモデルは9B(90億パラメータ)という、一般的なPCでも動作可能な軽量サイズでありながら、かつての巨大モデル(120B級)に匹敵する驚異的な知能を備えています。 技術的な特徴として、まず「Gated Delta Networks(線形注意機構)」と「sparse MoE(疎な混合エキスパート)」を組み合わせたハイブリッドアーキテクチャが挙げられます。これにより、非常に高い推論効率を実現しており、RTX 4090などのコンシューマ向けGPUでも爆速で動作します。また、コンテキスト長はネイティブで約26万トークン、最大で100万トークンまで拡張可能となっており、長大なドキュメント解析やソースコードの理解にも最適です。 さらに、本モデルは「ネイティブ視覚言語モデル」として設計されており、テキスト・画像・動画を高度に融合して理解できます。特に動画理解においては字幕も考慮した解析が可能で、小型モデルとは思えない視覚理解力を誇ります。また、内部的に「」タグを用いた思考プロセス(Chain-of-Thought)を生成する仕組みがデフォルトで備わっており、論理的な正確性や指示追従能力が極めて高いのが特徴です。 多言語対応についても、日本語を含む201の言語・方言をサポートしており、特にアジア圏の言語において高い精度を発揮します。ライセンスはApache 2.0で、商用利用も自由です。 実際の評価では、数学、論理推論、プログラミング、指示追従といった主要なベンチマークで、同クラスのLlama 3.1-8BやGemma-3-9Bを大きく上回るスコアを記録しています。...
    続きを読む 一部表示
    1分未満
  • マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20260309
    2026/03/08
    関連リンク 手動でのコーディングをやめていく際のメモ 本書は、圧倒的な能力を持つ「Claude Opus 4.6」の登場をきっかけに、エンジニアのアイデンティティであった「自らコードを書くこと」を手放し、AIエージェント(Coding Agent)と全面的に協働するスタイルへ移行した実践的な記録です。新人エンジニアの方にとっても、これからの開発の「当たり前」を知る上で非常に示唆に富む内容となっています。 移行にあたり、著者は以下の2つの大きな方針を立てました。 あらゆる業務のドキュメント化 AIは人間と比べてコンテキスト(文脈)を保持し続ける能力が劣るため、実装方針のブレを防ぐ必要があります。そのため、あらゆる情報を/docsディレクトリに保管し、AIが常に参照できるようにしました。さらに、過去のセッション情報をAIが自ら検索できる仕組みを構築し、情報の非対称性を解消しています。 人間とAIの役割分担(境界線)の明確化 AIに丸投げするのではなく、責任の所在と得意分野を整理しています。 人間の役割: 要件・仕様の整理、ビジネスの核となる「ドメイン設計」、AIへの指示と成果の受け入れ、そしてコードの最終的なレビューです。AIには「良いものを作りたい」という内発的な動機がないため、人間が明確な信念を持って成果物をジャッジする必要があります。AIの役割: アプリケーションの具体的な設計・実装・デプロイ、および自分自身が動きやすいようにするための環境整備(静的解析やテストの自動化など)を担当します。 実際の運用では、開発ツールを「Cursor」から「Claude Code(AI本体)」を主軸に据え、Cursorはコードを確認するための「ビューワー」として利用するスタイルに変更されました。Git操作やデプロイといったCLIで行う作業もすべてAI経由で行うことが推奨されています。 このスタイルに移行した結果、1日あたりのプルリクエスト(PR)作成数が従来の2倍(1〜2個から3〜4個)に増加し、コード品質も維持できているという驚くべき成果が出ています。 一方で、人間がやらなければならない「退屈な作業」も浮き彫りになりました。それは、AIがアクセスできない情報(口頭でのやり取りやCLIで触れない外部サービスの情報)をAIに伝達する「橋渡し」の作業です。 これからのエンジニアには、単にコードを書くスキル以上に、AIを「部下」や「パートナー」として使いこなし、システムの全体像を設計・管理する「監督」のような視点が求められるようになるでしょう。 引用元: https://zenn.dev/koyo_k0/articles/c4f90b2ff722e0 New Research Reassesses the Value of AGENTS.md Files for AI Coding AIコーディングエージェント(ClaudeやCursor等)にプロジェクトの文脈を伝えるため、AGENTS.mdや.cursorrules、CLAUDE.mdといった「指示ファイル」をリポジトリに配置する手法が急速に普及しています。しかし、チューリッヒ工科大学(ETH Zurich)の最新の研究により、これらのファイルが必ずしもAIのパフォーマンスを向上させず、場合によっては逆効果になるという衝撃的な実証結果が報告されました。 研究チームは、既存のベンチマークがAIに学習されている可能性を考慮し、138件のリアルなPythonタスクを含む独自のデータセット「AGENTbench」を構築。Claude 3.5 SonnetやGPT-5(プレビュー版)などの主要モデルを用い、「指示ファイルなし」「AI生成のファイルあり」「人間が書いたファイルあり」の3パターンで、タスク成功率と推論コスト(ステップ数)を検証しました。 1. 研究で明らかになった驚きの事実 AI生成の指示ファイルは「有害」な場合も:AIが自動生成したコンテキストファイルを使用すると、タスクの成功率が平均3%低下しました。それだけでなく、AIが無駄な手順を踏むようになり、推論コストが20%以上も増大しました。人間が書いたファイルでもコスト増:人間が作成したファイルは成功率を平均4%向上させましたが、手順数は増え、コストが最大19%増加しました。「過剰な思考」の罠:AIの思考プロセスを分析したところ、AIが指示ファイルの記述を忠実に守ろうとするあまり、不要なテストの実行、過度なファイル探索、冗長なコード品質チェックを繰り返...
    続きを読む 一部表示
    1分未満
  • 私立ずんだもん女学園放送部 podcast 20260306
    2026/03/05
    youtube版(スライド付き) 関連リンク skill-creatorから学ぶSkill設計と、Orchestration Skillの作り方 本記事は、Anthropicが提唱する「Agent Skills(エージェント・スキル)」の設計思想と、そのベストプラクティスを解説したドキュメントです。特に、スキル作成を支援するメタスキル「skill-creator」の構造を分析し、複雑なタスクをこなす「オーケストレーション型スキル」の作り方を、新人エンジニアにも分かりやすく提示しています。 1. Agent Skillsの基本と「段階的開示」 Agent Skillsとは、AIエージェントに特定のワークフローや知識を教える命令セットです。設計の核心は「Progressive Disclosure(段階的開示)」にあります。 AIの記憶領域(コンテキストウィンドウ)は限られた「公共財」であるため、最初から全ての情報を読み込ませるのではなく、必要に応じて3段階で情報をロードします。 Level 1: スキル名と説明(常に読み込む。トリガー判定用)Level 2: メインの指示(スキル発動時に読み込む)Level 3: スクリプトや参照資料(実行時に必要になったら読み込む) 2. 失敗しないスキル設計の7つのベストプラクティス 「skill-creator」の構造から、以下の汎用的な設計パターンが学べます。 指示の委譲: メインの指示書(SKILL.md)は司令塔に徹し、専門的な処理はサブエージェントに任せる。スクリプトの活用: ループや計算、ファイル操作など、AIが苦手な「確定的処理」はプログラム(Python等)に外出しする。スキーマ契約: AIとプログラムの間でやり取りするJSON形式を厳密に定義し、連携ミスを防ぐ。Why-driven設計: 「絶対〜しろ」と命令するだけでなく「なぜそれが必要か(理由)」を説明することで、AIの柔軟な対応を引き出す。Description(説明文)の最適化: 説明文が悪いとスキルが起動すらしないため、トリガー条件を具体的に記述する。チャット外での連携: 大量のデータ評価など、チャットUIでは難しい作業は専用のHTMLビューアなどを生成して行う。移植性の確保: 実行環境の制約(並列処理ができるか等)に応じて、自動で処理を切り替える工夫をする。 3. 2つのオーケストレーション戦略 複雑な処理をまとめる際、記事では2つのアプローチを比較しています。 Sub-agent型: 1つの親スキルが、複数の「子のAI」を生成して並列で動かす。評価や分析を同時に行いたい場合に有効。Skill Chain型: 独立した小さなスキルを「数珠繋ぎ」にしてパイプラインを作る。調査、実行、レポート作成など、手順が直列で決まっている場合に適している。 結論 これからのスキル開発は、単なる「プロンプトの束」ではなく、制御フロー、専門ロジック、データ契約、UIを持つ「小さなソフトウェア」として設計することが求められます。この構造化を意識することで、より信頼性が高く、メンテナンスしやすいAIエージェントを構築できるようになります。 引用元: https://nyosegawa.github.io/posts/skill-creator-and-orchestration-skill/ MCPはなぜCLIに負けたのか —— 経緯と構造を整理する 2024年にAnthropicが発表したMCP(Model Context Protocol)は、当初「AIとツールの架け橋」として業界を席巻しましたが、2026年現在ではCLI(コマンドラインインターフェース)に対してその優位性を失いつつあります。本記事は、なぜMCPが短期間でCLIに追い抜かれたのか、その構造的な背景を分析しています。 【MCP誕生の背景:モデルの「能力不足」】 2024年11月時点のAIモデルは、ツールの入出力を自力で解釈する能力が不安定でした。そのため、MCPはモデルとツールの間にJSON-RPCベースの仲介層を置き、構造化されたデータ(スキーマ)で「何ができるか」を明示的に教える「補助輪」としての役割を果たしました。 【モデルの進化が前提を壊した】 2025年以降、推論能力が飛躍的に向上した新世代モデル(Opus 4.6等)が登場しました。これらのモデルは、manページやヘルプテキストを読むだけで適切なコマンドを組み立て、エラーが発生しても自律的に修正できる能力を獲得しました。結果として、モデル側の進化が「構造化された仲介層」というMCPの必要性を解消してしまいました。 【トークン効率と運用コストの壁】 実運用におけるCLIとの比較...
    続きを読む 一部表示
    1分未満
まだレビューはありません