『私立ずんだもん女学園放送部 podcast 20260130』のカバーアート

私立ずんだもん女学園放送部 podcast 20260130

私立ずんだもん女学園放送部 podcast 20260130

無料で聴く

ポッドキャストの詳細を見る

概要

youtube版(スライド付き) 関連リンク Introducing Moltworker: a self-hosted personal AI agent, minus the minis Cloudflareは、セルフホスト型のパーソナルAIエージェント「Moltbot(旧Clawdbot)」を、Cloudflareのプラットフォーム上で動作させるための実装「Moltworker」を公開しました。通常、この種のAIエージェントを自前で動かすには、Mac miniのような常時稼働する物理的なハードウェアが必要になりますが、Moltworkerを利用することで、Cloudflareの強力なエッジコンピューティング環境上に自分専用のAIアシスタントを構築できるようになります。 Moltworkerの概要 Moltworkerは、AIエージェントがWebを閲覧したり、コードを実行したり、スケジュールを管理したりといった複雑なタスクを、クラウド上の隔離された環境で実行可能にするプロジェクトです。Cloudflareが提供する最新のインフラ機能をフル活用している点が特徴です。 Node.jsとの高い互換性: Cloudflare WorkersのNode.js互換性が飛躍的に向上したことで、これまで困難だった複雑なライブラリ(Playwright等)の動作が可能になりました。主要なNPMパッケージの約98.5%がそのまま動作するレベルに達しています。Sandbox SDK (Cloudflare Containers): AIが作成したコードを安全に実行するための「隔離された砂場(サンドボックス)」を提供します。これにより、メインのシステムを危険にさらすことなく、AIに動的なタスクを任せられます。Browser Rendering: AIが人間と同じようにブラウザを操作し、Webサイトから情報を取得したり、フォームに入力したりするための機能です。R2ストレージ: コンテナ環境は通常、再起動するとデータが消えてしまいますが、R2をマウントすることでセッション情報や会話履歴を永続化しています。AI Gateway: AnthropicなどのAIモデルへの接続をプロキシし、コストの可視化やモデルの切り替え、失敗時のフォールバックを容易にします。 制約と留意点 概念実証(PoC)としての公開: MoltworkerはCloudflareの正式な製品ではなく、あくまで開発者プラットフォームの可能性を示すためのサンプルプロジェクト(オープンソース)です。利用コスト: Sandboxコンテナ機能を利用するため、Cloudflare Workersの有料プラン(月額5ドル〜)への加入が必要となります。セットアップの前提: 動作にはCloudflareアカウントが必要であり、各種APIキーの設定や環境構築のステップが必要です。 新人エンジニアの皆さんにとって、このニュースは「サーバーレス技術を組み合わせることで、従来は物理サーバーが必要だった高度なAIアプリケーションがいかにスマートに実装できるか」を学ぶ絶好の事例です。GitHubのリポジトリも公開されているため、インフラとAIを組み合わせたモダンな開発手法に触れる良い機会となるでしょう。 引用元: https://blog.cloudflare.com/moltworker-self-hosted-ai-agent/ AGENTS.md outperforms skills in our agent evals - Vercel Vercelは、AIコーディングエージェントに最新のフレームワーク知識(Next.js 16の新しいAPIなど)を学習させる際、「AGENTS.md」というファイルにドキュメント情報を直接持たせる手法が、従来の「Skills」というツールベースの手法よりも圧倒的に高い精度を発揮したという調査結果を公開しました。 背景と課題 AIエージェントの学習データは古くなりがちです。例えば、Next.js 16で導入された 'use cache' や connection() といった最新APIを、学習済みのAIモデルは知りません。これを解決するために、以下の2つのアプローチを比較検証しました。 Skills: エージェントが必要に応じて呼び出す、ドキュメントやツールをパッケージ化した外部標準。AGENTS.md: プロジェクトのルートに配置し、エージェントが各ターンで必ず参照するコンテキストファイル(Claude Codeにおける CLAUDE.md と同様の仕組み)。 驚きの検証結果 検証(Evals)の結果、Skillsの成功率が最大79%(デフォルトでは53%)にとどまったのに対し、AGENTS.mdを活用した手法は100%の合格率を叩き出しました。 Skillsが苦戦した主な理由は、「エージェントがドキュメントを読みに行くべきかどうか」を正しく判断できなかったことにあります。56%のケースでエージェントはSkillを一度も呼び出さず、古い知識で回答...
まだレビューはありません