『Ep.541 Appleの「FastVLM」公開──WebGPU対応で“ブラウザで動くVLM”が一気に現実に(2025年9月4日配信)』のカバーアート

Ep.541 Appleの「FastVLM」公開──WebGPU対応で“ブラウザで動くVLM”が一気に現実に(2025年9月4日配信)

Ep.541 Appleの「FastVLM」公開──WebGPU対応で“ブラウザで動くVLM”が一気に現実に(2025年9月4日配信)

無料で聴く

ポッドキャストの詳細を見る

このコンテンツについて

今回は、Appleが公開した新しい視覚言語モデル「FastVLM」をめぐる動きを整理します。結論から言うと、FastVLMは“速さ”に徹底的にこだわったVLMで、WebGPU対応のブラウザ実演まで含めて一気に開発者に手触りを届けてきました。Hugging Faceのコレクションを見ると、パラメータ規模は0.5B、1.5B、7Bの3ライン。モデルカードには、最小構成が従来系のLLaVA-OneVision-0.5B比でTTFTが最大85倍高速、エンコーダは3.4倍小型というメッセージがはっきりと示されています。上位構成ではQwen2-7Bと組み合わせ、Cambrian-1-8Bに対しても精度と応答開始の速さで有利という評価を掲げています。公開の事実関係と主な数値はHugging FaceのモデルページとAppleの研究ブログで裏付けられます。

まだレビューはありません