
Ep.541 Appleの「FastVLM」公開──WebGPU対応で“ブラウザで動くVLM”が一気に現実に(2025年9月4日配信)
カートのアイテムが多すぎます
ご購入は五十タイトルがカートに入っている場合のみです。
カートに追加できませんでした。
しばらく経ってから再度お試しください。
ウィッシュリストに追加できませんでした。
しばらく経ってから再度お試しください。
ほしい物リストの削除に失敗しました。
しばらく経ってから再度お試しください。
ポッドキャストのフォローに失敗しました
ポッドキャストのフォロー解除に失敗しました
-
ナレーター:
-
著者:
このコンテンツについて
今回は、Appleが公開した新しい視覚言語モデル「FastVLM」をめぐる動きを整理します。結論から言うと、FastVLMは“速さ”に徹底的にこだわったVLMで、WebGPU対応のブラウザ実演まで含めて一気に開発者に手触りを届けてきました。Hugging Faceのコレクションを見ると、パラメータ規模は0.5B、1.5B、7Bの3ライン。モデルカードには、最小構成が従来系のLLaVA-OneVision-0.5B比でTTFTが最大85倍高速、エンコーダは3.4倍小型というメッセージがはっきりと示されています。上位構成ではQwen2-7Bと組み合わせ、Cambrian-1-8Bに対しても精度と応答開始の速さで有利という評価を掲げています。公開の事実関係と主な数値はHugging FaceのモデルページとAppleの研究ブログで裏付けられます。
まだレビューはありません