
ViSMaP: Unsupervised Long Video Summarization via Meta-Prompting
カートのアイテムが多すぎます
ご購入は五十タイトルがカートに入っている場合のみです。
カートに追加できませんでした。
しばらく経ってから再度お試しください。
ウィッシュリストに追加できませんでした。
しばらく経ってから再度お試しください。
ほしい物リストの削除に失敗しました。
しばらく経ってから再度お試しください。
ポッドキャストのフォローに失敗しました
ポッドキャストのフォロー解除に失敗しました
-
ナレーター:
-
著者:
このコンテンツについて
ViSMaP, a novel unsupervised system designed for summarizing hour-long videos, addressing the challenge of limited annotated data for such content. ViSMaP utilizes a "Meta-Prompting" strategy involving three Large Language Models (LLMs) that iteratively generate, evaluate, and refine "pseudo-summaries" for long videos. These LLM-generated pseudo-summaries serve as training data, bypassing the need for costly manual annotations. The system reportedly achieves performance comparable to supervised methods and demonstrates strong generalization across different video types. This approach aims to make developing solutions for understanding lengthy videos more accessible and scalable.