VLM

論文要約

VLMは視覚情報で 語彙力を強化するのか?

紹介論文今回紹介する論文はVision-and-Language Training Helps Deploy Taxonomic Knowledge but Does Not Fundamentally Alter Itという論文です。 こ...
論文要約

VisionThink解説:VLMを効率化する強化学習

紹介論文今回紹介する論文はVisionThink: Smart and Efficient Vision Language Model via Reinforcement Learningという論文です。 この論文を一言でまとめるとVisi...
論文要約

長尺動画を理解するAI!LongVILA-R1徹底解説

紹介論文今回紹介する論文はScaling RL to Long Videosという論文です。 この論文を一言でまとめると本記事では、長尺動画を理解するVision-Language Model (VLM) のための新しいフレームワークLon...
論文要約

GenRecal:異種VLMの知識蒸留による性能向上

紹介論文今回紹介する論文はGenRecal: Generation after Recalibration from Large to Small Vision-Language Modelsという論文です。 この論文を一言でまとめるとGe...