論文要約 LaSeRでLLM推論を効率化! 紹介論文今回紹介する論文はLaSeR: Reinforcement Learning with Last-Token Self-Rewardingという論文です。 この論文を一言でまとめるとLaSeRは、LLMの推論効率を向上させる新しい強... 2025.10.19 論文要約IT・プログラミング
論文要約 SRUM解説:自己報酬型UMMで画像生成を革新 紹介論文今回紹介する論文はSRUM: Fine-Grained Self-Rewarding for Unified Multimodal Modelsという論文です。 この論文を一言でまとめるとSRUMは、Unified Multimod... 2025.10.15 論文要約IT・プログラミング