型推論

論文要約

AutoDeco: LLM推論の自動最適化

紹介論文今回紹介する論文はThe End of Manual Decoding: Towards Truly End-to-End Language Modelsという論文です。 この論文を一言でまとめるとLLMの推論時、温度やTop-Pと...
論文要約

Veo-3は万能か?MME-COFで見る動画モデルの推論力

紹介論文今回紹介する論文はAre Video Models Ready as Zero-Shot Reasoners? An Empirical Study with the MME-CoF Benchmarkという論文です。 この論文を一...
論文要約

人間の思考を解明!普遍的推論ランドスケープとは?

紹介論文今回紹介する論文はThe Universal Landscape of Human Reasoningという論文です。 この論文を一言でまとめると人間の推論プロセスを情報理論と機械学習で定量的にモデル化する「普遍的推論ランドスケープ...
論文要約

LLMの壁を超える!Scaf-GRPO徹底解説

紹介論文今回紹介する論文はScaf-GRPO: Scaffolded Group Relative Policy Optimization for Enhancing LLM Reasoningという論文です。 この論文を一言でまとめるとL...
論文要約

LaSeRでLLM推論を効率化!

紹介論文今回紹介する論文はLaSeR: Reinforcement Learning with Last-Token Self-Rewardingという論文です。 この論文を一言でまとめるとLaSeRは、LLMの推論効率を向上させる新しい強...
論文要約

LLMの記憶術!Breadcrumbs Reasoning徹底解説

紹介論文今回紹介する論文はBreadcrumbs Reasoning: Memory-Efficient Reasoning with Compression Beaconsという論文です。 この論文を一言でまとめると大規模言語モデル(LL...
論文要約

少数データでLLM推論を強化!P-TTSデータ拡張術

紹介論文今回紹介する論文はPrompting Test-Time Scaling Is A Strong LLM Reasoning Data Augmentationという論文です。 この論文を一言でまとめるとLLMの推論能力を飛躍的に向...
論文要約

LLMエージェントは「いつ知るのをやめるか」を学べるか?CaRT徹底解説

紹介論文今回紹介する論文はCaRT: Teaching LLM Agents to Know When They Know Enoughという論文です。 この論文を一言でまとめるとLLMエージェントが情報を収集しすぎたり、逆に情報不足で失敗...
論文要約

LLM推論を効率化!RLによるKVキャッシュ圧縮

紹介論文今回紹介する論文はWhich Heads Matter for Reasoning? RL-Guided KV Cache Compressionという論文です。 この論文を一言でまとめると大規模言語モデル(LLM)の推論コストを削...
論文要約

M-Thinker: 多言語推論を強化する新手法

紹介論文今回紹介する論文はThink Natively: Unlocking Multilingual Reasoning with Consistency-Enhanced Reinforcement Learningという論文です。 こ...