論文要約 LLM過剰思考を抑制!TECAとCERで効率的な推論 紹介論文今回紹介する論文はExplore Briefly, Then Decide: Mitigating LLM Overthinking via Cumulative Entropy Regulationという論文です。 この論文を一言... 2025.10.05 論文要約IT・プログラミング
論文要約 DiffusionモデルのRLで革命!TraceRL徹底解説 紹介論文今回紹介する論文はRevolutionizing Reinforcement Learning Framework for Diffusion Large Language Modelsという論文です。 この論文を一言でまとめると拡... 2025.09.09 論文要約IT・プログラミング