型推論

論文要約

TATTOO: 表形式データ推論を革新するツール強化型PRM

紹介論文今回紹介する論文はTaTToo: Tool-Grounded Thinking PRM for Test-Time Scaling in Tabular Reasoningという論文です。 この論文を一言でまとめるとTATTOOは、...
論文要約

Self-Anchor: LLMの注意機構をステップ毎に最適化!

紹介論文今回紹介する論文はSelf-Anchor: Large Language Model Reasoning via Step-by-step Attention Alignmentという論文です。 この論文を一言でまとめるとSelf-...
論文要約

ExGRPOでLLMの推論能力を爆上げ!過去経験から学ぶ新手法

紹介論文今回紹介する論文はExGRPO: Learning to Reason from Experienceという論文です。 この論文を一言でまとめると大規模言語モデル(LLM)の推論能力を向上させるExGRPO。過去の経験から効率的に学...
論文要約

LLM過剰思考を抑制!TECAとCERで効率的な推論

紹介論文今回紹介する論文はExplore Briefly, Then Decide: Mitigating LLM Overthinking via Cumulative Entropy Regulationという論文です。 この論文を一言...
論文要約

LLMの推論能力を革新!RLADで抽象化を学習

紹介論文今回紹介する論文はRLAD: Training LLMs to Discover Abstractions for Solving Reasoning Problemsという論文です。 この論文を一言でまとめるとRLADは、LLMが...
論文要約

大規模言語モデル多言語推論のParallel Scaling Law

紹介論文今回紹介する論文はParallel Scaling Law: Unveiling Reasoning Generalization through A Cross-Linguistic Perspectiveという論文です。 この論...
論文要約

AttnRL: 注意力でLLM推論を効率化

紹介論文今回紹介する論文はAttention as a Compass: Efficient Exploration for Process-Supervised RL in Reasoning Modelsという論文です。 この論文を一言...
論文要約

CoT頑健性向上! 理論と実践でLLM推論を強化

紹介論文今回紹介する論文はBounds of Chain-of-Thought Robustness: Reasoning Steps, Embed Norms, and Beyondという論文です。 この論文を一言でまとめるとChain-...
論文要約

SciReasoner徹底解剖!科学的推論をAIで実現

紹介論文今回紹介する論文はSciReasoner: Laying the Scientific Reasoning Ground Across Disciplinesという論文です。 この論文を一言でまとめると科学分野の推論をAIで実現する...
論文要約

Spiffyで爆速LLM!拡散モデル推論を劇的加速

紹介論文今回紹介する論文はSpiffy: Multiplying Diffusion LLM Acceleration via Lossless Speculative Decodingという論文です。 この論文を一言でまとめると拡散LLM...