数学

論文要約

MR-RLVR: 数学AIの自己学習を革新!

紹介論文今回紹介する論文はMasked-and-Reordered Self-Supervision for Reinforcement Learning from Verifiable Rewardsという論文です。 この論文を一言でまと...
論文要約

Instella解説: フルオープンLLMの衝撃!性能、長文、数学特化モデルを徹底解剖

紹介論文今回紹介する論文はInstella: Fully Open Language Models with Stellar Performanceという論文です。 この論文を一言でまとめるとAMDが開発したフルオープンLLM「Instel...
論文要約

SIGMAで数学難問を攻略!マルチエージェントAIの全貌

紹介論文今回紹介する論文はSIGMA: Search-Augmented On-Demand Knowledge Integration for Agentic Mathematical Reasoningという論文です。 この論文を一言で...
論文要約

難関数学突破なるか?LLM挑戦の現状とAMO-Bench

紹介論文今回紹介する論文はAMO-Bench: Large Language Models Still Struggle in High School Math Competitionsという論文です。 この論文を一言でまとめるとLLMは数...
論文要約

LLMの壁を超える!Scaf-GRPO徹底解説

紹介論文今回紹介する論文はScaf-GRPO: Scaffolded Group Relative Policy Optimization for Enhancing LLM Reasoningという論文です。 この論文を一言でまとめるとL...
論文要約

MathCanvas徹底解説!図解で数学AIを自作

紹介論文今回紹介する論文はMathCanvas: Intrinsic Visual Chain-of-Thought for Multimodal Mathematical Reasoningという論文です。 この論文を一言でまとめるとMa...
論文要約

Parallel-R1: LLM並列思考RL学習の最前線

紹介論文今回紹介する論文はParallel-R1: Towards Parallel Thinking via Reinforcement Learningという論文です。 この論文を一言でまとめるとParallel-R1は、LLMに並列思...
論文要約

MathSmith解説:AIの数学 推論能力を極限まで高める

紹介論文今回紹介する論文はMathSmith: Towards Extremely Hard Mathematical Reasoning by Forging Synthetic Problems with a Reinforced Po...
論文要約

Seed-Prover:AIが数学の 定理証明を自動化

紹介論文今回紹介する論文はSeed-Prover: Deep and Broad Reasoning for Automated Theorem Provingという論文です。 この論文を一言でまとめるとSeed-Proverは、深層推論と...
論文要約

LLMは数学の 創造性を発揮 できるのか?

紹介論文今回紹介する論文はOMEGA: Can LLMs Reason Outside the Box in Math? Evaluating Exploratory, Compositional, and Transformative G...