論文要約 AttnRL: 注意力でLLM推論を効率化 紹介論文今回紹介する論文はAttention as a Compass: Efficient Exploration for Process-Supervised RL in Reasoning Modelsという論文です。 この論文を一言... 2025.10.02 論文要約IT・プログラミング