論文要約 LLM検索エージェントの構造的異質性に対処するStratified GRPOとは? 紹介論文今回紹介する論文はStratified GRPO: Handling Structural Heterogeneity in Reinforcement Learning of LLM Search Agentsという論文です。 こ... 2025.10.08 論文要約IT・プログラミング