論文要約 難易度別一般化の落とし穴:LLM性能評価の新視点 紹介論文今回紹介する論文はRevisiting Generalization Across Difficulty Levels: It's Not So Easyという論文です。 この論文を一言でまとめるとLLMの性能評価において、難易度と... 2025.11.27 論文要約IT・プログラミング