論文要約 ExGRPOでLLMの推論能力を爆上げ!過去経験から学ぶ新手法 紹介論文今回紹介する論文はExGRPO: Learning to Reason from Experienceという論文です。 この論文を一言でまとめると大規模言語モデル(LLM)の推論能力を向上させるExGRPO。過去の経験から効率的に学... 2025.10.06 論文要約IT・プログラミング
論文要約 LLM過剰思考を抑制!TECAとCERで効率的な推論 紹介論文今回紹介する論文はExplore Briefly, Then Decide: Mitigating LLM Overthinking via Cumulative Entropy Regulationという論文です。 この論文を一言... 2025.10.05 論文要約IT・プログラミング
論文要約 LLMの推論能力を革新!RLADで抽象化を学習 紹介論文今回紹介する論文はRLAD: Training LLMs to Discover Abstractions for Solving Reasoning Problemsという論文です。 この論文を一言でまとめるとRLADは、LLMが... 2025.10.05 論文要約IT・プログラミング
論文要約 大規模言語モデル多言語推論のParallel Scaling Law 紹介論文今回紹介する論文はParallel Scaling Law: Unveiling Reasoning Generalization through A Cross-Linguistic Perspectiveという論文です。 この論... 2025.10.04 論文要約IT・プログラミング
論文要約 LLM評価の新視点:引き分けの再考 紹介論文今回紹介する論文はDrawing Conclusions from Draws: Rethinking Preference Semantics in Arena-Style LLM Evaluationという論文です。 この論文を... 2025.10.03 論文要約IT・プログラミング
論文要約 LLM翻訳の落とし穴:自己バイアスを徹底解剖 紹介論文今回紹介する論文はDeconstructing Self-Bias in LLM-generated Translation Benchmarksという論文です。 この論文を一言でまとめるとLLMによる自動翻訳ベンチマーク作成の自己... 2025.10.03 論文要約IT・プログラミング
論文要約 MENLO徹底解説: 47言語対応LLM評価の最前線 紹介論文今回紹介する論文はMENLO: From Preferences to Proficiency -- Evaluating and Modeling Native-like Quality Across 47 Languagesとい... 2025.10.02 論文要約IT・プログラミング
論文要約 AttnRL: 注意力でLLM推論を効率化 紹介論文今回紹介する論文はAttention as a Compass: Efficient Exploration for Process-Supervised RL in Reasoning Modelsという論文です。 この論文を一言... 2025.10.02 論文要約IT・プログラミング
論文要約 多言語LLMの弱点とは?言語と検索バイアスを徹底解剖 紹介論文今回紹介する論文はInvestigating Language and Retrieval Bias in Multilingual Previously Fact-Checked Claim Detectionという論文です。 こ... 2025.10.01 論文要約IT・プログラミング
論文要約 AI生成動画の「違和感」を解明!LLMでディープフェイクを見抜く 紹介論文今回紹介する論文はLearning Human-Perceived Fakeness in AI-Generated Videos via Multimodal LLMsという論文です。 この論文を一言でまとめるとAI生成動画の品質... 2025.09.30 論文要約IT・プログラミング