MLLM

論文要約

LLMは数学の 創造性を発揮 できるのか?

紹介論文今回紹介する論文はOMEGA: Can LLMs Reason Outside the Box in Math? Evaluating Exploratory, Compositional, and Transformative G...
論文要約

ReasonFlux-PRM:LLM推論を革新する新手法

紹介論文今回紹介する論文はReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMsという論文です。 この論文を一言でまとめるとReas...
論文要約

LLMのKVキャッシュ最適化:PruLongでメモリ効率を最大化

紹介論文今回紹介する論文はCache Me If You Can: How Many KVs Do You Need for Effective Long-Context LMs?という論文です。 この論文を一言でまとめるとLLMの長文処理...
論文要約

LLMは「なぜ」を理解できる?因果推論能力を徹底検証

紹介論文今回紹介する論文はCLEAR-3K: Assessing Causal Explanatory Capabilities in Language Modelsという論文です。 この論文を一言でまとめると本記事では、CLEAR-3Kデ...
論文要約

SWE-Bench解剖:LLMエージェント自動修復の最前線

紹介論文今回紹介する論文はDissecting the SWE-Bench Leaderboards: Profiling Submitters and Architectures of LLM- and Agent-Based Repai...
論文要約

LLMの安全性評価: ファインチューニングの落とし穴

紹介論文今回紹介する論文はFine-Tuning Lowers Safety and Disrupts Evaluation Consistencyという論文です。 この論文を一言でまとめると本研究では、LLMのファインチューニングが安全性...
論文要約

LLMの安全性を高めるLoX: 低ランク外挿による革新的な手法

紹介論文今回紹介する論文はLoX: Low-Rank Extrapolation Robustifies LLM Safety Against Fine-tuningという論文です。 この論文を一言でまとめると本記事では、LLMの安全性にお...
論文要約

LLMは「後悔」をどう表現する?認知アーキテクチャ解明への挑戦

紹介論文今回紹介する論文はThe Compositional Architecture of Regret in Large Language Modelsという論文です。 この論文を一言でまとめると本記事では、大規模言語モデル(LLM)に...
論文要約

LLMの命令追従能力を徹底解剖!Ordered CommonGenで性能評価

紹介論文今回紹介する論文はRevisiting Compositional Generalization Capability of Large Language Models Considering Instruction Followi...
論文要約

LLMの推論に「一貫性」を!CC-LEARN徹底解説

紹介論文今回紹介する論文はCC-LEARN: Cohort-based Consistency Learningという論文です。 この論文を一言でまとめるとCC-LEARNは、類似質問群を用いた学習を通じて、LLMの推論における一貫性を高め...