深層学習

論文要約

ButterflyQuant: LLM量子化の新たな一手

紹介論文今回紹介する論文はButterflyQuant: Ultra-low-bit LLM Quantization through Learnable Orthogonal Butterfly Transformsという論文です。 この...
論文要約

Mini-03で実現!深層思考AIの自作

紹介論文今回紹介する論文はMini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Searchという論文です。 この論文を一言でまとめると画像検索AI「...
論文要約

LLM推論の新潮流!Cooperative SFTとRL

紹介論文今回紹介する論文はBeyond Two-Stage Training: Cooperative SFT and RL for LLM Reasoningという論文です。 この論文を一言でまとめるとLLMの推論能力を飛躍的に向上させる...
論文要約

SpikingBrain:脳型AIで超効率LLM!

紹介論文今回紹介する論文はSpikingBrain Technical Report: Spiking Brain-inspired Large Modelsという論文です。 この論文を一言でまとめるとSpikingBrainは脳の仕組みを...
論文要約

LLM言語獲得の旅: 内部表現の進化を追跡

紹介論文今回紹介する論文はCrosscoding Through Time: Tracking Emergence & Consolidation Of Linguistic Representations Throughout LLM P...
論文要約

LLMの記憶力革命!ArcMemo徹底解説

紹介論文今回紹介する論文はArcMemo: Abstract Reasoning Composition with Lifelong LLM Memoryという論文です。 この論文を一言でまとめると大規模言語モデル(LLM)の課題である記憶...
論文要約

強化学習で進化! テキストゲームAI最適化

紹介論文今回紹介する論文はDesign and Optimization of Reinforcement Learning-Based Agents in Text-Based Gamesという論文です。 この論文を一言でまとめると本記事...
論文要約

Middo:LLM を最適化する 動的データ戦略

紹介論文今回紹介する論文はMiddo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learningという論文で...
論文要約

因果推論でVideoQAを 進化させる構造化アプローチ

紹介論文今回紹介する論文はChainReaction! Structured Approach with Causal Chains as Intermediate Representations for Improved and Expl...
論文要約

SAEのL0設定、間違えると損!特徴量学習の落とし穴

紹介論文今回紹介する論文はSparse but Wrong: Incorrect L0 Leads to Incorrect Features in Sparse Autoencodersという論文です。 この論文を一言でまとめるとSpar...