深層学習

ButterflyQuant: LLM量子化の新たな一手

紹介論文今回紹介する論文はButterflyQuant: Ultra-low-bit LLM Quantization through Learnable Orthogonal Butterfly Transformsという論文です。この...

2025.09.12

論文要約IT・プログラミング

Mini-03で実現！深層思考AIの自作

紹介論文今回紹介する論文はMini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Searchという論文です。この論文を一言でまとめると画像検索AI「...

2025.09.10

論文要約IT・プログラミング

LLM推論の新潮流！Cooperative SFTとRL

紹介論文今回紹介する論文はBeyond Two-Stage Training: Cooperative SFT and RL for LLM Reasoningという論文です。この論文を一言でまとめるとLLMの推論能力を飛躍的に向上させる...

2025.09.10

論文要約IT・プログラミング

SpikingBrain:脳型AIで超効率LLM!

紹介論文今回紹介する論文はSpikingBrain Technical Report: Spiking Brain-inspired Large Modelsという論文です。この論文を一言でまとめるとSpikingBrainは脳の仕組みを...

2025.09.09

論文要約IT・プログラミング

LLM言語獲得の旅: 内部表現の進化を追跡

紹介論文今回紹介する論文はCrosscoding Through Time: Tracking Emergence & Consolidation Of Linguistic Representations Throughout LLM P...

2025.09.08

論文要約IT・プログラミング

LLMの記憶力革命！ArcMemo徹底解説

紹介論文今回紹介する論文はArcMemo: Abstract Reasoning Composition with Lifelong LLM Memoryという論文です。この論文を一言でまとめると大規模言語モデル(LLM)の課題である記憶...

2025.09.05

論文要約IT・プログラミング

強化学習で進化！テキストゲームAI最適化

紹介論文今回紹介する論文はDesign and Optimization of Reinforcement Learning-Based Agents in Text-Based Gamesという論文です。この論文を一言でまとめると本記事...

2025.09.04

論文要約IT・プログラミング

Middo：LLM を最適化する動的データ戦略

紹介論文今回紹介する論文はMiddo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learningという論文で...

2025.09.03

論文要約IT・プログラミング

因果推論でVideoQAを進化させる構造化アプローチ

紹介論文今回紹介する論文はChainReaction! Structured Approach with Causal Chains as Intermediate Representations for Improved and Expl...

2025.08.30

論文要約IT・プログラミング

SAEのL0設定、間違えると損！特徴量学習の落とし穴

紹介論文今回紹介する論文はSparse but Wrong: Incorrect L0 Leads to Incorrect Features in Sparse Autoencodersという論文です。この論文を一言でまとめるとSpar...

2025.08.25

論文要約IT・プログラミング

ButterflyQuant: LLM量子化の新たな一手

Mini-03で実現！深層思考AIの自作

LLM推論の新潮流！Cooperative SFTとRL

SpikingBrain:脳型AIで超効率LLM!

LLM言語獲得の旅: 内部表現の進化を追跡

LLMの記憶力革命！ArcMemo徹底解説

強化学習で進化！ テキストゲームAI最適化

Middo：LLM を最適化する 動的データ戦略

因果推論でVideoQAを 進化させる構造化アプローチ

SAEのL0設定、間違えると損！特徴量学習の落とし穴

強化学習で進化！テキストゲームAI最適化

Middo：LLM を最適化する動的データ戦略

因果推論でVideoQAを進化させる構造化アプローチ