transformer

Transformerの効率化:SDT/STTで計算を賢く最適化

紹介論文今回紹介する論文はSubjective Depth and Timescale Transformers: Learning Where and When to Computeという論文です。この論文を一言でまとめるとTransf...

2025.12.01

論文要約IT・プログラミング

TimeViper解説: 長尺動画理解の新潮流！MambaとTransformerの融合

紹介論文今回紹介する論文はTimeViper: A Hybrid Mamba-Transformer Vision-Language Model for Efficient Long Video Understandingという論文です。 ...

2025.11.23

論文要約IT・プログラミング

幾何学暗記の謎: 深層学習モデルの意外な記憶メカニズム

紹介論文今回紹介する論文はDeep sequence models tend to memorize geometrically; it is unclear whyという論文です。この論文を一言でまとめると深層学習モデルが、一見単純なシ...

2025.11.01

論文要約IT・プログラミング

線形Attentionの救世主？忘却問題とLTEの革新

紹介論文今回紹介する論文はAlleviating Forgetfulness of Linear Attention by Hybrid Sparse Attention and Contextualized Learnable Token...

2025.10.26

論文要約IT・プログラミング

言語モデルは言葉をどう理解？記号接地メカニズムを解明

紹介論文今回紹介する論文はThe Mechanistic Emergence of Symbol Grounding in Language Modelsという論文です。この論文を一言でまとめると大規模言語モデル（LLM）が記号接地をどの...

2025.10.17

論文要約IT・プログラミング

音声言語モデルを激変！音節ベースTokenizationの衝撃

紹介論文今回紹介する論文はScaling Spoken Language Models with Syllabic Speech Tokenizationという論文です。この論文を一言でまとめると音声言語モデル(SLM)の効率と精度を飛躍...

2025.10.01

論文要約IT・プログラミング

CoT頑健性向上！理論と実践でLLM推論を強化

紹介論文今回紹介する論文はBounds of Chain-of-Thought Robustness: Reasoning Steps, Embed Norms, and Beyondという論文です。この論文を一言でまとめるとChain-...

2025.09.28

論文要約IT・プログラミング

LLMの心臓部を解剖！計算は最後の１トークンで完結する？

紹介論文今回紹介する論文はAll for One: LLMs Solve Mental Math at the Last Token With Information Transferred From Other Tokensという論文です...

2025.09.14

論文要約IT・プログラミング

Pointer: 長距離モデリングを効率化する一手

紹介論文今回紹介する論文はPointer: Linear-Complexity Long-Range Modeling without Pre-trainingという論文です。この論文を一言でまとめるとPointerは、Linear Co...

2025.08.05

論文要約IT・プログラミング

科学的言説検出：最先端アンサンブル手法を徹底解説

紹介論文今回紹介する論文はDS@GT at CheckThat! 2025: Ensemble Methods for Detection of Scientific Discourse on Social Mediaという論文です。この...

2025.07.10

論文要約IT・プログラミング

transformer

Transformerの効率化:SDT/STTで計算を賢く最適化

TimeViper解説: 長尺動画理解の新潮流！MambaとTransformerの融合

幾何学暗記の謎: 深層学習モデルの意外な記憶メカニズム

線形Attentionの救世主？忘却問題とLTEの革新

言語モデルは言葉をどう理解？記号接地メカニズムを解明

音声言語モデルを激変！音節ベースTokenizationの衝撃

CoT頑健性向上！ 理論と実践でLLM推論を強化

LLMの心臓部を解剖！計算は最後の１トークンで完結する？

Pointer: 長距離 モデリングを 効率化する一手

科学的言説検出：最先端アンサンブル手法を徹底解説

CoT頑健性向上！理論と実践でLLM推論を強化

Pointer: 長距離モデリングを効率化する一手