長文処理

論文要約

MoBA最適化:LLM長文処理を14倍速く!

紹介論文今回紹介する論文はOptimizing Mixture of Block Attentionという論文です。 この論文を一言でまとめるとMixture of Block Attention(MoBA)を徹底解説。統計モデルによる性能...
論文要約

Instella解説: フルオープンLLMの衝撃!性能、長文、数学特化モデルを徹底解剖

紹介論文今回紹介する論文はInstella: Fully Open Language Models with Stellar Performanceという論文です。 この論文を一言でまとめるとAMDが開発したフルオープンLLM「Instel...
論文要約

Glyph解説: 1Mトークン超えLLMを視覚的圧縮で実現!

紹介論文今回紹介する論文はGlyph: Scaling Context Windows via Visual-Text Compressionという論文です。 この論文を一言でまとめるとGlyph論文をわかりやすく解説。VLMでテキストを視...