Sparse Autoencoders

AlignSAE徹底解説: LLMを操る新技術

紹介論文今回紹介する論文はAlignSAE: Concept-Aligned Sparse Autoencodersという論文です。この論文を一言でまとめるとAlignSAEは、LLM内部の知識を特定の概念に紐付け、より直感的で制御可能な...

2025.12.02

論文要約IT・プログラミング

紹介論文今回紹介する論文はSparse but Wrong: Incorrect L0 Leads to Incorrect Features in Sparse Autoencodersという論文です。この論文を一言でまとめるとSpar...

2025.08.25

論文要約IT・プログラミング

紹介論文今回紹介する論文はS2WTM: Spherical Sliced-Wasserstein Autoencoder for Topic Modelingという論文です。この論文を一言でまとめるとS2WTMは、Spherical Sl...

2025.07.17

論文要約IT・プログラミング

紹介論文今回紹介する論文はDense SAE Latents Are Features, Not Bugsという論文です。この論文を一言でまとめると本論文は、Sparse Autoencoders(SAEs)におけるdense laten...

2025.06.20

論文要約IT・プログラミング