Sparse Autoencoders

論文要約

AlignSAE徹底解説: LLMを操る新技術

紹介論文今回紹介する論文はAlignSAE: Concept-Aligned Sparse Autoencodersという論文です。 この論文を一言でまとめるとAlignSAEは、LLM内部の知識を特定の概念に紐付け、より直感的で制御可能な...
論文要約

SAEのL0設定、間違えると損!特徴量学習の落とし穴

紹介論文今回紹介する論文はSparse but Wrong: Incorrect L0 Leads to Incorrect Features in Sparse Autoencodersという論文です。 この論文を一言でまとめるとSpar...
論文要約

S2WTM徹底解説: Wasserstein距離で拓く トピックモデルの未来

紹介論文今回紹介する論文はS2WTM: Spherical Sliced-Wasserstein Autoencoder for Topic Modelingという論文です。 この論文を一言でまとめるとS2WTMは、Spherical Sl...
論文要約

Dense Latentはバグじゃない!SAEの重要要素を徹底解説

紹介論文今回紹介する論文はDense SAE Latents Are Features, Not Bugsという論文です。 この論文を一言でまとめると本論文は、Sparse Autoencoders(SAEs)におけるdense laten...