論文要約 MoEモデル制御術!Expert (De)ActivationでLLMを安全に
紹介論文今回紹介する論文はSteering MoE LLMs via Expert (De)Activationという論文です。 この論文を一言でまとめるとMoEモデルの安全性と忠実性を高めるSteerMoEフレームワークを解説。特定のエキ...
論文要約
論文要約
論文要約
論文要約