論文要約 LLMの安全性評価: ファインチューニングの落とし穴
紹介論文今回紹介する論文はFine-Tuning Lowers Safety and Disrupts Evaluation Consistencyという論文です。 この論文を一言でまとめると本研究では、LLMのファインチューニングが安全性...
論文要約
論文要約
論文要約