ファインチューニング

論文要約

LoRA-PAR徹底解説:LLM効率化の新手法

紹介論文今回紹介する論文はLoRA-PAR: A Flexible Dual-System LoRA Partitioning Approach to Efficient LLM Fine-Tuningという論文です。 この論文を一言でまと...
論文要約

LLMの記憶問題:安全なAI開発のために

紹介論文今回紹介する論文はMemorization in Fine-Tuned Large Language Modelsという論文です。 この論文を一言でまとめると本記事では、LLMのファインチューニングにおける記憶の問題を扱った論文「M...
論文要約

KVキャッシュSteeringで小規模LLMの推論を強化!

紹介論文今回紹介する論文はKV Cache Steering for Inducing Reasoning in Small Language Modelsという論文です。 この論文を一言でまとめるとKVキャッシュSteeringは、小規模...
論文要約

OFTv2徹底解説: 大規模モデルの救世主となるか?

紹介論文今回紹介する論文はOrthogonal Finetuning Made Scalableという論文です。 この論文を一言でまとめるとOrthogonal Finetuning Made Scalable (OFTv2)は、大規模言語...
論文要約

LLMの安全性評価: ファインチューニングの落とし穴

紹介論文今回紹介する論文はFine-Tuning Lowers Safety and Disrupts Evaluation Consistencyという論文です。 この論文を一言でまとめると本研究では、LLMのファインチューニングが安全性...
論文要約

LLMの安全性を高めるLoX: 低ランク外挿による革新的な手法

紹介論文今回紹介する論文はLoX: Low-Rank Extrapolation Robustifies LLM Safety Against Fine-tuningという論文です。 この論文を一言でまとめると本記事では、LLMの安全性にお...