Jailbreak

LLMの安全性強化！ IMAGINEフレームワーク徹底解説

紹介論文今回紹介する論文はForewarned is Forearmed: Pre-Synthesizing Jailbreak-like Instructions to Enhance LLM Safety Guardrail to Po...

2025.08.29

論文要約IT・プログラミング

Logit-Gap Steering：LLMの脆弱性を突く効率的なJailbreak

紹介論文今回紹介する論文はLogit-Gap Steering: Efficient Short-Suffix Jailbreaks for Aligned Large Language Modelsという論文です。この論文を一言でまとめ...

2025.07.03

論文要約IT・プログラミング