論文要約 LLMは簡単に騙せる?「マスターキー攻撃」の脅威と対策 紹介論文今回紹介する論文はOne Token to Fool LLM-as-a-Judgeという論文です。 この論文を一言でまとめると大規模言語モデル(LLM)の脆弱性を突く「マスターキー攻撃」を解説。LLMの判断を欺く簡単な手法とその対策... 2025.07.15 論文要約IT・プログラミング
論文要約 画像が悪意に?MLLMの脆弱性を突くVisCo Attack 紹介論文今回紹介する論文はVisual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injectionという論文です。 この論文を一言でまとめると本記事では... 2025.07.05 論文要約IT・プログラミング