セキュリティ

論文要約

LLMのバックドア対策:Letheによる知識希釈

紹介論文今回紹介する論文はLethe: Purifying Backdoored Large Language Models with Knowledge Dilutionという論文です。 この論文を一言でまとめるとLetheは、大規模言語...
論文要約

RAGシステムの脆弱性:自己修正を無効化する新攻撃

紹介論文今回紹介する論文はDisabling Self-Correction in Retrieval-Augmented Generation via Stealthy Retriever Poisoningという論文です。 この論文を一...
論文要約

HAMSA:コンパクトLLMをステルス自動攻撃から守る

紹介論文今回紹介する論文はHAMSA: Hijacking Aligned Compact Models via Stealthy Automationという論文です。 この論文を一言でまとめると本記事では、コンパクトLLMに対する新しい攻...
論文要約

RepreGuard解説:LLM生成検知の新潮流、内部表現の活用

紹介論文今回紹介する論文はRepreGuard: Detecting LLM-Generated Text by Revealing Hidden Representation Patternsという論文です。 この論文を一言でまとめるとL...
論文要約

LLMエージェントの プライバシーリスク: シミュレーションで 脆弱性を探る

紹介論文今回紹介する論文はSearching for Privacy Risks in LLM Agents via Simulationという論文です。 この論文を一言でまとめると本論文では、LLMエージェントの相互作用におけるプライバシ...
論文要約

T-Detect:AI生成テキストを強固に検出する新技術

紹介論文今回紹介する論文はT-Detect: Tail-Aware Statistical Normalization for Robust Detection of Adversarial Machine-Generated Textとい...
IT・プログラミング

Python×Excel自動化:上級テクニック

Python×Excel自動化:上級テクニック はじめに:Excel自動化、その先へ – Pythonで業務を革新する 「Excel作業、もう限界…」そう感じていませんか? PythonとExcelの自動化は、繰り返しの手作業から解放され、...
論文要約

LLMは簡単に騙せる?「マスターキー攻撃」の脅威と対策

紹介論文今回紹介する論文はOne Token to Fool LLM-as-a-Judgeという論文です。 この論文を一言でまとめると大規模言語モデル(LLM)の脆弱性を突く「マスターキー攻撃」を解説。LLMの判断を欺く簡単な手法とその対策...
論文要約

画像が悪意に?MLLMの脆弱性を突くVisCo Attack

紹介論文今回紹介する論文はVisual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injectionという論文です。 この論文を一言でまとめると本記事では...
論文要約

LLMは操れる?ユーザーフィードバック悪用の脅威と対策

紹介論文今回紹介する論文はLLM Hypnosis: Exploiting User Feedback for Unauthorized Knowledge Injection to All Usersという論文です。 この論文を一言でまと...