セキュリティ

RAGシステムの脆弱性：自己修正を無効化する新攻撃

紹介論文今回紹介する論文はDisabling Self-Correction in Retrieval-Augmented Generation via Stealthy Retriever Poisoningという論文です。この論文を一...

2025.08.28

論文要約IT・プログラミング

HAMSA：コンパクトLLMをステルス自動攻撃から守る

紹介論文今回紹介する論文はHAMSA: Hijacking Aligned Compact Models via Stealthy Automationという論文です。この論文を一言でまとめると本記事では、コンパクトLLMに対する新しい攻...

2025.08.26

論文要約IT・プログラミング

RepreGuard解説：LLM生成検知の新潮流、内部表現の活用

紹介論文今回紹介する論文はRepreGuard: Detecting LLM-Generated Text by Revealing Hidden Representation Patternsという論文です。この論文を一言でまとめるとL...

2025.08.19

論文要約IT・プログラミング

LLMエージェントのプライバシーリスク：シミュレーションで脆弱性を探る

紹介論文今回紹介する論文はSearching for Privacy Risks in LLM Agents via Simulationという論文です。この論文を一言でまとめると本論文では、LLMエージェントの相互作用におけるプライバシ...

2025.08.15

論文要約IT・プログラミング

T-Detect：AI生成テキストを強固に検出する新技術

紹介論文今回紹介する論文はT-Detect: Tail-Aware Statistical Normalization for Robust Detection of Adversarial Machine-Generated Textとい...

2025.08.04

論文要約IT・プログラミング

Python×Excel自動化：上級テクニック

Python×Excel自動化：上級テクニックはじめに：Excel自動化、その先へ – Pythonで業務を革新する「Excel作業、もう限界…」そう感じていませんか？ PythonとExcelの自動化は、繰り返しの手作業から解放され、...

2025.07.19

IT・プログラミングPython学習

LLMは簡単に騙せる？「マスターキー攻撃」の脅威と対策

紹介論文今回紹介する論文はOne Token to Fool LLM-as-a-Judgeという論文です。この論文を一言でまとめると大規模言語モデル(LLM)の脆弱性を突く「マスターキー攻撃」を解説。LLMの判断を欺く簡単な手法とその対策...

2025.07.15

論文要約IT・プログラミング

画像が悪意に？MLLMの脆弱性を突くVisCo Attack

紹介論文今回紹介する論文はVisual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injectionという論文です。この論文を一言でまとめると本記事では...

2025.07.05

論文要約IT・プログラミング

LLMは操れる？ユーザーフィードバック悪用の脅威と対策

紹介論文今回紹介する論文はLLM Hypnosis: Exploiting User Feedback for Unauthorized Knowledge Injection to All Usersという論文です。この論文を一言でまと...

2025.07.05

論文要約IT・プログラミング

Logit-Gap Steering：LLMの脆弱性を突く効率的なJailbreak

紹介論文今回紹介する論文はLogit-Gap Steering: Efficient Short-Suffix Jailbreaks for Aligned Large Language Modelsという論文です。この論文を一言でまとめ...

2025.07.03

論文要約IT・プログラミング

セキュリティ

RAGシステムの脆弱性：自己修正を無効化する新攻撃

HAMSA：コンパクトLLMをステルス自動攻撃から守る

RepreGuard解説：LLM生成検知の新潮流、内部表現の活用

LLMエージェントの プライバシーリスク： シミュレーションで 脆弱性を探る

T-Detect：AI生成テキストを強固に検出する新技術

Python×Excel自動化：上級テクニック

LLMは簡単に騙せる？「マスターキー攻撃」の脅威と対策

画像が悪意に？MLLMの脆弱性を突くVisCo Attack

LLMは操れる？ユーザーフィードバック悪用の脅威と対策

Logit-Gap Steering：LLMの脆弱性を突く効率的なJailbreak

LLMエージェントのプライバシーリスク：シミュレーションで脆弱性を探る