論文要約 LLMのバックドア対策:Letheによる知識希釈 紹介論文今回紹介する論文はLethe: Purifying Backdoored Large Language Models with Knowledge Dilutionという論文です。 この論文を一言でまとめるとLetheは、大規模言語... 2025.08.30 論文要約IT・プログラミング
論文要約 RAGシステムの脆弱性:自己修正を無効化する新攻撃 紹介論文今回紹介する論文はDisabling Self-Correction in Retrieval-Augmented Generation via Stealthy Retriever Poisoningという論文です。 この論文を一... 2025.08.28 論文要約IT・プログラミング
論文要約 HAMSA:コンパクトLLMをステルス自動攻撃から守る 紹介論文今回紹介する論文はHAMSA: Hijacking Aligned Compact Models via Stealthy Automationという論文です。 この論文を一言でまとめると本記事では、コンパクトLLMに対する新しい攻... 2025.08.26 論文要約IT・プログラミング
論文要約 RepreGuard解説:LLM生成検知の新潮流、内部表現の活用 紹介論文今回紹介する論文はRepreGuard: Detecting LLM-Generated Text by Revealing Hidden Representation Patternsという論文です。 この論文を一言でまとめるとL... 2025.08.19 論文要約IT・プログラミング
論文要約 LLMエージェントの プライバシーリスク: シミュレーションで 脆弱性を探る 紹介論文今回紹介する論文はSearching for Privacy Risks in LLM Agents via Simulationという論文です。 この論文を一言でまとめると本論文では、LLMエージェントの相互作用におけるプライバシ... 2025.08.15 論文要約IT・プログラミング
論文要約 T-Detect:AI生成テキストを強固に検出する新技術 紹介論文今回紹介する論文はT-Detect: Tail-Aware Statistical Normalization for Robust Detection of Adversarial Machine-Generated Textとい... 2025.08.04 論文要約IT・プログラミング
IT・プログラミング Python×Excel自動化:上級テクニック Python×Excel自動化:上級テクニック はじめに:Excel自動化、その先へ – Pythonで業務を革新する 「Excel作業、もう限界…」そう感じていませんか? PythonとExcelの自動化は、繰り返しの手作業から解放され、... 2025.07.19 IT・プログラミングPython学習
論文要約 LLMは簡単に騙せる?「マスターキー攻撃」の脅威と対策 紹介論文今回紹介する論文はOne Token to Fool LLM-as-a-Judgeという論文です。 この論文を一言でまとめると大規模言語モデル(LLM)の脆弱性を突く「マスターキー攻撃」を解説。LLMの判断を欺く簡単な手法とその対策... 2025.07.15 論文要約IT・プログラミング
論文要約 画像が悪意に?MLLMの脆弱性を突くVisCo Attack 紹介論文今回紹介する論文はVisual Contextual Attack: Jailbreaking MLLMs with Image-Driven Context Injectionという論文です。 この論文を一言でまとめると本記事では... 2025.07.05 論文要約IT・プログラミング
論文要約 LLMは操れる?ユーザーフィードバック悪用の脅威と対策 紹介論文今回紹介する論文はLLM Hypnosis: Exploiting User Feedback for Unauthorized Knowledge Injection to All Usersという論文です。 この論文を一言でまと... 2025.07.05 論文要約IT・プログラミング