論文要約 LLM解釈の落とし穴?自然言語記述の限界 紹介論文今回紹介する論文はDo Natural Language Descriptions of Model Activations Convey Privileged Information?という論文です。 この論文を一言でまとめるとL... 2025.09.17 論文要約IT・プログラミング