論文要約 LLM価値観ドリフト追跡!Post-Training戦略 紹介論文今回紹介する論文はValue Drifts: Tracing Value Alignment During LLM Post-Trainingという論文です。 この論文を一言でまとめるとLLMの価値観はPost-Trainingでど... 2025.11.02 論文要約IT・プログラミング
論文要約 LLMの価値観を認知モデルで解釈する 紹介論文今回紹介する論文はInside you are many wolves: Using cognitive models to interpret value trade-offs in LLMsという論文です。 この論文を一言でまと... 2025.06.26 論文要約IT・プログラミング