自然言語処理

LLM価値観ドリフト追跡！Post-Training戦略

紹介論文今回紹介する論文はValue Drifts: Tracing Value Alignment During LLM Post-Trainingという論文です。この論文を一言でまとめるとLLMの価値観はPost-Trainingでど...

2025.11.02

論文要約IT・プログラミング

紹介論文今回紹介する論文はDefeating the Training-Inference Mismatch via FP16という論文です。この論文を一言でまとめると大規模言語モデルの学習における精度問題をFP16で解決する論文解説。学...

2025.11.01

論文要約IT・プログラミング

紹介論文今回紹介する論文はDecomposition-Enhanced Training for Post-Hoc Attributions In Language Modelsという論文です。この論文を一言でまとめるとLLMの出力根拠を...

2025.10.30

論文要約IT・プログラミング

紹介論文今回紹介する論文はTongyi DeepResearch Technical Reportという論文です。この論文を一言でまとめるとTongyi DeepResearchの技術レポートを徹底解説。AI研究の自動化、データ合成、環境...

2025.10.30

論文要約IT・プログラミング

紹介論文今回紹介する論文はComboBench: Can LLMs Manipulate Physical Devices to Play Virtual Reality Games?という論文です。この論文を一言でまとめるとVRゲームを...

2025.10.29

論文要約IT・プログラミング

紹介論文今回紹介する論文はMetricX-25 and GemSpanEval: Google Translate Submissions to the WMT25 Evaluation Shared Taskという論文です。この論文を一...

2025.10.29

論文要約IT・プログラミング

紹介論文今回紹介する論文はReCode: Unify Plan and Action for Universal Granularity Controlという論文です。この論文を一言でまとめるとAIエージェントの柔軟性を高めるReCode...

2025.10.29

論文要約IT・プログラミング

紹介論文今回紹介する論文はThink Twice: Branch-and-Rethink Reasoning Reward Modelという論文です。この論文を一言でまとめると本記事では、論文「Think Twice: Branch-an...

2025.10.28

論文要約IT・プログラミング

紹介論文今回紹介する論文はVariational Masked Diffusion Modelsという論文です。この論文を一言でまとめるとVariational Masked Diffusion Models (VMD)の仕組みを解説。従...

2025.10.28

論文要約IT・プログラミング

紹介論文今回紹介する論文はAstaBench: Rigorous Benchmarking of AI Agents with a Scientific Research Suiteという論文です。この論文を一言でまとめるとAstaBen...

2025.10.27

論文要約IT・プログラミング