論文要約 | ページ 12

LLM価値観ドリフト追跡！Post-Training戦略

紹介論文今回紹介する論文はValue Drifts: Tracing Value Alignment During LLM Post-Trainingという論文です。この論文を一言でまとめるとLLMの価値観はPost-Trainingでど...

2025.11.02

論文要約IT・プログラミング

紹介論文今回紹介する論文はCross-Platform Evaluation of Reasoning Capabilities in Foundation Modelsという論文です。この論文を一言でまとめると最先端基盤モデルの推論能力...

2025.11.02

論文要約IT・プログラミング

紹介論文今回紹介する論文はDeep sequence models tend to memorize geometrically; it is unclear whyという論文です。この論文を一言でまとめると深層学習モデルが、一見単純なシ...

2025.11.01

論文要約IT・プログラミング

紹介論文今回紹介する論文はAMO-Bench: Large Language Models Still Struggle in High School Math Competitionsという論文です。この論文を一言でまとめるとLLMは数...

2025.11.01

論文要約IT・プログラミング

紹介論文今回紹介する論文はRemote Labor Index: Measuring AI Automation of Remote Workという論文です。この論文を一言でまとめるとAIによるリモートワーク自動化は進んでいるのか？「Re...

2025.11.01

論文要約IT・プログラミング

紹介論文今回紹介する論文はDefeating the Training-Inference Mismatch via FP16という論文です。この論文を一言でまとめると大規模言語モデルの学習における精度問題をFP16で解決する論文解説。学...

2025.11.01

論文要約IT・プログラミング

紹介論文今回紹介する論文はGistify! Codebase-Level Understanding via Runtime Executionという論文です。この論文を一言でまとめるとGistifyは、コードベースの一部を実行可能な最小...

2025.10.31

論文要約IT・プログラミング

紹介論文今回紹介する論文はAre Video Models Ready as Zero-Shot Reasoners? An Empirical Study with the MME-CoF Benchmarkという論文です。この論文を一...

2025.10.31

論文要約IT・プログラミング

紹介論文今回紹介する論文はTask Completion Agents are Not Ideal Collaboratorsという論文です。この論文を一言でまとめると最新の研究で、AIエージェントのタスク完遂能力だけでなく、人間との協調...

2025.10.31

論文要約IT・プログラミング

紹介論文今回紹介する論文はDecomposition-Enhanced Training for Post-Hoc Attributions In Language Modelsという論文です。この論文を一言でまとめるとLLMの出力根拠を...

2025.10.30

論文要約IT・プログラミング