RLVR | lifetechia

LLMはVRゲームを攻略できる？ComboBench徹底解説

紹介論文今回紹介する論文はComboBench: Can LLMs Manipulate Physical Devices to Play Virtual Reality Games?という論文です。この論文を一言でまとめるとVRゲームを...

2025.10.29

論文要約IT・プログラミング

紹介論文今回紹介する論文はPass@k Training for Adaptively Balancing Exploration and Exploitation of Large Reasoning Modelsという論文です。この論...

2025.08.17

論文要約IT・プログラミング

紹介論文今回紹介する論文はStepHint: Multi-level Stepwise Hints Enhance Reinforcement Learning to Reasonという論文です。この論文を一言でまとめるとStepHint...

2025.07.06

論文要約IT・プログラミング