自然言語処理

LLMの報酬ハッキングを克服！Cooper徹底解説

紹介論文今回紹介する論文はCooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Modelsという論文です。 ...

2025.08.09

論文要約IT・プログラミング

OmniEAR：AIエージェントの身体性推論を評価する

紹介論文今回紹介する論文はOmniEAR: Benchmarking Agent Reasoning in Embodied Tasksという論文です。この論文を一言でまとめるとOmniEARは、AIエージェントが物理的な制約の中でどのよ...

2025.08.09

論文要約IT・プログラミング

LLMの事実性改善！推論能力と両立する新手法

紹介論文今回紹介する論文はLearning to Reason for Factualityという論文です。この論文を一言でまとめると本論文では、推論能力を持つ大規模言語モデル(LLM)において、事実性が低下する課題に取り組み、オンライン...

2025.08.09

論文要約IT・プログラミング

H-Net++：Tokenizer-Free言語モデルの革新

紹介論文今回紹介する論文はH-Net++: Hierarchical Dynamic Chunking for Tokenizer-Free Language Modelling in Morphologically-Rich Langua...

2025.08.08

論文要約IT・プログラミング

FaSTでLLMをパーソナライズ

紹介論文今回紹介する論文はFaST: Feature-aware Sampling and Tuning for Personalized Preference Alignment with Limited Dataという論文です。この論...

2025.08.08

論文要約IT・プログラミング

Multi-Hop QAの推論エラーを徹底解剖

紹介論文今回紹介する論文はHop, Skip, and Overthink: Diagnosing Why Reasoning Models Fumble during Multi-Hop Analysisという論文です。この論文を一言で...

2025.08.07

論文要約IT・プログラミング

FairLangProcでNLPの公平性を実現！Pythonパッケージ徹底解説

紹介論文今回紹介する論文はFairLangProc: A Python package for fairness in NLPという論文です。この論文を一言でまとめるとNLPモデルの公平性を実現するPythonパッケージFairLangP...

2025.08.07

論文要約IT・プログラミング

Pointer: 長距離モデリングを効率化する一手

紹介論文今回紹介する論文はPointer: Linear-Complexity Long-Range Modeling without Pre-trainingという論文です。この論文を一言でまとめるとPointerは、Linear Co...

2025.08.05

論文要約IT・プログラミング

MMBERT：中国語ヘイトスピーチ検出の最前線

紹介論文今回紹介する論文はMMBERT: Scaled Mixture-of-Experts Multimodal BERT for Robust Chinese Hate Speech Detection under Cloaking P...

2025.08.05

論文要約IT・プログラミング

LLMゼロショットQAで表形式データを攻略！ITUNLPチームの挑戦

紹介論文今回紹介する論文はITUNLP at SemEval-2025 Task 8: Question-Answering over Tabular Data: A Zero-Shot Approach using LLM-Driven ...

2025.08.05

論文要約IT・プログラミング

自然言語処理

LLMの報酬ハッキングを克服！Cooper徹底解説

OmniEAR：AIエージェントの身体性推論を評価する

LLMの事実性改善！推論能力と両立する新手法

H-Net++：Tokenizer-Free言語モデルの革新

FaSTでLLMを パーソナライズ

Multi-Hop QAの推論エラーを徹底解剖

FairLangProcでNLPの公平性を実現！Pythonパッケージ徹底解説

Pointer: 長距離 モデリングを 効率化する一手

MMBERT：中国語ヘイトスピーチ検出の最前線

LLMゼロショットQAで表形式データを攻略！ITUNLPチームの挑戦

FaSTでLLMをパーソナライズ

Pointer: 長距離モデリングを効率化する一手