MLLM

論文要約

AQuilt:低コストで高精度な専門LLMデータ合成術

紹介論文今回紹介する論文はAQuilt: Weaving Logic and Self-Inspection into Low-Cost, High-Relevance Data Synthesis for Specialist LLMsと...
論文要約

TRPromptでLLMを最適化!

紹介論文今回紹介する論文はTRPrompt: Bootstrapping Query-Aware Prompt Optimization from Textual Rewardsという論文です。 この論文を一言でまとめるとTRPromptは...
論文要約

LingBench++徹底解説:言語学ベンチマークでLLMの限界に挑む

紹介論文今回紹介する論文はLingBench++: A Linguistically-Informed Benchmark and Reasoning Framework for Multi-Step and Cross-Cultural ...
論文要約

バイリンガルLLMの言語混合:推論への影響を徹底解説

紹介論文今回紹介する論文はThe Impact of Language Mixing on Bilingual LLM Reasoningという論文です。 この論文を一言でまとめるとバイリンガルLLMにおける言語混合が推論能力に与える影響を...
論文要約

3LM徹底解説:Arabic、STEM、Codeを繋ぐLLMベンチマーク

紹介論文今回紹介する論文は3LM: Bridging Arabic, STEM, and Code through Benchmarkingという論文です。 この論文を一言でまとめると3LMは、Arabic、STEM(科学・技術・工学・数学...
論文要約

DENSE解説:AIで進捗ノートを自動生成

紹介論文今回紹介する論文はDENSE: Longitudinal Progress Note Generation with Temporal Modeling of Heterogeneous Clinical Notes Across ...
論文要約

LLMの推論能力を拡張!QuestAの質問拡張戦略

紹介論文今回紹介する論文はQuestA: Expanding Reasoning Capacity in LLMs via Question Augmentationという論文です。 この論文を一言でまとめるとQuestAは、大規模言語モデ...
論文要約

ABGEN解説:LLMは科学研究のアブレーション設計を支援できるのか?

紹介論文今回紹介する論文はAbGen: Evaluating Large Language Models in Ablation Study Design and Evaluation for Scientific Researchという論...
論文要約

LLM評価に新風!GEAでエネルギー意識を導入

紹介論文今回紹介する論文はThe Generative Energy Arena (GEA): Incorporating Energy Awareness in Large Language Model (LLM) Human Evalu...
論文要約

LLMはどこまで賢くなる?長さの一般化とTAIL

紹介論文今回紹介する論文はThe Imitation Game: Turing Machine Imitator is Length Generalizable Reasonerという論文です。 この論文を一言でまとめるとLLMの「長さの一...