性能評価

AIバイアス評価は biased？論文徹底レビュー

紹介論文今回紹介する論文はAre Bias Evaluation Methods Biased ?という論文です。この論文を一言でまとめると本記事では、AIモデルのバイアス評価に関する論文「Are Bias Evaluation Meth...

2025.06.24

論文要約IT・プログラミング

紹介論文今回紹介する論文はFine-Tuning Lowers Safety and Disrupts Evaluation Consistencyという論文です。この論文を一言でまとめると本研究では、LLMのファインチューニングが安全性...

2025.06.23

論文要約IT・プログラミング

紹介論文今回紹介する論文はFrom Model to Classroom: Evaluating Generated MCQs for Portuguese with Narrative and Difficulty Concernsという...

2025.06.23

論文要約IT・プログラミング

紹介論文今回紹介する論文はRevisiting Compositional Generalization Capability of Large Language Models Considering Instruction Followi...

2025.06.22

論文要約IT・プログラミング