#140: GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models Spela upp LLM にひっかけ算数問題を出してみる話を向井が読みました。