#124: GAIA: a benchmark for General AI Assistants

LLM に解かせる難問集と採点結果を向井が睨みました。

Om Podcasten

森田と向井がコンピュータサイエンス周辺の論文をなんとなく読んで感心する Podcast です。