KI-Update – ein heise-Podcast KI-Update Deep-Dive: Wie zuverlässig sind Benchmarks für LLMs? ChatGPT schneidet im Jura-Examen besser ab als Menschen […]