Rankings & Benchmarks
Vergleichen Sie AI-Modelle objektiv anhand von etablierten Benchmarks. Unsere Daten stammen von führenden Forschungsinstitutionen und werden regelmäßig aktualisiert.
Reasoning
Allgemeine Denkfähigkeit, Anweisungsfolgen und Sprachverständnis. Gemessen via MT-bench.
Coding
Code-Generierung und -Korrektheit auf realen Programmierprojekten. Aider Polyglot Benchmark.
Agenten & Tool-Use
Funktionsaufrufe und strukturiertes Tool-Routing. Berkeley Function Calling Benchmark.
Methodik
Erfahren Sie, welche Datenquellen wir nutzen, wie wir messen und was die Rankings bedeuten.