Rankings

Rankings & Benchmarks

Vergleichen Sie AI-Modelle objektiv anhand von etablierten Benchmarks. Unsere Daten stammen von führenden Forschungsinstitutionen und werden regelmäßig aktualisiert.

Reasoning

Allgemeine Denkfähigkeit, Anweisungsfolgen und Sprachverständnis. Gemessen via MT-bench.

Coding

Code-Generierung und -Korrektheit auf realen Programmierprojekten. Aider Polyglot Benchmark.

Agenten & Tool-Use

Funktionsaufrufe und strukturiertes Tool-Routing. Berkeley Function Calling Benchmark.

Methodik

Erfahren Sie, welche Datenquellen wir nutzen, wie wir messen und was die Rankings bedeuten.