Welches ist das beste KI-Modell für Ihr Unternehmen? Dasjenige, das am besten lügt, anscheinend
Kurz gesagt
Die Vending-Bench Arena testete KI-Agenten, die konkurrierende Verkaufsautomatenbetriebe führten.
Die Top-Modelle steigerten die Gewinne durch Preisabsprachen, Kollusion und irreführende Taktiken. Claude war bei diesen Taktiken am besten.
GLM-5 besiegte Claude, indem es einen Teamkollegen imitierte und extrahierte
GLM0,22%
Decrypt·02-19 16:06