OpenAI hat einen neuen Benchmark-Test entwickelt, um die Genauigkeit aktueller KI-Modelle zu überprüfen. Dabei lieferten sogar die Spitzenmodelle oft falsche Antworten.
Dieser Artikel wurde indexiert von t3n.de – Software & Entwicklung
OpenAI hat einen neuen Benchmark-Test entwickelt, um die Genauigkeit aktueller KI-Modelle zu überprüfen. Dabei lieferten sogar die Spitzenmodelle oft falsche Antworten.