Menü
24matins.de
Navigation : 
  • Nachrichten
    • Gesundheit
    • Politik
    • Wirtschaft
    • Sport
    • Küche
  • Welt
  • Kultur
  • Technik
In diesem Moment : 
  • Gesundheit
  • Tech
  • Unterhaltung
  • Divertissement
  • Drones

OpenAI stellt GDPval vor: Künstliche Intelligenz vs. menschliche Expertise

Technik / Tech / OpenAI
Par 24matins.de,  veröffentlicht am September 27, 2025 um 14:01 Uhr, geändert am September 27, 2025 um 14:01 Uhr.
Technik

OpenAI / PR-ADN

OpenAI stellt mit GDPval ein neues Tool vor, das die Leistungsfähigkeit von Künstlicher Intelligenz im Vergleich zu menschlicher Expertise bewertet. Ziel ist es, Fortschritte der KI objektiv messbar und nachvollziehbar zu machen.

TL;DR

  • OpenAI testet GPT-5 mit neuem Benchmark GDPval.
  • 1.320 praxisnahe Aufgaben aus 44 Berufen geprüft.
  • Arbeitswelt wird durch KI tiefgreifend beeinflusst.

GPT-5: OpenAIs neuer Meilenstein im Praxistest

Ein bemerkenswerter Schritt nach vorn für die Künstliche Intelligenz: Die US-amerikanische OpenAI, bekannt für ihren Chatbot ChatGPT, hat einen neuen Maßstab gesetzt. Mit dem Testverfahren GDPval will das Unternehmen nicht weniger, als seine nächste Modellgeneration – GPT-5 – auf Augenhöhe mit erfahrenen Fachkräften aus unterschiedlichsten Branchen messen.

Praxistests statt theoretischer Aufgaben

Im Gegensatz zu den gängigen, oft akademisch geprägten Benchmarks stützt sich GDPval auf praxisnahe Anforderungen. Entwickelt wurden insgesamt 1.320 spezialisierte Aufgaben, die jeweils von Experten mit durchschnittlich mehr als 14 Jahren Berufserfahrung konzipiert und geprüft wurden. Das Spektrum der Arbeitsproben reicht von komplexen Rechtsgutachten bis zu detaillierten Pflegeplänen, ausgefeilten Finanzspreadsheets und technischen Zeichnungen.

Mehrere Faktoren erklären die Besonderheit dieses Ansatzes:

  • Jede Aufgabe ist realitätsnah gestaltet und mit umfangreichen Materialien angereichert.
  • Nicht nur reine Textausgaben, sondern komplette Dokumente werden gefordert.
  • Die Bandbreite an Berufen – von Pflege über Recht bis zur Technik – macht den Test außergewöhnlich vielseitig.

Beteiligte Berufe und Zielsetzung des Benchmarks

Das Spektrum der getesteten Tätigkeiten ist breit: Insgesamt werden vierundvierzig Berufe aus neun Branchen abgedeckt. Dazu zählen etwa Entwickler, Juristen, Ingenieure, Pflegekräfte, Journalistinnen sowie Analysten aus dem Finanzwesen. Ziel ist es ausdrücklich, nicht nur die Leistungsfähigkeit der KI im Vergleich zum Menschen festzustellen, sondern die Frage zu stellen: Kann eine sogenannte Künstliche Allgemeine Intelligenz (AGI) tatsächlich menschliche Fachkompetenz reproduzieren oder sogar übertreffen?

Zukunftsperspektiven: Wandel in der Arbeitswelt unausweichlich?

Natürlich wirft diese Entwicklung Fragen auf – insbesondere hinsichtlich der Zukunft menschlicher Arbeit. Auch bei OpenAI betont man, dass GDPval lediglich ein erster Schritt sei und längst nicht alle Facetten realer Wirtschaftstätigkeit abbilden könne. Die fortschreitende Automatisierung bleibt dennoch ein dominierendes Thema. Klar scheint: Der Wandel in den Berufsbildern wird sich beschleunigen. Ob und wie der Mensch in dieser neuen Arbeitswelt seine Rolle behauptet, bleibt eine der spannendsten Fragen unserer Zeit.

Le Récap
  • TL;DR
  • GPT-5: OpenAIs neuer Meilenstein im Praxistest
  • Praxistests statt theoretischer Aufgaben
  • Beteiligte Berufe und Zielsetzung des Benchmarks
  • Zukunftsperspektiven: Wandel in der Arbeitswelt unausweichlich?
Erfahren Sie mehr
  • Spotify reguliert Künstliche Intelligenz in der Musikbranche
  • ChatGPT Pulse: Die neue Alternative zu Google News und Flipboard
  • Künstliche Intelligenz: Warum Workslop die Produktivität bremst
  • Über uns
  • Verwaltung von persönlichen Daten
© 2025 - Alle Rechte der Seiteninhalte vorbehalten 24matins.de