Nieuw algoritme kan geavanceerde teksten genereren

ANP | 3 augustus 2020 | 17:21 | Foto: ©ANP Nieuw algoritme kan geavanceerde teksten genereren

Een algoritme dat de onderliggende logica van taal kan herkennen en overnemen: dat is wat OpenAI heeft gebouwd met de nieuwe versie van zijn algoritme voor tekstgeneratie, GPT-3. In een uitgebreid artikel over het algoritme schrijft The Verge dat het programma zo geavanceerd is dat het bijvoorbeeld een gewone zin kan omschrijven in juridische taal of zelfstandig computercode kan schrijven op basis van een tekstuele opdracht.

Het bijzondere aan GTP-3 is dat de kunstmatige intelligentie veel verschillende taken kan doen zonder daar specifiek voor getraind te zijn. Na het geven van een paar voorbeelden van wat de bedoeling is, weet het algoritme de rest zelf uit te vogelen. Soms gaat het zelfs meteen goed.

Het algoritme traint zichzelf door eindeloos teksten die op internet te vinden zijn te analyseren. Zo weet de AI dat na het woord "fire", "alarm" een logischere opvolging is dan "elvish". Het is moeilijk om in te schatten hoeveel teksten het systeem precies heeft bestudeerd, maar volgens The Verge vormt de gehele Engelstalige Wikipedia (6 miljoen lemma’s) slechts 0,6 procent van de totale trainingsdata.

Keerzijden

Tegelijkertijd zorgt die enorme hoeveelheid trainingsdata voor problemen: ook racistische teksten, complottheorieën en pseudowetenschappelijke essays worden geanalyseerd en opgenomen in het systeem. Zo heeft het algoritme al antisemitische teksten gegenereerd.

Veel van de veelbelovende voorbeelden van het algoritme zouden bovendien weglaten hoe vaak het ook mis gaat. "GTP-3 gedraagt zich vaak als een slimme leerling die zijn leeswerk niet heeft gedaan en zich een weg door een examen bluft. Het is een aaneenrijging van algemeen bekende feiten, halve waarheden en totale leugens die op eerste oog een soepele vertelling lijkt," zegt AI-onderzoeker Julian Togelius op Twitter.

Meer weten over Huawei en Kunstmatige Intelligentie? Klik hier.