Algoritme ontcijfert dode talen
Onderzoekers aan het Massachusetts Institute of Technology hebben een algoritme ontwikkeld dat dode talen kan ontcijferen - talen die niet alleen niet meer gesproken of begrepen worden, maar het algoritme hoeft ook niet vooraf te weten wat de relatie van deze taal is tot andere talen.
Het ontcijferen van een dode taal is vaak een slepend proces dat soms wel tientallen jaren kan duren. Vandaag de dag zijn er nog minstens twaalf talen die niemand heeft kunnen ontcijferen.
De meeste talen die ooit zijn gesproken zijn al verdwenen, en van de talen die nog over zijn wordt voorspeld dat ze binnen de komende honderd jaar verdwijnen. Dit nieuwe algoritme zou niet alleen kunnen helpen om dode talen te begrijpen, maar ook om kennis en cultuur binnen een bestaande taal niet te laten verdwijnen als die taal niet langer gesproken wordt.
Bij het bouwen van het algoritme hebben de wetenschappers het International Phonetic Alphabet gebruikt. Hierbij suggereert een woord met een ‘p’ dat het in een oudere taal wellicht werd uitgesproken als een ‘b’, maar niet als een ‘k’, omdat dat een fundamenteel andere klank is. Deze patronen worden vervolgens in een wiskundig model gegoten waardoor het model woorden uit een dode taal kan linken aan een andere taal. Ook kan het algoritme verschillende taalfamilies identificeren. Zo ontdekte het algoritme dat het Iberisch niet gerelateerd is aan het Baskisch - in overeenstemming met ander recent onderzoek.
Meer weten over Huawei en Kunstmatige Intelligentie? Klik hier.