ROMA - Un ricercatore del Politecnico di Losanna ha inventato un algoritmo che scansiona Wikipedia per articoli importanti che non sono ancora stati tradotti in altre lingue. In questo modo, l'enciclopedia online potrà espandersi e dare una maggiore copertura anche alle minoranze linguistiche.
Per i redattori di Wikipedia è difficile capire da dove cominciare il lavoro di traduzione ed è qui che entra in gioco il sistema di Robert West: è un algoritmo di apprendimento che identifica e mette in ordine d'importanza gli articoli per ogni lingua, un compito più complicato di quanto sembra. Con 40 milioni di articoli in 293 lingue, Wikipedia è l'enciclopedia più grande mai realizzata. La lingua inglese è la più avvantaggiata, con 5.4 mln di pagine, che coprono 60 volte più argomenti dell'Enciclopedia Britannica.
Ma non tutti gli idiomi possono disporre di una copertura così ampia: per esempio, il riscaldamento globale è di interesse cruciale in Madagascar, ma non c'è neanche un articolo su quest'argomento in malgascio. Per aiutare le macchine a capire quanto è importante un articolo per una determinata lingua, è stato necessario calcolare quante visualizzazioni teoriche potrebbe avere. I ricercatori hanno fatto la stima prendendo in considerazione tutte le lingue e lasciando poi alla macchina il compito di dare ad ognuna il giusto peso. Ad esempio, il giapponese è più importante dell'inglese se si tratta di predire l'impatto di una pagina in cinese. Alla fine, la lista di argomenti mancanti appare su una nuova piattaforma, chiamata Wikipedia GapFinder, da dove i redattori completano il lavoro facendo la traduzione.