Antico rompicapo grammaticale risolto dopo 2.500 anni

Antico rompicapo grammaticale risolto dopo 2.500 anni

Una pagina di una copia del XVIII secolo del Dhātupāṭha di Pāṇini (MS Add.2351) conservata presso la Biblioteca dell'Università di Cambridge. Credito: Biblioteca dell'Università di Cambridge
Una pagina di una copia del XVIII secolo del Dhātupāṭha di Pāṇini (MS Add.2351) conservata presso la Biblioteca dell’Università di Cambridge. Credito: Biblioteca dell’Università di Cambridge

Un problema grammaticale che ha sconfitto gli studiosi di sanscrito fin dal V secolo a.C. è stato finalmente risolto da un dottore di ricerca indiano. studente all’Università di Cambridge. Rishi Rajpopat ha fatto la svolta decodificando una regola insegnata dal “padre della linguistica”, Pāṇini.

La scoperta rende possibile “derivare” qualsiasi parola sanscrita – per costruire milioni di parole grammaticalmente corrette tra cui “mantra” e “guru” – utilizzando la venerata “macchina linguistica” di Pāṇini, che è ampiamente considerata una delle grandi conquiste intellettuali in storia.

I principali esperti di sanscrito hanno descritto la scoperta di Rajpopat come “rivoluzionaria” e ora potrebbe significare che la grammatica di Pāṇini può essere insegnata ai computer per la prima volta.

Durante la ricerca del suo dottorato di ricerca. In questa tesi, pubblicata oggi, il Dr. Rajpopat ha decodificato un algoritmo vecchio di 2.500 anni che rende possibile, per la prima volta, l’uso accurato della “macchina del linguaggio” di Pāṇini.

Il sistema di Pāṇini – 4.000 regole dettagliate nella sua più grande opera, l’Aṣṭādhyāyī, che si pensa sia stata scritta intorno al 500 a.C. – è pensato per funzionare come una macchina: inserisci la base e il suffisso di una parola e dovrebbe trasformarli in grammaticalmente corrette parole e frasi attraverso un processo graduale.

Fino ad ora, tuttavia, c’è stato un grosso problema. Spesso, due o più regole di Pāṇini sono applicabili simultaneamente allo stesso passaggio, lasciando gli studiosi a tormentarsi su quale scegliere.

Risolvere i cosiddetti “conflitti di regole”, che interessano milioni di parole sanscrite, comprese alcune forme di “mantra” e “guru”, richiede un algoritmo. Pāṇini ha insegnato una metaregola per aiutarci a decidere quale regola dovrebbe essere applicata in caso di “conflitto di regole”, ma negli ultimi 2.500 anni gli studiosi hanno interpretato male questa metaregola, il che significa che spesso hanno ottenuto un risultato grammaticalmente errato.

Nel tentativo di risolvere questo problema, molti studiosi hanno sviluppato faticosamente centinaia di altre metaregole, ma il Dr. Rajpopat mostra che queste non sono solo incapaci di risolvere il problema in questione – hanno prodotto tutte troppe eccezioni – ma anche del tutto inutili. Rajpopat mostra che la “macchina linguistica” di Pāṇini è autosufficiente.

Rajpopat ha detto: “Pāṇini aveva una mente straordinaria e ha costruito una macchina senza rivali nella storia umana . Non si aspettava che aggiungessimo nuove idee alle sue regole. Più giochiamo con la grammatica di Pāṇini, più ci sfugge”.

 

Tradizionalmente, gli studiosi hanno interpretato la metaregola di Pāṇini nel senso che in caso di conflitto tra due regole di uguale forza, vince la regola che viene dopo nell’ordine seriale della grammatica.

Rajpopat lo rifiuta, sostenendo invece che Pāṇini intendeva che tra le regole applicabili rispettivamente al lato sinistro e destro di una parola, Pāṇini voleva che scegliessimo la regola applicabile al lato destro. Utilizzando questa interpretazione, Rajpopat ha scoperto che la macchina linguistica di Pāṇini produceva parole grammaticalmente corrette quasi senza eccezioni.

Prendi “mantra” e “guru” come esempi. Nella frase “Devāḥ prasannāḥ mantraiḥ” (“Gli Dei [devāḥ] sono compiaciuti [prasannāḥ] dai mantra [mantraiḥ]”) incontriamo “conflitto di regole” quando deriva mantraiḥ “dai mantra”. La derivazione inizia con “mantra + bhis”. Una regola è applicabile alla parte sinistra, “mantra’”, e l’altra alla parte destra, “bhis”. Dobbiamo scegliere la regola applicabile alla parte destra, “bhis”, che ci dà la forma corretta, “mantraiḥ”.

Nella frase “Jñānaṁ dīyate guruṇā” (“La conoscenza [jñānaṁ] è data [dīyate] dal guru [guruṇā]”) incontriamo un conflitto di regole quando deriva guruṇā “dal guru”. La derivazione inizia con “guru + ā”. Una regola è applicabile alla parte sinistra, “guru” e l’altra alla parte destra. “un”. Dobbiamo scegliere la regola applicabile alla parte destra, “ā”, che ci dà la forma corretta, “guruṇā”.

Momento Eureka

Sei mesi prima che Rajpopat facesse la sua scoperta, il suo supervisore a Cambridge, Vincenzo Vergiani, professore di sanscrito, gli diede un consiglio preveggente: “Se la soluzione è complicata, probabilmente ti sbagli”.

Rajpopat ha detto: “Ho avuto un momento eureka a Cambridge. Dopo 9 mesi cercando di risolvere questo problema, ero quasi pronto a smettere, non stavo andando da nessuna parte. Quindi ho chiuso i conti per un mese e mi sono goduto l’estate, nuotando, andando in bicicletta , cucinare, pregare e meditare. Poi, a malincuore sono tornata al lavoro, e in pochi minuti, mentre giravo le pagine, questi schemi cominciavano a emergere, e tutto cominciava ad avere un senso. C’era molto altro lavoro da fare ma io’ Ho trovato la parte più grande del puzzle.”

“Nelle settimane successive ero così eccitato, non riuscivo a dormire e passavo ore in biblioteca, anche nel cuore della notte per controllare cosa avevo trovato e risolvere i problemi correlati. Quel lavoro ha richiesto altri due anni e mezzo.”

Significato

Il professor Vincenzo Vergiani ha dichiarato: “Il mio studente Rishi l’ha risolto: ha trovato una soluzione straordinariamente elegante a un problema che ha lasciato perplessi gli studiosi per secoli. Questa scoperta rivoluzionerà lo studio del sanscrito in un momento in cui l’interesse per la lingua è in aumento .”

Il sanscrito è una lingua indoeuropea antica e classica dell’Asia meridionale. È la lingua sacra dell’induismo, ma anche il mezzo attraverso il quale gran parte della più grande scienza, filosofia, poesia e altra letteratura secolare dell’India sono state comunicate per secoli. Sebbene sia parlato solo in India da circa 25.000 persone oggi, il sanscrito ha un significato politico crescente in India e ha influenzato molte altre lingue e culture in tutto il mondo.

Rajpopat ha detto: “Alcune delle più antiche saggezze dell’India sono state prodotte in sanscrito e ancora non comprendiamo appieno ciò che i nostri antenati hanno raggiunto. Spesso siamo stati portati a credere che non siamo importanti, che non abbiamo ha portato abbastanza sul tavolo. Spero che questa scoperta infonda negli studenti in India fiducia, orgoglio e speranza che anche loro possano ottenere grandi cose “.

Una delle principali implicazioni della scoperta del dottor Rajpopat è che ora che abbiamo l’algoritmo che esegue la grammatica di Pāṇini, potremmo potenzialmente insegnare questa grammatica ai computer.

Rajpopat ha dichiarato: “Gli scienziati informatici che lavorano sull’elaborazione del linguaggio naturale hanno rinunciato agli approcci basati su regole oltre 50 anni fa … Quindi insegnare ai computer come combinare l’intenzione di chi parla con la grammatica basata su regole di Pāṇini per produrre il linguaggio umano sarebbe una pietra miliare importante in la storia dell’interazione umana con le macchine, così come nella storia intellettuale dell’India.”

La ricerca è pubblicata sulla rivista Apollo—University of Cambridge Repository .

 

Facebooktwitterlinkedininstagramflickrfoursquaremailby feather

Un sistema universale per decodificare qualsiasi tipo di dato inviato in rete

Un sistema universale per decodificare qualsiasi tipo di dato inviato in rete

Un nuovo chip di silicio può decodificare qualsiasi codice di correzione degli errori attraverso l’uso di un nuovo algoritmo noto come Guessing Random Additive Noise Decoding (GRAND). Credito: Jose-Luis Olivares, MIT, con chip per gentile concessione dei ricercatori

Ogni pezzo di dati che viaggia su Internet, dai paragrafi di un’e-mail alla grafica 3D in un ambiente di realtà virtuale, può essere alterato dal rumore che incontra lungo il percorso, come l’interferenza elettromagnetica di un microonde o di un dispositivo Bluetooth. I dati sono codificati in modo tale che quando arrivano a destinazione, un algoritmo di decodifica possa annullare gli effetti negativi di quel rumore e recuperare i dati originali.

Dagli anni ’50, la maggior parte dei codici di correzione degli errori e degli algoritmi di decodifica sono stati progettati insieme. Ogni codice aveva una struttura che corrispondeva a un particolare algoritmo di decodifica molto complesso, che spesso richiedeva l’uso di hardware dedicato.

I ricercatori del MIT, della Boston University e della Maynooth University in Irlanda hanno ora creato il primo chip di silicio in grado di decodificare qualsiasi codice, indipendentemente dalla sua struttura, con la massima precisione, utilizzando un algoritmo di decodifica universale chiamato Guessing Random Additive Noise Decoding (GRAND) . Eliminando la necessità di più decoder computazionalmente complessi, GRAND consente una maggiore efficienza che potrebbe avere applicazioni in realtà aumentata e virtuale, giochi, reti 5G e dispositivi connessi che si basano sull’elaborazione di un volume elevato di dati con un ritardo minimo.

Concentrati sul rumore

Un modo per pensare a questi codici è come hash ridondanti (in questo caso, una serie di 1 e 0) aggiunti alla fine dei dati originali. Le regole per la creazione di quell’hash sono memorizzate in uno specifico codebook.

Quando i dati codificati viaggiano su una rete, sono influenzati dal rumore , o energia che interrompe il segnale, che è spesso generato da altri dispositivi elettronici. Quando quei dati codificati e il rumore che li ha colpiti arrivano a destinazione, l’algoritmo di decodifica consulta il suo codebook e utilizza la struttura dell’hash per indovinare quali sono le informazioni memorizzate.

Al contrario, GRAND funziona indovinando il rumore che ha influenzato il messaggio e utilizza il modello di rumore per dedurre le informazioni originali. GRAND genera una serie di sequenze di rumore nell’ordine in cui è probabile che si verifichino, le sottrae dai dati ricevuti e verifica se il codice risultante è in un codice.

Sebbene il rumore appaia di natura casuale, ha una struttura probabilistica che consente all’algoritmo di indovinare cosa potrebbe essere.

“In un certo senso, è simile alla risoluzione dei problemi. Se qualcuno porta la propria auto in officina, il meccanico non inizia mappando l’intera macchina su progetti. Invece, inizia chiedendo: ‘Qual è la cosa più probabile da fare? sbagliato?’ Forse ha solo bisogno di gas. Se non funziona, qual è il prossimo passo? Forse la batteria è scarica?” dice Medard.

Nuovo hardware

Il chip GRAND utilizza una struttura a tre livelli, partendo dalle soluzioni più semplici possibili nella prima fase e lavorando fino a modelli di rumore più lunghi e complessi nelle due fasi successive. Ogni fase funziona in modo indipendente, il che aumenta il rendimento del sistema e consente di risparmiare energia.

Il dispositivo è inoltre progettato per passare senza problemi tra due libri di codici. Contiene due chip di memoria statici ad accesso casuale, uno in grado di decifrare le parole in codice, mentre l’altro carica un nuovo libro di codici e quindi passa alla decodifica senza tempi di inattività.

I ricercatori hanno testato il chip GRAND e hanno scoperto che potrebbe decodificare efficacemente qualsiasi codice di ridondanza moderata fino a 128 bit di lunghezza, con solo circa un microsecondo di latenza.

Médard e i suoi collaboratori avevano precedentemente dimostrato il successo dell’algoritmo, ma questo nuovo lavoro mostra per la prima volta l’efficacia e l’efficienza di GRAND nell’hardware.

Lo sviluppo dell’hardware per il nuovo algoritmo di decodifica ha richiesto ai ricercatori di mettere prima da parte le loro nozioni preconcette, afferma Médard.

“Non potevamo uscire e riutilizzare le cose che erano già state fatte. Era come una lavagna completa. Abbiamo dovuto pensare davvero a ogni singolo componente da zero. È stato un viaggio di riconsiderazione. E penso che quando faremo il nostro prossimo chip, ci saranno cose con questo primo chip che ci renderemo conto di aver fatto per abitudine o per supposizione che possiamo fare di meglio”, dice.

Un chip per il futuro

Poiché GRAND utilizza solo i codici per la verifica, il chip non funziona solo con codici legacy, ma potrebbe anche essere utilizzato con codici che non sono stati ancora introdotti.

In vista dell’implementazione del 5G, le autorità di regolamentazione e le società di comunicazione hanno faticato a trovare un consenso su quali codici dovrebbero essere utilizzati nella nuova rete. I regolatori alla fine hanno scelto di utilizzare due tipi di codici tradizionali per l’infrastruttura 5G in situazioni diverse. L’utilizzo di GRAND potrebbe eliminare la necessità di quella rigida standardizzazione in futuro, afferma Médard.

Il chip GRAND potrebbe persino aprire il campo della codifica a un’ondata di innovazione.

“Per ragioni di cui non sono del tutto sicuro, le persone si avvicinano alla programmazione con timore reverenziale, come se fosse magia nera. Il processo è matematicamente sgradevole, quindi le persone usano semplicemente codici che esistono già. Spero che questo riformula la discussione in modo che sia non così orientato agli standard, consentendo alle persone di utilizzare codici già esistenti e creare nuovi codici”, afferma.

Andando avanti, Médard e i suoi collaboratori hanno in programma di affrontare il problema del rilevamento morbido con una versione riorganizzata del chip GRAND. Nel rilevamento morbido, i dati ricevuti sono meno precisi.

Hanno anche in programma di testare la capacità di GRAND di decifrare codici più lunghi e complessi e regolare la struttura del chip di silicio per migliorarne l’efficienza energetica.

Facebooktwitterlinkedininstagramflickrfoursquaremailby feather