Codex MondragonisBeinecke MS 408 · ricerca

Beinecke MS 408 · Manoscritto Voynich

Il manoscritto piu' misterioso del mondo, misurato invece che indovinato.

Il Voynich non e' decifrato, e questa ricerca non pretende di averlo fatto. Quello che offre e' una caratterizzazione dei dati e uno strumento che dice, per ogni ipotesi, se batte il caso oppure no.

Prova il validatoreSfoglia il manoscritto

La pergamena e' datata al radiocarbonio tra il 1404 e il 1438, di area italo-germanica alpina. La struttura del libro, erbario, calendario astrologico-medico, sezione balneologica, farmacia con vasi albarelli, e' il sapere di un medico-speziale del primo Quattrocento. Sappiamo com'e' fatto il testo: quello che manca, per leggerlo, e' un aggancio al significato che nessuno ha mai fornito con prova.

1404–1438
Datazione al radiocarbonio
Pergamena, Italia settentrionale
~2 bit
Entropia condizionale h2
Le lingue europee stanno a 3–4
184
Pagine navigabili
Su 213 scansioni Yale
21
Ipotesi messe alla prova
18 chiuse contro la baseline

Il metodo

Ogni ipotesi va confrontata con il caso

Con un dizionario latino di decine di migliaia di forme brevi, quasi ogni stringa di lettere assomiglia a una parola reale. Un metodo che combina glifi finche' non esce una parola di senso compiuto trova letture plausibili anche nel rumore. Lo abbiamo verificato: sulla pagina f111r il 38% delle parole diventa latino, contro il 35% del rumore con la stessa statistica. Indistinguibili.

Per questo ogni risultato del sito porta accanto la sua baseline: il punteggio che si otterrebbe per puro caso. Una decifrazione autentica non e' un mucchio di letture separate, e' una sola regola coerente che, applicata alla cieca, fa funzionare molti agganci insieme. Quel vincolo incrociato e' cio' che il caso non sa imitare, ed e' cio' che il validatore misura.

Come funziona il validatoreLa galleria dei falsi positivi

Cosa abbiamo misurato sui dati reali

Entropia condizionale bassa

A livello di glifo h2 vale circa 2 bit, contro i 3–4 delle lingue naturali. Esclude un cifrario a sostituzione semplice o polialfabetico di una lingua europea.

Vocabolario partizionato per tema

La sovrapposizione tra sezioni (Jaccard) e' 0,10–0,16. Manca il collante di parole-funzione comuni a ogni capitolo che ha una lingua trascritta.

La riga come unita' funzionale

La forma delle parole dipende dalla posizione sulla riga e sul paragrafo. Una lingua semplicemente trascritta non si comporta cosi'.

Struttura a caselle e slot

I glifi occupano posizioni fisse: classi iniziali, finali, prefissi. La grammatica interna delle parole e' ricostruibile con precisione.

Generabilita' combinatoria

80 prefissi per 80 suffissi coprono l'87% delle parole. E' cio' che predice il modello della griglia di Cardano.

Nessuna chiave fissa funziona

Specchiatura, inversione, sostituzione, numeri, anagramma a regola fissa: sono biiezioni, non cambiano l'entropia. Per ragione matematica non possono dare il latino.

Cosa resta aperto

Due ipotesi serie, entrambe possibili

Una lingua naturale insolita

Molto abbreviata, sillabica o fortemente flessiva. La rigidita' posizionale del Voynich (0,76) e' vicina a quella del latino reale (0,72). La legge di Zipf e le reti semantiche di sezione sono compatibili con una lingua vera.

Un sistema costruito

Una lingua artificiale per categorie, nello spirito della Lingua Ignota di Ildegarda, oppure un testo generato con tabella e mascherina. La copertura combinatoria all'87% con 80 prefissi e 80 suffissi pende verso un meccanismo generativo.

La struttura interna e' compatibile con entrambe. Cio' che manca per decidere e' un'ancora: una parola confermata, un bilingue, un valore sonoro certo. Ildegarda lascio' il suo glossario, l'autore del Voynich no.

La ricerca

Diego «DMUX» De Maio e Simona «51m0» Fenoglio

Un lavoro condotto in ART AG (YurekAI), con strumenti riproducibili e dati pubblicati.

Chi siamo