Analisi delle Parole


Shake-speare
In una analisi del First Folio ci si accorge che nelle dediche viene riportato il nome Shakespeare e a volte Shake-speare quindi si ritiene che fosse nom de plume in quanto riportato senza una regola ben precisa, sicuramente non Shakesper, nome riportato dalla prestigiosa SAT nel loro sito web https://shakespeareanauthorshiptrust.org/ per indicare uno dei candidati alla persona indicata come William Shakespeare.

Parole più frequentemente utilizzate
Attraverso la ricerca delle parole più frequentemente utilizzate si sostiene che le parole più utilizzate in un dato testo contribuirebbero a far emergere lo stile di scrittura del suo autore. L'attribuzione della paternità esamina un testo di paternità sconosciuta o contestata e si tenta di attribuire il testo a un auto-re noto sulla base di testi di quell’autore noti. Le commedie di Shakespeare raccolte nel First Folio sono di autore ignoto perché non è provata scientificamente la paternità. Studi hanno provato l’efficacia dell’analisi stilometrica dove la frequenza sembra essere una delle tecniche meglio di altre colgono l’essenza dell’autore. Parlando di frequenza di parole, ripresa anche con il termine most frequent words, la nozione di frequenze relative delle parole è abbastanza semplice. Si procede con il contare tutti i token, ad esempio tutte le attestazioni della parola “home”, e si divide il numero di tipi per il numero totale di parole in un documento, di conseguenza, ogni frequenza di parola è uguale alla sua percentuale all'interno del documento, es. "lord" = 0.10, e tutte le frequenze si sommano fino a 1; il motivo della conversione occorrenze a frequenze relative è ovvio: così facendo, si è in grado di confrontare in modo affidabile i testi che differiscono per lunghezza. La nozione di frequenze relative delle parole è così facilmente applicabile. Il testo inoltre è stato filtrato escludendo le stopword; queste sono parole che vengono filtrate prima o dopo le parole chiave che trasportano effettivamente l’informazione nel testo. Di conseguenza, la maggior parte delle stop words, se prese singolarmente, non hanno un significato particolare. Da un confronto con le opere di Bacon, Marlowe e Giovanni Florio sono stati rilevati i seguenti risultati.1


Il valore indica la percentuale di parole presenti nei testi dei singoli autori presenti anche nel First Folio. La percentuale più alta risulta essere quella del volume “Second Frutes” di Giovanni Florio (John Florio) a cui diamo la probabilità più alta per l’attribuzione della paternità delle opere di Shakespeare.

Parole in comune con il dizionario Queen Anna's New World of Words
Il lessico si riferisce alla totalità delle parole e delle espressioni utilizzate in una determinata lingua o in un contesto specifico. In questo senso, la ricchezza del lessico è indicativa della capacità di una persona di utilizzare parole precise, specifiche e ricercate per esprimere i propri pensieri e le proprie idee. Si sono analizzati i testi di Bacon, Marlowe, della traduzione di Florio del Decameron e dei saggi di Montaigne (quest'ultima traduzione ancora oggi insuperata). I risultati del confronto di quante parole sono comuni con il dizionario Queen Anna's New World of Words è il seguente:2

First Folio 17299
Essays 16082
Decameron 10765
Marlowe 6681
Bacon 6820

Come si può ben vedere la raccolta delle commedie di Shakespeare (First Folio) e gli Essays di Montaigne tradotti da Florio hanno la medesima caratteristica: essere estremamente ricchi nel vocabolario utilizzato andando a raggiungere un valore simile (17mila e 16mila) ben distanti dal vocabolario utilizzato da Bacon e Marlowe andandosi a fermare tra i 6mila e 7mila termini ciascuno.

Il numero di parole diverse utilizzate nel First Folio
Si è calcolato il numero di parole diverse utilizzate nel First Folio di Shakespeare, andando a filtrare tale numero eliminando le stopword. Le stopword sono parole comuni che vengono spesso utilizzate in una lingua, ma che non contribuiscono significativamente al significato di una frase o di un testo. Si tratta di parole come "il", "la", "e", "di", "in", "che", "per", "a", "con" e molte altre, a seconda della lingua. Tale numero ha il seguente ragguardevole valore:

31944

[1]https://www.academia.edu/100753936/William_Shakespeare_Authorship
[2]https://www.academia.edu/100753582/William_Shakespeare_Authorship_Lessico


Torna in testa