Dimmi come scrivi, ti dirò di che sesso sei

di Clive Thompson


Immaginate la pagina di un libro o di un giornale: sareste capaci di riconoscere se l'autore è un uomo o una donna solo leggendo il testo?
Moshe Koppel, docente di informatica presso l'università israeliana di Bar Ilan, è in grado di farlo. Il gruppo di ricercatori da lui guidato ha infatti condotto con successo un esperimento di "individuazione di genere": con l'aiuto di un algoritmo di loro invenzione, gli scienziati hanno esaminato testi anonimi riuscendo a determinare il sesso dell'autore con un'approssimazione superiore all'80%. Un risultato che imprime una svolta tecnologica a un dibattito molto antico, dato che per secoli si è discusso se uomini e donne abbiano un modo diverso di comunicare.

L'aspetto curioso è che le diversità di linguaggio evidenziate dai ricercatori non si riferiscono a termini complessi o importanti, ma a parti del discorso all'apparenza banali, come i "se" e i "ma". Il gruppo guidato da Koppel, per esempio, ha riscontrato che la maggior differenza tra i due sessi sta nella propensione da parte delle donne a fare maggior uso dei pronomi personali (io, tu, lei, etc.) rispetto agli uomini. Che invece prediligono gli aggettivi dimostrativi (questo, quello), i numeri cardinali e gli aggettivi riferiti a quantità (più, alcuni, etc.).

Possibile che parole così banali siano rivelatrici della nostra identità? Da tempo, in realtà, gli esperti di analisi testuale si affidano proprio a queste piccole parti del discorso. Il motivo è che quando si scrive un testo ci si concentra sull'uso delle parole-chiave dell'argomento in oggetto (in questo articolo, per esempio, sui termini "computer", "programma" e "sesso"), ma non altrettanto su come vengono utilizzate le parti elementari del discorso. Questo significa che tendiamo a disseminarle nel testo seguendo schemi inconsci e proprio per questo rivelatori.

Per interpretare questi impercettibili modelli, il team di Koppel ha passato al setaccio 604 testi tratti dal British National Corpus, una raccolta di oltre quattromila documenti assemblati dagli accademici al fine di agevolare lo studio dell'uso della lingua inglese moderna. I testi prescelti erano scritti per metà da donne e per metà da uomini e spaziavano da romanzi a opere di saggistica.
I ricercatori dapprima hanno eliminato dai testi tutte le parole-chiave specialistiche legate al particolare argomento trattato. Poi hanno fatto analizzare gli scritti da un algoritmo di intelligenza artificiale, programmato per individuare elementi di uso esclusivo del gruppo femminile e di quello maschile in base alla frequenza di utilizzo. Il campo di indagine si è così ristretto a 50 termini, risultati particolarmente indicativi. Su questa base i ricercatori hanno esaminato altri documenti del British National Corpus, riuscendo a determinare il sesso degli autori con un'approssimazione superiore all'80%. La tecnica si è rivelata così raffinata da permettere di individuare il genere degli autori anche quando sono state analizzate pubblicazioni scientifiche, ossia quanto di più neutro e asettico si potrebbe immaginare in fatto di scrittura.

Secondo Koppel, i risultati dell'indagine sono una conferma a ipotesi precedentii: il fatto che le donne usino più degli uomini i pronomi personali riporta al vecchio detto le donne parlano delle persone, gli uomini delle cose.
Secondo Deborah Tannen, linguista e autrice di best-sellers sulla comunicazione tra generi, i dati della ricerca non sono poi così sorprendenti: "Non solo le donne scrivono con più frequenza degli uomini, ma cercano anche di stabilire un rapporto più intimo con il lettore, il che porta a intensificare l'uso dei pronomi".

C'è però chi teme che questi esperimenti potrebbero esasperare artificiosamente le differenze tra i sessi. "Tutta questa foga categorizzatrice finisce per andare contro le donne" - afferma la linguista americana Janet Bing, che sottolinea anche come omosessuali e transessuali non rientrino in semplici definizioni sociali di genere maschile o femminile. " Mi chiedo se l'algoritmo di Koppel funzionerebbe altrettanto bene su testi di autori appartenenti a questi gruppi", afferma la Bing.
Koppel giudica queste obiezioni un interrogativo interessante, ma ammette di non avere la risposta: "Finora non abbiamo condotto esperimenti di questo tipo".


da: IL VENERDI di Repubblica, 5 settembre 2003