Roberto Zamparelli

Corso Bettini, 31 - 38068 Rovereto
tel. 0464 808613
roberto.zamparelli[at]unitn [dot] it
Possible Theses Topics Theoretical Linguistic...
lunedì 07 febbraio 2022

Possibili argomenti di tesi

Linguistica teorica

 

Sono interessato a supervisionare tesi su argomenti di linguistica teorica, specialmente quelli che riguardano l'interfaccia sintassi/semantica.

Requisiti: gli studenti interessati a questi argomenti dovrebbero aver seguito vari corsi di linguistica, incluso il mio corso di Advanced Methods, o aver acquisito in altro modo una competenza sia nella sintassi generativa che nella semantica formale.

  • Nominalizzazione: es. differenza tra vari modi di derivare sostantivi dai verbi (es. "distruzione" vs. "distruggere" vs. italiano "Il distruggere" vs. "distruggere (è uno spasso)"). Connessioni con: Psicolinguistica, Analisi computazionale.
  • Kinds: come derivare i diversi modi in cui le lingue si riferiscono a "tipi di cose" ed esprimono generalizzazioni su di essi (es. "Le tigri mangiano carne", "La tigre mangia carne", "Una tigre mangia carne"); come funziona il riferimento anaforico ai tipi?
  • Definitezza e dimostrativi Come esprimono la definitezza le lingue che non hanno articoli definiti? Come vengono usati i dimostrativi nelle varie lingue? Quanto sono definiti i possessivi?
  • Coordinazione C'è un significato comune per la parola "e" in "Lui era alto e grasso / Lui se ne andò e lei tornò / Gli ospiti erano in cucina e sul balcone"? Questo articolo dà una proposta, ma una ricerca successiva ha mostrato che il sistema non funziona con la coordinazione delle proprietà in ambienti monotonici verso il basso. Si può risolvere questo problema?
  • Le correlative dell' italiano. Sviluppare una teoria parsimoniosa della gamma di significati che si trovano nelle costruzioni che usano tanto ("Giann dorme tanto" "Tanto, Gianni dorme", "Gianni dorme tanto da preoccuparmi" "Gianni dorme tanto per essere un vecchio", etc.) e quanto.

Metodologie linguistiche

Questi sono argomenti che esplorano nuovi metodi per affrontare questioni linguistiche classiche. Gli studenti che desiderano perseguire questi temi dovrebbero avere un certo background in linguistica (sintassi o semantica) e un buon background in linguistica computazionale (comprese, in alcuni casi, le reti neurali artificiali ANN e la semantica distribuzionale)

  • Modallità alternative per raccogliere dati linguistici attraverso i GWAP (Giochi con uno scopo). Questo include il lavoro sul sito web Actors Challenge (AC), dove i giocatori si sfidano a vicenda sulle loro abilità di recitazione, e così facendo generano e convalidano dati sul legame tra intonazione e significato. Possibili tesi potrebbero comportare la modifica di AC per consentire contesti in formati audio, o per chiedere ai giocatori di scegliere parole per descrivere un certo profilo intonativo.
  • Usare ANN per simulare giudizi linguistici umani (parte del progetto linguistico TREIL). Possiamo migliorare le attuali architetture di rete per renderle più efficaci nel catturare questo compito? Qual è il modo migliore per misurare la sensibilità di una rete ad un input sgrammaticato? Può la NN riconoscere frasi semanticamente devianti (ad esempio "Tutte le/*alcune persone sono venute tranne Bill" "Mi piacciono di più gli alberi che le querce", vedi questo Semeval Task)
  • Modelli linguistici applicati a ritroso Una parte del progetto TREIL prevedeva l' addestramento di modelli linguistici applicati su frasi con ordine normale ed inverso, per studiare la loro differenza in una lingua con testa a sinistra come l'inglese. Un interessante progetto di tesi sarebbe quello di rifare l'esperimento riallenando la stessa architettura su una lingua con testa-finale (ad esempio turco, giapponese) e confrontare i risultati.
  • Alimentare ANN una serie di lingue/strutture linguistiche per convergere su universali linguistici (strutture condivise da tutte le lingue). Che tipo di compiti potrebbero essere meglio utilizzati per studiare la "competenza" sviluppata da questa rete "poliglotta"? Possiamo dargli in pasto frasi artificiali con caratteristiche che nessuna lingua ha e sperare che queste vengano rilevate?
  • Estrarre nuovi dati da Wikipedia. Wikipedia mantiene una traccia della storia delle modifiche di ogni articolo. È possibile utilizzare queste informazioni per costruire un set di dati utili per addeestrare un sistema che cerca di indovinare dove un testo di Wikipedia verrà modificato?
  • Structure folding L'attuale sintassi teorica spesso immagina sequenze universali complesse di proiezioni funzionali, parti delle quali si muovono per generare l'output che vediamo nelle lingue reali, in modi diversi a seconda della struttura dei tratti presenti in ogni lingua. Il compito sarebbe quello di creare un modello che esplori lo spazio delle caratteristiche creando artificialmente tutti i modi in cui una sequenza funzionale può essere piegata e confrontando poi l'output con strutture linguistiche conosciute.

Psicolinguistica

Pur non essendo uno psicolinguista, sono disposto a fare da cosupervisore a studenti interessati a temi specifici della comprensione della frase. In particolare, sono interessato a:

  • Un follow up dell'esperimento THINK (estrazione di correlati ERP del processo di ripetizione o traduzione mentale di frasi), che è stato realizzato da uno studente del master CIMEC.
  • Usare il set di dati sulla malformazione dei presupposti semantici sviluppato per il PreTENS Semeval Task per osservare l'N400 nei parlanti esposti a questo tipo di malformazione, che è assai poco studiato.

Educazione linguistica

L'educazione per il pubblico in generale e per gli studenti più giovani fa parte della "terza missione" di un'università. Sono interessato a sviluppare nuovi modi di insegnare le strutture linguistiche (che potrebbero o meno far parte dell'effettivo insegnamento delle "lingue"). Un paio di argomenti.

  • Testare ed espandere Puzz-Ling, un puzzle fisico del funzionamento del linguaggio, utilizzabile per insegnare le strutture di base delle frasi in inglese, italiano e tedesco. Lavorare su questo argomento potrebbe significare (in ordine di complessità crescente). 
    • Progettare e ottimizzare le regole del gioco.
    • Testare puzz-ling e controllare quali aspetti non sono ancora coperti o quando il gioco si sovragenera.
    • Espandere il gioco ad altre lingue (per esempio spagnolo, francese)
    • Progettare implementazioni alternative che risolvano i problemi attuali (ad esempio, selezione a teste, piuttosto che a categorie; sensibilità all'isola)
    • Progettare una versione digitale "mista" (chiedetemi).
  • Progettare un modello fisico di sintassi per lingue ricche di casi e con ordine delle parole libero, come il latino e il greco. Questo potrebbe essere basato su una grammatica a dipendenze, piuttosto che su una grammatica basata sui costituenti come Puzz-Ling.
  • Modi migliori per divulgare i significati distributivi. La semantica distributiva può darci misure di similarità quantitative, basate su vettori, per parole, collocazioni e costruzioni (vedi sopra), ma rimane difficile trasmettere queste informazioni al grande pubblico, al di là di dire  "A è più simile a B che a C". Molto probabilmente richederebbe una cosupervisione con qualcuno esperto di grafica e interfacce.