Etablering af en model for diskursrelationer: Til annotation af danske og italienske tekster

Morten Gylling-Jørgensen

Student thesis: Master thesis

Abstract

Facendo parte del progetto di ricerca The Copenhagen Dependency Treebank questa tesi cercherà di realizzare un modello per relazioni testuali per l’uso di annotazione di testi danesi e italiani. Il lavoro svolto rivela soprattutto come si può realizzare un modello di facile utilizzo e come questo modello funziona in pratica. In confronto ai precedenti modelli degli studiosi linguistici della Rhetorical Structure Theory e del Penn Discourse Treebank che non circoscrivono con precisione la differenza tra le relazioni sintattiche e quelle testuali, il presente modello tesi annota le relazioni interfrasali suddivendole in tipi, sottotipi e connettivi/congiunzioni. Per prima esamineremo come il termine testo è stato utilizzato nel passato e rivedremo i risultati delle precedenti ricerche per sapere se vi sono osservazioni particolarmente interessanti e relazioni dal livello intrafrasale che si possono riutilizzare sul livello interfrasale. In seguito sarà presentato il corpo testuale che deriva dallo stesso corpo del progetto di ricerca soprammenzionato e che consiste di 80 testi in danese e 80 testi tradotti in italiano. Avendo trovato il metodo adatto e avendo presentato il corpo testuale, prenderà luogo la realizzazione del modello spiegando le motivazioni delle scelte delle varie relazioni testuali inclusi i sottotipi, i connettivi e le congiunzioni. Inoltre, il modello include i principi di annotazione di relazioni dubbiose, di relazioni plurivalenti, d'attribuzione e di altre costruzioni particolari. La realizzazione del modello sarà seguita da un capitolo che cercerà a spiegare come il modello funziona in pratica. Per questo motivo si includerà il corpo testuale sia in danese sia in italiano in modo da esaminare come le relazioni si manifestano nella lingua naturale. Quest’analisi rivelerà che, molto spesso, la lingua utilizza le relazioni che esprimono l'elaborazione e la congiunzione per completare gli argomenti del testo e per far progredire la storia del testo. Inoltre, sulla base dei tipi di testi scelti nei corpi, si possono anche constatare parecchi esempi di relazioni causali, concessive e di conseguenza con cui l’autore prova a convincere il lettore dei suoi argomenti. Inoltre, si vede, dai risultati dell'analisi, che sia in danese che in italiano i connettivi e le congiunzioni impliciti sono più frequenti rispetto a quelli espliciti il che è una delle differenze più significante tra il nostro modo di analizzare, cioé nel livello interfrasale, e le precedenti analisi riguardanti le relazioni testuali. Un'altra differenza sta nel fatto che i testi italiani contengono una minore quantità di relazioni rispetto ai testi danesi. La conclusione di questo risultato sarà che una discreta parte delle sequenze danesi sono state unite in una frase nelle traduzioni italiane. E' però di assai importanza che si tenga presente che la maggior parte dei testi in italiano è stata tradotta parola per parola il che da un punto di vista comparativo non fornisce i migliori criteri di confronto. Avevamo semplicemente aspettato più differenze semantiche, sintattiche e pragmatiche tra le due lingue, ma siamo costretti a concludere che il miglior metodo per analizzare il testo comparativamente è stato quello di utilizzare testi paralleli. In tale modo si può esaminare meglio se, per esempio, si usano più sequenze subordinate in italiano che in danese. La conclusione di questa tesi sarà quindi che il modello di facile utilizzo consistente di un totale di 13 relazioni con 20 sottotipi suddivise in due gruppi, cioè quelle semantiche e quelle funzionali, può essere utilizzato per l'annotazione dei testi in danese e in italiano. Aumentando la quantità di testi e il genere dei testi, si deve sempre tener conto che il numero di relazioni potrà allargarsi. Abbiamo anche imparato che vi sono varie somiglianze tra i fenomeni linguistici sul livello intrafrasale e su quello interfrasale, ma ci sono pure delle differenze. Per avere un adeguato fondamento scientifico, è oppourtuno l'utilizzo di testi simili nel contenuto e nel genere, anziché testi tradotti testualmente.

EducationsMA in International Business Communication (Intercultural Marketing), (Graduate Programme) Final Thesis
LanguageDanish
Publication date2009
Number of pages181