Wayback Machine
Mar Apr JUN
Previous capture 8 Next capture
1999 2000 2001
6 captures
8 Apr 00 - 18 Aug 01
sparklines
Close Help

Riflessioni sul Markup


Dino Buzzetti
University of Bologna
Department of Philosophy
Via Zamboni, 38
40126 Bologna
Tel. +39 051 209 8357 - Fax 051 209 8355

Abstract of the paper submitted to "Computers, Literature and Philology 1999" Rome, 3-5 November 1999


1. Il confronto con la rappresentazione convenzionale fissa le condizioni minimali di adeguatezza per la rappresentazione digitale del testo. La rappresentazione digitale deve essere (a) esaustiva, qualora riproponga un testo a stampa o manoscritto; e deve essere (b) funzionale alle varie forme di analisi filologica e interpretativa del testo. Il tipo di dato impiegato per rappresentare l'informazione testuale, la pura e semplice stringa di caratteri codificati è troppo povera ed è priva di struttura. La codifica del testo, il markup aggiunto al flusso di caratteri costituisce la risposta più compiuta al problema dell'adeguatezza. Il markup integra l'informazione fornita dalla mera successione dei caratteri e le assegna una struttura.

Ma il modello di codifica affermatosi con la TEI soddisfa pienamente le condizioni di adeguatezza? L'interrogativo è cruciale per la caratterizzazione stessa della testualità digitale. Jerome McGann ha recentemente scritto che "i problemi della TEI non sono tecnici, ma sistematici" (mGb, 2). In ultima analisi essi rimandano alla definizione dello status logico e linguistico del markup. Quali relazioni strutturali sussistono tra l'insieme dei marcatori e, rispettivamente, l'espressione e il contenuto del testo? Può una struttura definita a partire dall'espressione essere assegnata al contenuto del testo? Lo slittamento avviene spesso inavvertitamente e pare dipendere dalle caratteristiche formali del linguaggio di markup. L'SGML impiegato come forma di strongly embedded markup (RTW, 3) genera strutture che sono funzione dell'ordinamento lineare dei caratteri, cioè funzione della struttura dell'espressione del testo. È tuttavia evidente che la struttura dell'espressione non può essere assunta, in generale, come struttura del contenuto del testo, né come modello formale per l'elaborazione dell'informazione testuale. Solo l'indipendenza del modello dalla "linearizzazione" (H-SmQ, 30) della rappresentazione può assicurarne l'adeguatezza. I vincoli del modello debbono essere determinati semanticamente e non possono essere desunti dalla sintassi del documento: essi dipendono dal contenuto del testo, non dalla forma lineare della sua espressione. Ogni struttura testuale comunque complessa può essere rappresentata, in linea di principio, con "appositi costrutti in SGML" (HSmQ, 40), ma i vincoli del loro modello di elaborazione non possono, in generale, essere specificati con una document grammar, cioè con una DTD (HSmQ, 41).

Pare così che forme di markup cosiddette out-of-line o weakly embedded (RTW, 3-4) risultino più adeguate alle specifiche esigenze della codifica del testo. Il formato SGML o, più ancora, XML può costituire un eccellente formato di scambio, formalmente convalidabile, tra applicazioni appositamente sviluppate per l'edizione e l'analisi del testo.

2. Ma qual è esattamente lo status del markup in relazione al testo? Si osservi, per esempio, la punteggiatura. Essa può, a pieno titolo, essere considerata una forma di markup; d'altra parte essa è anche "parte" integrante "del nostro sistema di scrittura" (CRdR, 935). Allora, la dobbiamo considerare come una descrizione metalinguistica della struttura sintattica o stilistica del testo, oppure come un'espressione aspetto autoreferenziale appartenente al suo linguaggio-oggetto? La questione non è affatto oziosa e un'attenta considerazione dello status logico-linguistico del markup pare indispensabile ad una sua efficace e consapevole utilizzazione critica.

Il markup può essere descritto, al tempo stesso, come una "tecnica per rappresentare la struttura" (RTW, Abstract) e come "struttura" appartenente direttamente al testo (RTW, 4). Il markup è quindi ad un tempo rappresentazione e rappresentazione della rappresentazione del testo. Inteso come rappresentazione, esso rappresenta il contenuto o l'espressione del testo e ne esprime direttamente la struttura; inteso come rappresentazione della rappresentazione del testo, esso rappresenta metalinguisticamente la struttura dell'espressione o, rispettivamente, del contenuto del testo. In ogni caso, si tratta della rappresentazione di un aspetto strutturale del testo, del contenuto o dell'espressione, in cui si può realizzare una funzione autoriflessiva del rappresentare.

Il markup può così rendere espliciti specifici aspetti autoreferenziali del testo, in cui si esprime l'indeterminazione del rapporto tra espressione e contenuto. Il markup si fa allora forma propria della manifestazione di tale rapporto e attraverso la codifica del testo possono essere rappresentati i fenomeni di compensazione dinamica tra la struttura dell'espressione (varianti testuali) e la struttura del contenuto (interpretazioni del testo).

Infatti, assunti come espressioni del linguaggio-oggetto, i marcatori usati per esprimere diverse strutture concettuali e interpretative del testo possono essere assimilati a distinte varianti testuali. Reciprocamente, distinte varianti testuali possono essere assimilate all'espressione di diverse interpretazioni del testo. Il markup può quindi trasformare le varianti interpretative in varianti testuali e le varianti testuali in varianti interpretative e può essere considerato espressione variante di un contenuto sempre identico a se stesso, o esplicitazione della varianza di contenuto di un'unica e sempre identica espressione del testo. Esso diviene allora strumento idoneo per trasformare la varianza implicita dell'interpretazione di un'espressione identica nella fluidità esplicita dell'espressione di un identico contenuto. In questo modo il markup esprime la correlazione compensativa di variabilità e invarianza tra struttura dell'espressione e struttura del contenuto e permette di esplorare lo "spazio negativo della testualità" (mGa, 16) generato dalla 'latenza' indeterminata della struttura (S, 44), manifestando quell'aspetto della mobilità del testo, in cui si riflette l'instabilità del rapporto tra 'mutazione' (mGa, 12) ed 'invarianza' (S, 29) di espressione e contenuto.

Bibliografia

CRdR = J. H. Coombs, A. H. Renear and S. J. DeRose, Markup Systems and the Future of Scholarly Text Processing, in "Communications of the ACM", 30(1987), pp. 933-947.

mGa = J. J. McGann, What Is Text?, in ACH-ALLC'99 Conference Proceedings, Charlottesville VA, University of Virginia, 1999 [Unpublished Draft, pp. 1-16]

mGb = J. J. McGann, What Are We Doing in Saying What We Say? Programmatic Notes for a New Rhetoric of Textuality forthcoming).

HSmQ = Claus Huitfeldt and C.M. Sperberg-McQueen, Concurrent Document Hierarchies in MECS and SGML, in "Literary and Linguistic Computing", 14:1 (1999), pp. 29-42.

RTW = D. R. Raymond, F. W. Tompa and D. Wood, Markup Reconsidered, paper presented at the First International Workshop on Principles of Document Processing, Washington DC, October 22-23, 1992 URL: http://www.csd.uwo.ca/staff/drraymon/.papers/ markup.ps

S = C. Segre, Avviamento all'analisi del testo letterario, Torino, Einaudi, 1985.