Selezione testuale e reperimento terminologico
1. Premessa
Dopo l'analisi preliminare delle esigenze terminologiche che tiene conto del profilo dei destinatari del prodotto terminologico, si rivelano fondamentali la ricerca delle fonti, la loro selezione e catalogazione. La ricerca dei documenti è infatti la prima tappa di un lavoro accurato che Cossette (1976, apud Valiquette 1979: 354) definisce come la più rilevante1.
Nei corsi di linguistica applicata incentrati sulla terminologia la formazione del discente, dell'"apprendista terminografo", non deve sottovalutare l'importanza da attribuire alla raccolta del materiale documentario prima della sua analisi. Il nostro corso annuale di Linguistica Francese (40 ore, 8 CFU) al terzo anno del Corso di laurea in Lingue e Culture Europee della Facoltà di Lettere e Filosofia dell'Università di Modena e Reggio Emilia ha l'obiettivo di iniziare gli studenti alla disciplina della terminologia francese senza tralasciare tale aspetto. Il corso affronta dapprima le lingue speciali (definizione delle LSP, della loro dimensione orizzontale e verticale, delle loro caratteristiche rispetto alla lingua generale, della loro realizzazione testuale) per passare al concetto di termine (differenza tra parola e termine, concetto/nozione come unità del sapere, struttura e formazione dell'unità terminologica) e alla distinzione tra lessicografia e terminografia con lo sviluppo di due sezioni a confronto: la prima orientata verso la lessicografia specializzata consiste nell'esame di prodotti lessicografici, nella valutazione dettagliata della struttura di un dizionario e nell'individuazione delle tappe per l'elaborazione del dizionario stesso; la seconda verte sulla terminografia vera e propria con analisi approfondita dei supporti terminologici cartacei ed elettronici in circolazione e opportuna esplorazione della metodologia adottata con particolare attenzione all'organizzazione del sapere (concetti/nozioni e relative relazioni semantiche). Il corso prevede anche una parte applicativa (mini-atelier di terminografia) con elaborazione finale di un dossier terminologico da parte degli studenti nell'ambito del linguaggio speciale della tecnologia informatica. Lo studente diventa così un "documentarista" pronto a dimostrare "une grande ouverture d'esprit, une inaltérable curiosité, de l'imagination et de l'intuition […]" (Dubuc 1980: 19). Qualità indispensabili in terminologia, cui vanno aggiunti un solido spirito critico - "[…] le terminologue doit […] être en mesure de juger de la valeur et de la fiabilité des documents dont il se sert et savoir exploiter la documentation" (Rondeau 1980: 152) - e competenze informatiche per la realizzazione di un corpus adeguato che verrà esaminato in maniera dettagliata nel dossier2.
2. Formazione del corpus
Ai fini della formazione del corpus terminologico, i testi specialistici sono imprescindibili. Come osserva Kocourek (1991), il testo non è soltanto "sequenza", in quanto uso di risorse linguistiche sull'asse sintagmatico, "piano", in quanto livello sovrafrastico fondato in coesione e coerenza sui livelli inferiori; la linguistica deve tener conto del fatto che è anche fonte di dati per l'osservazione terminologica: "les termes ne sont pas seulement des éléments du système, mais aussi des occurrences dans les textes savants" (ivi: 72). Tuttavia, anche se il testo specialistico è il "milieu naturel" della terminologia (Cabré 1998: 196), vengono spesso prese in considerazione le cosiddette "opere di controllo" (glossari e dizionari) che svolgono un ruolo di tipo integrativo.
La formazione del corpus, che costituisce la prima fatica del terminografo3, consiste nella costituzione di una raccolta di dati testuali di un determinato ambito basata preliminarmente su criteri ben definiti; il corpus è infatti "une collection de données langagières qui sont sélectionnées et organisées selon des critères linguistiques et extra-linguistiques explicites pour servir d'échantillon d'emplois déterminés d'une langue" (Habert 2001). Nella nostra sperimentazione didattica, il corpus è un campione di una popolazione di eventi testuali di una lingua speciale che non rappresenta una totalità definitiva, bensì una focalizzazione linguistico-cognitiva con intenzionalità interpretativa (i fabbisogni terminologici che costituiscono il punto di partenza del lavoro terminografico sono nel nostro caso di natura puramente teorica). Abbiamo definito tale corpus: "corpus specialistico con obiettivi pedagogici" (CScOP). Il corpus in questione è scritto (la trascrizione delle comunicazioni specialistiche orali richiederebbe tempi molto lunghi e non rientrerebbe nell'ambito dei CFU del corso) e di lingua francese. Delle condizioni di significato, accettabilità e fruibilità esposte da Bommier-Pincemin (1999), tale tipo di corpus ne soddisfa soltanto alcune e in maniera parziale. Per quanto riguarda le condizioni di significato, è rispettata la pertinenza intesa come adeguatezza dei documenti raccolti ai fini dell'analisi terminologica. Il corpus si caratterizza spesso per una sua unicità in quanto progetto terminografico isolato - "since terminologies are domain specific, terminologists will generally need to build a new corpus each time they embark on building a new terminology" (Ahmad - Rogers 2001, apud L'Homme 2004: 123), quando bisognerebbe invece poter attingere anche a corpora già esistenti di cui siano però stati segnalati chiaramente i criteri costitutivi per poterli completare in maniera appropriata. Rimanendo nell'ambito delle condizioni di significato, è soddisfatto il criterio di coerenza in virtù dell'ipotesi prestabilita: i criteri di scelta dei documenti poggiano sulla circoscrizione dell'oggetto di studio e sulla sua specificità. Quanto alle condizioni di accettabilità, la rappresentatività è raggiunta attraverso una compilazione ragionata. La garanzia della diversità massima dei dati non può essere fornita dalla quantità giacché la massa dei dati è ridotta (min. 50000 token4) . Ciò che ci preme è una discreta rappresentazione della terminologia della lingua speciale. Lo studente può scegliere un unico genere isolato oppure più generi che condividano un numero sufficiente di caratteristiche linguistiche da poter rappresentare la LSP adottata in un determinato ambito disciplinare. Lo conferma L'Homme (2004: 127): "[…] un projet terminographique peut tenter d'incorporer divers types de documents ou en privilégier quelques-uns". I livelli di specializzazione, che Pearson (1998: 53) chiama "audience constituency", dipendono quindi dal ricevente del testo: un pubblico generico, i non specialisti, gli studenti, gli specialisti5. L'eterogeneità opaca del corpus terminologico che deriva dalla scelta di più livelli impone non solo una classificazione che fornisca informazioni sul tipo del corpus, ma anche una catalogazione per l'eventuale recupero cui abbiamo accennato: il corpus può costituire così un serbatoio di dati6. La condizione di regolarità prevista a livello di accettabilità del corpus non può invece essere soddisfatta nel caso del CScOP perché non è possibile esaminare il terreno di indagine con un'estensione e una precisione tali da approdare a un risultato inequivocabile. L'omogeneità e il volume del corpus (condizioni di fruibilità) non sono assicurati perché non è garantita una sufficiente "ridondanza" di comportamenti terminologici significativi.
3. Gestione del corpus
Il dossier terminologico redatto su supporto cartaceo e CD-Rom da ogni singolo studente e fondato sul CScOP si pone i seguenti obiettivi: distinguere un testo specialistico; descrivere/valutare le fonti; operare secondo l'approccio semasiologico e quello onomasiologico; reperire le unità terminologiche; stabilire le relazioni semantiche tra le unità; elaborare articoli lessicografici da confrontare con le schede terminografiche; individuare le specificità terminologiche del sottodominio analizzato.
Il dossier si struttura infatti come un raffronto tra l'approccio prettamente semasiologico-descrittivo della lessicografia specializzata che dispone generalmente i lemmi dal punto di vista alfabetico e l'approccio generalmente onomasiologico della terminografia che considera le unità a partire dal concetto veicolato e segue l'ordine sistematico. Le unità (min. 15) sono esaminate secondo queste due prospettive.
Per una adeguata gestione del CScOP, che potrebbe costituire una base testuale aggiornabile, lo studente provvede a classificare i testi che compongono il corpus secondo le seguenti indicazioni (Fig. 2):
Ci soffermiamo sul tipo di documento, che potrà essere un articolo giornalistico, un articolo di ricerca, una monografia specializzata, un manuale pedagogico, una tesi, un modulo amministrativo, una relazione o un manuale di istruzioni per l'uso. Quanto al tipo di testo, tralasciamo la tipologia tradizionale di Werlich (1979; 1983)7 per optare per la tipologia del discorso scientifico di Loffler-Laurian (1983) - fondata sulla situazione comunicativa, sulle persone dell'emittente e del ricevente, sulla natura del supporto del messaggio - che abbiamo adattato al discorso tecnico sfruttando gli stessi parametri di base:
i)
Discours scientifique spécialisé;
Discours de semi-vulgarisation scientifique;
Discours de vulgarisation scientifique;
Discours scientifique pédagogique;
Discours de type mémoire, thèse, etc.;
Discours scientifique officiel;
ii)
Discours technique spécialisé;
Discours de semi-vulgarisation technique;
Discours de vulgarisation technique;
Discours technique pédagogique;
Discours de type mémoire, thèse, etc.;
Discours technique officiel.
Nel caso di ii), nella fattispecie nell'ambito della tecnologia informatica, il discorso tecnico specializzato è emesso da un ricercatore o da un tecnico ed è rivolto alla stessa categoria professionale su riviste altamente specializzate (Technique et Science Informatiques, Revue d’Intelligence Artificielle, Ingénierie des Systèmes d’Information, L’Objet). Il discorso di semidivulgazione tecnica è prodotto da un ricercatore o da un giornalista su supporti rivolti a un pubblico con conoscenze approfondite del settore (Compétence Micro). Il discorso di divulgazione tecnica ha come emittente un giornalista che si rivolge al grande pubblico su riviste pluridisciplinari o su riviste che trattano un unico argomento con scopi sommariamente informativi (per es. Le Magazine des Internautes). Il discorso tecnico pedagogico è prodotto da un docente in un'opera indirizzata agli studenti oppure da un giornalista su supporti specifici volti a iniziare il destinatario neofita all'argomento (per es. Bien utiliser Internet - Guide). Il discorso tipico delle tesi è redatto da uno studente che ha approfondito una tematica in un ambito circoscritto oppure da uno specialista che fa il punto della situazione; in entrambi i casi l'approfondimento è rivolto a una commissione di specialisti. Infine, il discorso tecnico ufficiale è tipico di un ricercatore o di un tecnico o équipe di ricercatori o tecnici o del personale tecnico-amministrativo di un ente o società che compila moduli prestabiliti, elabora rapporti di sintesi, rapporti di stage, redige clausole tecniche.
Per quanto riguarda le funzioni, si distinguono la funzione cognitiva (fondata su asserzioni altamente formalizzate), la funzione prescrittiva (fondata su una intenzionalità coercitiva), la funzione strumentale-regolativa (basata sul tentativo di orientare fattivamente il destinatario, tipica dei testi tecnico-operativi); la funzione esplicativa-argomentativa (fondata su una intenzionalità espositiva ai fini di un passaggio del sapere) e la funzione informativa (fondata sull'intenzionalità di divulgare informazioni) (cfr. Sabatini 1999: 150).
Relativamente all'autore e al destinatario, lo studente specifica se si tratta di uno specialista, di un professionista non specialista o di un non specialista, senza dimenticare di segnalare "non déterminable" nel caso in cui il testo in questione non consenta di individuare l'autore o il destinatario in maniera certa.
Nel campo
Forniamo qui di seguito due esempi di scheda CScOP relativi rispettivamente a un articolo (Fig. 3) e a un glossario on-line (Fig. 4):
Fa al caso nostro la griglia valutativa dei dossier terminologici redatta da Sader Feghali (2001: 435-437). Alcuni dei quesiti proposti dall'autrice permettono una buona valutazione della ricerca relativa alla documentazione:
• "la bibliografia è suddivisa per categorie?" I singoli documenti sono schedati sia a livello macrotestuale sia a livello microtestuale;
• "il metodo di ricerca dei documenti è stato descritto?" La valutazione delle fonti è contenuta nelle schede CScOP con le opportune osservazioni nel caso di opera lessicografica/terminografica o meno. Sono deducibili i criteri di selezione dei documenti;
• "le informazioni relative ai dizionari e alle opere da raccomandare sono pertinenti e complete?" La scheda CScOP distingue le opere lessicografiche/terminografiche dalle opere espositive e obbliga lo studente a fornire informazioni dettagliate su di esse;
• "il sito Internet è stato ben scelto e ben descritto?" Ancora una volta la scheda CScOP consente di individuare la qualità del documento tratto da Internet la cui affidabilità potrebbe essere discutibile;
• "i rinvii alle fonti sono metodici e le fonti diversificate?" La massa del corpus e il numero delle schede CScOP permettono di capire immediatamente se le fonti sono diversificate. I rinvii alle fonti nelle schede terminografiche sono obbligatori.
4. Filtraggio dei dati e analisi
Il reperimento terminologico che segue la fase della raccolta e catalogazione della documentazione viene effettuato mediante il software gratuito AntConc 3.2.1 (testato su Windows 98, 2000) (http://www.antlab.sci.waseda.ac.jp/software.html) dopo aver opportunamente trasformato i documenti in formato .txt (sono eliminate le caratteristiche interne del testo - impaginazione, colonne, titoli, tavole e diagrammi). L'indagine è effettuata secondo il criterio della frequenza: ciò permette di distinguere le unità preferenziali da eventuali sinonimi (segnalati nonostante i dettami della disciplina terminologica che ne raccomanda la soppressione), data la dimensione del corpus e la sua conseguente relatività.
Attraverso l'operazione di filtraggio il discente impara a studiare il comportamento collocazionale di una parola (il computer genera concordanze KWIC - "key word in context") tenendo conto del corpus nella sua interezza.
Lo studente, una volta individuate le frontiere del termine mediante l'identificazione di "modulatori" non accidentali, riconosce le categorie grammaticali di ciascuna unità procedendo per gruppi formali. Fa così un sunto generale delle combinazioni sintagmatiche della terminologia del settore.
La matrice comparativa del dossier conduce il discente a esaminare ogni unità non solo dal punto di vista lessicologico:
Ma anche dal punto di vista prettamente terminologico:
Le schede terminografiche sono collegate tramite un link alle schede CScOP (Fig. 3-4) per permettere all'utente potenziale di verificare il tipo di documento da cui sono tratti la definizione e il contesto.
Ogni sezione è preceduta da una breve introduzione che specifica la macrostruttura dell'articolo lessicografico/della scheda terminografica con spiegazione dei simboli e delle abbreviazioni impiegati.
Ciò che contraddistingue l'approccio terminologico è:
• la presenza delle relazioni semantiche di tipo gerarchico (
• la presenza obbligatoria del contesto d'uso, generalmente di tipo esplicativo o associativo;
• l'elaborazione di una definizione analitica che non trascuri di indicare le caratteristiche rilevanti e sufficienti a delimitare il concetto8.
La scheda terminografica elaborata, rispetto all'articolo lessicografico, assolve la funzione specifica di assistenza nell'acquisizione o eventualmente nella verifica delle competenze non solo linguistiche, ma anche enciclopediche del settore da parte di un utente non specialista.
5. Conclusione
La ricerca terminologica che si richiede al discente è uno studio monolingue che verte sull'attestazione di termini in un ambito ben circoscritto. Con l'elaborazione del dossier lo studente impara a valutare tangibilmente le risorse documentarie disponibili e a catalogarle ai fini del proprio corpus. Il dossier è quindi sia un momento rinnovato di formazione, sia uno spazio di valutazione delle competenze acquisite nel corso dell'anno accademico.
Il discente iniziato alla terminologia attraverso la formazione di corpora specialistici con obiettivi pedagogici diventa consapevole che la cooccorrenza di una parola con un'altra non basta a stabilire un rapporto privilegiato tra le due; la presa in considerazione di un cotesto ampio diventa pertanto necessaria per poter individuare ciò che è pertinente, regolare e significativo. Il discente è però un "corpista" cui è nota l'inutilità di un'osservazione sommaria dell'immediato cotesto di una parola se non si ricorre a studi quantitativi. I due percorsi semasiologico, dal segno al significato, e onomasiologico, dal concetto fornito da una definizione e delimitato nel corso della ricerca fino al termine vero e proprio, non appaiono nella realtà della prassi terminografica completamente distinti. Anzi, come nota Kocourek (1991: 74), "[l]a recherche et l’observation des termes dans les textes combinent l’approche sémasiologique et l’approche onomasiologique, procèdent successivement et réciproquement […]. La seule approche onomasiologique n’est pas linguistiquement suffisante." Risultato: "décodage" e "encodage" in maniera alternata, affinché lo studente valuti la stabilità della forma e del senso, analizzando anche le circostanze dell'uso dei termini.
Bibliografia
Bergenholtz, H. - Tarp, S. (1995): Manual of specialised lexicography, Amsterdam/Philadelphia, John Benjamins.
Bommier-Pincemin, B. (1999): "Définir un corpus". In Diffusion ciblée automatique d’informations: conception et mise en oeuvre d’une linguistique textuelle pour la caractérisation des destinataires et des documents, Thèse de doctorat en Linguistique, Université Paris IV Sorbonne, pp. 415-427.
Cabré, M. T. (1998): La terminologie. Théorie, méthode et applications, Ottawa/Paris, Les Presses de l’Université d’Ottawa/Armand Colin.
Célestin, T. - Godbout, G. - Vachon-L'Heureux, P. (1990, 3e éd.): Méthodologie de la recherche terminologique ponctuelle, Gouvernement du Québec.
Dubuc, R. (1980): “Pour une saine gestion de la documentation en terminologie et en traduction”, Meta, XXV, 1, pp. 11-20.
Dubuc, R. (2002, 4e éd.): Manuel pratique de terminologie, Montréal, Linguatech.
Ganapini, C. (2008): "A pas comptés dans le domaine de la terminologie". Dossier terminologique, Facoltà di Lettere e Filosofia dell'Università di Modena e Reggio Emilia, a.a. 2007/2008, testo non pubblicato.
Ghelli, G. (2008): "A pas comptés dans le domaine de la terminologie". Dossier terminologique, Facoltà di Lettere e Filosofia dell'Università di Modena e Reggio Emilia, a.a. 2007/2008, testo non pubblicato.
Habert, B. (2001): “Des corpus représentatifs: de quoi, pour quoi, comment?”, www.limsi.fr/Individu/habert/Projets/ATALA280401/Habert/Perpignan00/Perpignan00.html (dernière interrogation: janvier 2008).
Kocourek, R. (1991): “Textes et termes”, Meta, XXXVI, 1, pp. 71-76.
Landau, S. I. (1989): Dictionaries: the art and craft of lexicography, Cambridge, Cambridge University Press.
Larivière, L. (1996): "Comment formuler une définition terminologique", Meta, XLI, 3, pp. 405-418.
Lethuillier, J. (1991): “Combinatoire, terminologies et textes”, Meta, XXXVI, 1, pp. 92-100.
L’Homme, M.-C. (2004): La terminologie: principes et techniques, Montréal, Les Presses de l’Université de Montréal.
Loffler-Laurian, A.-M. (1983): “Typologie des discours scientifiques: deux approches”, Etudes de linguistique appliquée, 51, pp. 8-20.
Pearson, J. (1998): Terms in Context, Amsterdam/Philadelphia, John Benjamins.
Péry-Woodley, M.-P. (1995): “Quels corpus pour quels traitements automatiques?”, [I:I]TAL[/I:I], 36, 1-2, pp. 213-232.
RaDT (2004): Profilo professionale del terminologo, Berna, Cancelleria federale svizzera, Sezione di terminologia,
http://www.iim.fh-koeln.de/radt/Dokumente/RaDT_Berufsprofil_italienisch.pdf (ultima consultazione: gennaio 2008).
Rondeau, G. (1980): “Terminologie et documentation”, Meta, XXV, 1, pp. 152-170.
Sabatini, F. (1999): “Rigidità-esplicitezza vs elasticità-implicitezza: possibili parametri massimi per una tipologia dei testi”. In F. Sabatini – G. Skytte (a cura di), Linguistica testuale comparativa, Copenhagen, Museum Tusculanum, pp. 141-172.
Sader Feghali, L. (2001): “Evaluation pédagogique de la recherche terminologique”, Meta, XLVI, 2, pp. 426-437.
Valiquette, M. (1979): “Recherche documentaire dans le cadre d’une recherche thématique”, Meta, XXIV, 3, pp. 354-361.
Werlich, E. (1979): Typologie der Texte, Heidelberg, Quelle & Meyer.
Werlich, E. (1982): A Text Grammar of English, Heidelberg, Quelle & Meyer.
Note
↑ 1"La recherche documentaire est la première étape de toute recherche terminologique thématique, et sans contredit la plus importante. En effet, les terminologues les plus compétents ne peuvent donner aucune assurance de la qualité de leur travail s'ils ne peuvent s'appuyer sur une documentation de base solide, étayée par nombre de textes spécialisés."
↑ 2Per un profilo ottimale del terminologo, attore determinante nella società dell'informazione, si legga la proposta del RaDT (2004).
↑ 3L'Homme (2004: 45-47) individua sette tappe: 1) formazione del corpus; 2) reperimento terminologico; 3) raccolta dei dati; 4) analisi/sintesi dei dati; 5) classificazione dei dati; 6) organizzazione dei dati terminologici; 7) gestione dei dati terminologici.
↑ 4L'esaustività dei dati raccolti rimane un'utopia anche nel caso del corpus standard. Va detto inoltre che "[l]a valeur d'une recherche terminologique est directement fonction de la qualité de la documentation qui la fonde. La qualité est nettement plus importante que la quantité" (Dubuc 2002: 51).
↑ 5Anche nella lessicografia specializzata si conferisce particolare attenzione alla formazione del corpus testuale: "[a]lready at the dictionary planning stage it is important to consider which users and functions the dictionary is intended to serve. These considerations must include the text types for which the dictionary is intended to be a help in connection with reception, production and translation problems. The optimum empirical basis is thus a text corpus […] composed in such a way that it corresponds with these texts." (Bergenholtz - Tarp 1995: 19).
↑ 6La TEI (Text Encoding Initiative) rappresenta un'iniziativa degna di nota perché raccomanda la segnalazione del rapporto tra le fonti utilizzate e la versione elettronica, l'eventuale scelta di annotazione, informazioni relative alla lingua, alla varietà e al registro, nonché alla revisione del corpus (data, autore, descrizione). Coordinate preziose non solo per la consultazione del corpus, ma anche in vista di un arricchimento dei dati.
↑ 7Werlich sceglie come criteri di distinzione dei testi la modalità di apprensione della realtà da parte dell'emittente e la sua visée del vissuto extralinguistico: testo narrativo, testo descrittivo, testo argomentativo, testo espositivo, testo istruttivo.
↑ 8La definizione terminologica è adeguata quando fornisce le informazioni che consentono di collocare il concetto descritto nel sistema e di distinguerlo dagli altri concetti.