La terminología en la traducción por ordenador

 

Francisco Marcos Marín

 

Una revisión de los problemas de la terminología, de la generación, selección y clasificación de términos, plantea una base firme para un proyecto de traducción por ordenador.

 

Las páginas que siguen nacen de la preocupación por asig­nar el lugar adecuado a la ter­minología dentro de un pro­yecto de traducción mecánica (MT). Sin embargo, no pue­den limitarse a unas conside­raciones técnicas, pues están también motiva­das por una necesidad pedagógica: explicar a las personas que desarrollen esta actividad en un proyecto de traducción por ordenador cuá­les son los problemas básicos, además de algu­nas de las vías que parecen más seguras para su resolución.

Esta necesidad pedagógica es la que nos hace también elegir como lengua de trabajo para este artículo el español. La bibliografía ter­minológica está escrita, de modo predominante, en alemán, ruso e inglés. Los franceses, cohe­rentes con su conocida política idiomática, que tan buenos resultados proporciona, mantienen una información suficiente para sus hablantes. En el vasto dominio de la lengua española, en cambio, falta una producción propia en este te­rreno. Esa laguna no puede quedar cubierta por un trabajo tan modesto como el presente; pero el conjunto de esfuerzos de terminólogos, lexicógrafos, lingüistas y documentalistas puede colocar al español en el rango que su difusión mundial hace esperar.

Dos consideraciones preliminares son evi­dentes: la primera es que en el mundo actual existen unos treinta millones de objetos identifi­cados, según los cálculos de INFOTERM, lo cual supone multiplicar por cien el mayor de los diccionarios de cualquier lengua natural. (Como objetos entendemos tanto objetos físicos como conceptuales.) Sager, Dungworth y Mc­Donald: 1980, toman de Hogben (1969) las si­guientes cifras:

 

"En 1950 tenían nombre cerca de un cuarto de millón de plantas fanerógamas y un núme­ro igual de escarabajos, se habían identifica­do más de mil enfermedades y el número de los compuestos orgánicos denominados exce­día los tres cuartos del millón, entre ellos más de diez mil colorantes, más de mil doscientos de los cuales se usaban con fines comercia­les. Se dice que la química orgánica contiene más de cuatro millones de nombres y la inor­gánica más de treinta mil".

 

La segunda consideración es que las necesi­dades actuales de la traducción superan en mu­cho las posibilidades físicas de los traductores humanos.

En una situación tal, es imprescindible recu­rrir a las máquinas, que tienen una triple fun­ción:

 

1. Bases de datos y clasificación de la infor­mación.

2. Traducción por ordenador.

3. Tratamiento de textos.

 

El primer punto se justifica por la existencia de ese ingente número de objetos identificados, que requieren su término que los designe y su clasificación coherente. El segundo por la ac­tual imposibilidad humana de solucionar el pro­blema por otros medios. En cuanto al tercero, es claro que si los productos de 1) y 2) han de ser reelaborados humanamente para su publi­cación y difusión, lo único que hacemos es crear un nuevo cuello de botella. La solución es que el resultado obtenido por la aplicación de los dos primeros puntos sea tal que los produc­tos resultantes puedan ser inmediatamente tra­tados por un procesador que permita su pre­sentación con todas las garantías y requisitos ti­pográficos.

Aunque el punto que nos concierne aquí es un subcomponente del segundo, resulta impres­cindible situarlo en su contexto general. Mal podremos saber qué hacer con la terminología en un proyecto de traducción por ordenador, si no sabemos qué es y cuáles son sus proble­mas.

Una advertencia o precisión más: nuestro planteamiento es el de un lingüista (hipotético o real) encargado de la terminología en un pro­yecto de traducción por ordenador. Con ello queremos indicar que no vamos a entrar en los aspectos teóricos generales, que se pueden consultar con amplitud y provecho en la biblio­grafía que incluimos, aunque sí lo haremos en las nociones, que examinaremos desde el punto de vista del lingüista. Hay terminólogos tan des­tacados como Christian Galinski que defienden que la terminología no es una ciencia lingüísti­ca. Si aceptamos esta postura, lo que aquí se diga será sólo lo atingente a la terminología y a la lingüística, o a éstas entre sí. Con todo, el vo­lumen de preguntas y conocimientos que se abre ante el lingüista que se ocupa de termino­logía es asombroso.

 

SISTEMA NOCIONAL Y SISTEMA TERMINOLÓGICO

 

El científico teórico trabaja sobre el mundo de los conceptos más que sobre el de los obje­tos a los que éstos se refieren. El científico apli­cado, en cambio, va del mundo conceptual al mundo de los objetos. Conceptos y objetos, a su vez, son en el mundo de la gestión y la adminis­tración meros referidos de los símbolos. Nos encontramos, por ello, ante un triángulo en el que símbolo y concepto se refieren al objeto. A diferencia del triángulo lingüístico básico (Og­den y Richards, Lyons) y sus posteriores am­pliaciones y modificaciones (Heger, Baldinger), el triángulo terminológico se caracteriza por moverse en el terreno metalingüístico, en el que la propia lengua se considera objeto. Una terminología, como sistema terminológico, se construye en una lengua, con medios que ‑como veremos‑ van más lejos del sistema lingüístico (incluyen amplias convenciones del subcompo­nente representativo: el subsistema gráfico y de escritura), pero no es propiamente lingüística: el contenido de los términos no es en realidad la referencia al objeto, sino al nombre del obje­to. Tampoco podemos decir, sin embargo, que la terminología sea metalingüística, porque en ella la lengua no se utiliza para estudiarse a sí misma, para categorizarse a sí misma, sino para la categorización y clasificación del universo, si bien no desde los objetos, como hace la lengua natural, sino desde sus nombres. El término me­talengua debe dejarse para el uso lingüístico y diferenciarse decisivamente de la terminología. En ésta lo metalingüístico es un componente, es la expresión del símbolo o unidad terminológi­ca, cuyo contenido es ultralingüístico: abarca no sólo la relación nombre<== >objeto, como parte de la teoría del conocimiento, sino tam­bién la relación entre el objeto y el orden del universo, como componente de un sistema de clasificación.

El orden al que pertenece la terminología no es el orden natural, al que pertenecen las len­guas, sino un orden artificial, hecho a través de las lenguas y de símbolos y sistemas de répre­sentación metalingüísticos. (Véanse Arntz y Picht: 1982, 22 y ss., para una detallada discu­sión teórica.)

Consideramos imprescindible esta considera­ción ultralingüística de la terminología, porque de lo contrario no podríamos comprender la enorme difusión de las unidades de conoci­miento. Si el número y propiedades de éstas es infinito, sólo es posible al cerebro humano lle­gar al conocimiento del universo mediante una reducción, por la selección de algunas de las propiedades, que se toman como característi­cas (el equivalente de los rasgos en el proceso lingüístico de categorización).

Para el terminólogo (y aún menos para el ter­minógrafo) carece de interés que un objeto sea, puesto que todos sus objetos son. Lo que le preocupa es cuál puede ser precisamente el rasgo que debe permitirle su diferenciación del más próximo. Si una unidad más de un componente (sea el carbono) le permite pasar del bi­carbonato al tri‑carbonato, su interés no acaba ahí, sino que se prolonga en la utilización de esas expresiones lingüísticas bi‑ y tri‑ que, apli­cadas a otro componente (sea el azufre), le per­mitirán formar tri‑sulfato a partir de bi‑sulfato, para expresar precisamente el aumento de una unidad. Mientras que, para el lingüista, bi‑ es "multiplicado por 2" y tri‑ es "multiplicado por '2+1`, para el terminógrafo se trata de algo dis­tinto, de que se forma una unidad de designa­ción y clasificación de una clase de objetos en un dominio conocido, un término, mediante la construcción regular de bi‑ y tri‑ como multipli­cadores de un compuesto que se expresa en el radical siguiente (carbono en 'carbonato', azufre en 'sulfato', hierro en 'ferrato', si necesita dife­renciar y clasificar unos objetos mediante las expresiones biférrato y triferrato.)

Si el papel del científico es llegar a la exacta descripción, clasificación y diferenciación de conceptos, a los que corresponden precisas de­nominaciones, términos, el papel de terminó­grafo (mejor que terminólogo, en este caso) es la difusión y regularización de los términos, con­vertidos en símbolos.

Sigamos con nuestro ejemplo, no sin advertir que, aun en el caso de que la crítica del ejem­plo demostrara que ha sido mal elegido, esto no supone que la teoría subyacente se invalide. El químico llega a la conclusión de que hay una serie de moléculas caracterizadas por tener tres átomos (tri‑) de hierro (‑ferr‑) con una es­tructura particular en la molécula (‑ato). El ter­minógrafo toma el término triferrato del mismo modo que hubiera tomado 1387‑49b si el quími­co hubiera tomado la determinación de desig­nar por medio de esa combinación de letras guión y números la nueva clase de objetos o (caso de un científico egocéntrico llamado, p. ej., Smith) el smithín, Ahora bien, en el primer caso lo sitúa en relación con el principio de or­den que le permite formar, por un lado bicar­bonato, tri‑carbonato, y por otro sulfato o bisul­furo. En el segundo caso, en cambio, lo relacio­na con el principio que permite denominacio­nes como 4562n. En el tercero, por último, lo re­laciona por un lado con formas como sulfidrin, por otro con formas como watio y, por otro to­davía, con formas como Colombia o América.

 

El cerebro humano procesa los conceptos sub­yacentes a los símbolos, no los símbolos mis­mos. La lengua natural le proporciona un auxi­liar imprescindible mediante la función metalin­güística. Un sistema de designación de compuestos químicos basado en los nombres (y apellidos) de sus descriptores y descubridores sería tan difícil de aprender (por anárquico) como un sistema exclusivamente numérico (en este segundo caso por excesivamente simbóli­co). En cambio, el sistema del tipo triferr‑ato permite una reconceptualización de sus compo­nentes, apoyada en el análisis metalingüístico: tri "significa" que se multiplica por tres, ferr que tiene relación con el hierro y ato que tiene una configuración de un tipo preciso ‑irrelevante para nosotros ahora‑. Este tercer sistema, na­turalmente, resulta mucho más útil y está mucho más extendido que los dos primeros, los cuales, sin embargo, no quedan excluidos: la lectura de cualquier libro científico nos da buenas y conti­nuas pruebas de ello.

Junto al sistema nocional existe, por tanto, un sistema terminológico. Ambos dominios corres­ponden a la terminología, encargada de cum­plir una misión esencial, el mantenimiento de un sistema coherente y transmisible de desig­naciones y denominaciones de los objetos, con­ceptualmente estructurados.

La terminología no es, simplemente, un me­dio de inventariar objetos, ni un sistema de ro­tulación. Se ha advertido repetidas veces del riesgo de confundirla con una lexicografía de dominios especiales (Rey: 1979, 52). La termino­logía se ocupa de dos actitudes, el uso y la transferencia. La primera, el uso, incluye al científico teórico descubridor de conceptos, al aplicado que los lleva a la práctica y al gestor o administrativo que los considera en su plano simbólico. La transferencia, por su parte, tiene un doble fin posible: la clasificación, que hace el documentalista a partir de la descripción y actualización, y la equivalencia entre los térmi­nos en distintas lenguas que, a partir de la con­junción del sistema nominal y el sistema termi­nológico, hace el traductor.

 

EL TÉRMINO

 

En los párrafos anteriores, a pesar de su ca­rácter introductorio, hemos tenido que emplear la noción de término. La terminología es la ciencia de los términos y la terminografía la téc­nica de su representación gráfica en cuerpos organizados según su análisis léxico. Antes de plantearnos los problemas de terminografía que nos interesan para el fin concreto de la traduc­ción por ordenador, hemos de detenernos ne­cesariamente en el objeto de estas disciplinas, en el término.

Un término es, como hemos dicho, una uni­dad de designación y clasificación de una clase de objetos. Como unidad de designación es un signo lingüístico, que asocia una expresión con un contenido, es la representación lingüística de un concepto, entendido como 'unidad de pensamiento', en el sentido de la definición del Vocabulary of Terminology (ISO/R 1087, cf. Arntz y Picht: 1982, 42‑43.) Como unidad de cla­sificación es un signo metalingüístico, que tiene como referido el nombre del objeto o concepto. Esta definición, en consecuencia, hasta aquí, no escapa a lo lingüístico y es todavía insuficiente. Para completarla debemos partir del concepto de clasificación a fin de preguntarnos dónde y cómo clasificar. La respuesta sería que los tér­minos son unidades de designación y clasifica­ción de clases de objetos en lenguas especia­les. Con este concepto de "lengua especial", que hay que relacionar con la bibliografía so­bre lenguas para propósitos específicos, LSP (Sager, en Felber et al.: 1979, 149‑163; Sager, Dungworth y McDonald: 1980), alcanzamos ese punto más allá de la función metalingüística en el cual la terminología se mueve, con la ventaja de que las lenguas especiales utilizan los me­dios lingüísticos para expresar sus conceptos, tanto simples como complejos, de tal modo que los segundos se pueden analizar y descompo­ner en sus partes integrantes con métodos pu­ramente lingüísticos.

El concepto de lengua especial o de lengua para un fin específico, que va ligado al de un dominio o zona del conocimiento del universo, añade a la definición de término el rasgo nece­sario de finalidad. Los términos se construyen para establecer una distinción que va más allá de las que permite el uso general de la lengua. La ventaja evidente es que las expresiones lin­güísticas de cualquier clase pueden pasar a convertirse en términos cuando sea necesario, basta aplicarles esa finalidad determinada o, como también se dice, situarlas en un concreto campo de conocimientos. Balón, en la lengua general, tiene una serie de referidos que no co­rresponden a los términos balón en los campos del fútbol, baloncesto o balonmano. Si utilizamos balón como término futbolístico, las dos últimas clases quedan excluidas y viceversa, cosa que no ocurre en la lengua general. El inconvenien­te que tiene esta facilidad de convertir formas léxicas de la lengua general en términos es la necesidad de realizar un esfuerzo especial para actualizar los términos, diferenciando su uso en la lengua común y en la lengua especial, entre los cuales se producen trasvases frecuentes. Por ello el sistema terminológico precisa una norma prescriptiva y funciona apoyado en unos organismos e instituciones capacitados para prescribir e incluso imponer los términos.

Todo término se constituye, por tanto, como una unidad especial, ultralingüística y estándar, lo cual repercute en su representación. En efecto, los términos han de ser diferenciados del resto de las unidades léxicas, mediante pro­cedimientos específicos.

Los términos, además, pueden estar formados por varias palabras (en el sentido lexicográfico de unidad limitada por dos blancos en la escri­tura) o por varios morfemas (en el sentido lin­güístico de unidad mínima dotada de significa­do). Esta característica es esencial a la hora de asignarles un lugar en una lista léxica o vocabu­lario. El concepto de vocabulario como "conjun­to de voces o palabras" es demasiado estrecho para abarcar el conjunto de términos.

Al mismo tiempo, su posible carácter com­puesto hace que deban ser estudiados en rela­ción con la sintagmática, en lo que concierne a las reglas de construcción de frases. Esta pecu­liaridad es peligrosa para la transferencia: un término puede expresarse en una lengua me­diante un conjunto de palabras, una frase de unidades separadas en la escritura, y transferir­se a otra mediante una sola palabra, o vicever­sa; p. ej., alemán Wohnzimmer, español cuarto de estar. La forma integrada por varias palabras no tiene por qué tener un contenido que sea simplemente equivalente a la suma de los con­tenidos de sus elementos integrantes, lo cual la equipara ‑para efectos prácticos, formales‑ a la locución o el modismo. Esta consideración de la necesidad de tener en cuenta el conjunto como una unidad, para garantizar la transferen­cia, es imprescindible si se quiere entender el papel de la terminología en el conjunto de as­pectos que un sistema mecánico de traducción debe considerar.

En consecuencia, los términos, desde el pun­to de vista de su estructura lingüística formal, pueden ser:

 

1. Monomorfémicos: gas.

2. Dimorfémicos, monolexémicos: ferrita.

3. Plurimorfémicos, monolexémicos: bicar­bon‑a to.

4. Plurimorfémicos, plurilexémicos: llave de contacto.

 

Su actualización como palabra o frase depende de las lenguas, no de la estructura interna del término. La coherencia de un sistema termi­nológico internacional consiste, en este punto, precisamente en la preservación de la estructu­ra lingüística o léxico‑morfémica del término en la transferencia de una lengua a otra, indepen­dientemente de su forma externa, de su consti­tución sintagmática.

 

Si la anterior era la consideración tipológica (que admite, obviamente, precisiones y diferen­ciaciones más finas, si se desea ampliar), pode­mos tomar ahora en cuenta además el aspecto diacrónico y establecer las siguientes maneras de aparición o creación de un término.

 

a) Procedimientos propios, de cada lengua

 

En este grupo se incluyen una serie de me­dios de los que se valen las lenguas naturales en sus procesos de cambio semántico, no espe­cíficamente empleados (ni mayoritariamente) para formar términos, aunque perfectamente válidos y aptos para ello.

 

1. Lexicológicos (reflejados en la expresión). a. Composición: aguafuerte. b. Derivación (uno o varios de los modelos siguientes, combinables): prefijación: telé‑fono infijación: merca‑nc‑ía sufijación: nitr‑ato c. Abreviación monolexémica: radio. polilexémica: junta de portavoces (se entiende "de los grupos parlamenta­rios") de ahí se puede pasar, en el contexto oportuno, a los monolexémi­cos junta o portavoces. d. Préstamo de las lenguas clásicas: memorandum, per capita de las lenguas modernas: software, mise au point e. Calco: puesta a punto

 

2. Semánticos: alteraciones del contenido, dentro del dominio de la polisemia. ampliación: coche, piñón metonimia: diente conversión (Sager, Dungworth y McDonald: 1980, 78): polisemia sintáctica, un lexema puede aparecer como expresión de distintas categorías gramaticales: 'cut', 'cut glass', 'to cut', respectivamente, sustan­tivo, adjetivo y verbo.

 

3. Fraseológicos o sintagmáticos

 

En este caso lo que permite reconocer al tér­mino es la construcción sintáctica de la frase que lo forma, en uno de los siguientes aspectos:

 

a. Empleo de formas verbales especiales, terminológicamente marcadas, caracte­rizadoras del lenguaje científico:

"sean AB, CD los lados paralelos de un polígono..."

 

b. Construcciones oracionales atributivas, como las del ser definidor o se llama, llamamos designadores, o predicativas como el contiene clasificador (Wiegand, en Felber, Lang y Wersig: 1979, 117­118.)

"La hipotenusa es el lado mayor de un triángulo rectángulo"

"Se llama hipotenusa el lado mayor..."

"Una novela contiene un cierto número de capítulos"

 

c. Alteraciones del orden sintáctico habi­tual. Se trata del procedimiento bien co­nocido históricamente que explica cons­trucciones clásicas como Sumo Pontífice o la imperial ciudad en vez de pontífice sumo, ciudad imperial, modernamente: alto voltaje, con adjetivo especificativo antepuesto, en vez del esperable, por no marcado "voltaje alto".

 

4. Morfológicos

Es un procedimiento menos corriente, pero también posible, que consiste en em­plear como recurso habitual un morfema gramatical unido a un lexema con el que en la lengua general no suele combinarse. El ejemplo más claro es el de los sustanti­vos abstractos que, mediante el morfema de plural, pasan a concretos: tecnología ==D tecnologías. Este procedimiento es conocido en español (cortesía, cortesías) y más llamativo en otras lenguas, como el inglés, por infrecuente en la lengua gene­ral.

 

b) Procedimientos terminológicos específicos, dentro del sistema lingüístico

 

1. En primer lugar tenemos la creación, que puede ser motivada (gas, de caos) o ex nihilo, muy rara (kodak).

2. Siglas, y abreviaturas

Hay múltiples estudios sobre la clasifica­ción y definición de siglas, acrónimos y abreviaturas. Con la exclusiva finalidad de diferenciar tipos posibles, presentamos lo siguiente:

 

En la abreviatura lo característico es el punto que la cierra, olvidado muchas ve­ces por descuido o por considerarlo in­necesario. Los ejemplos típicos son los lexicográficos: adj., vb., por adjetivo, verbo.

La distinción entre sigla y acrónimo, que tienen en común el estar compuestos por varias letras de las distintas palabras que forman el término que abrevian, po­dría establecerse razonablemente di­ciendo que el acrónimo se lee como si fuera una palabra, mientras que la sigla se deletrea. Así, USA sería un acrónimo y EE.UU. una sigla. En la práctica esta distinción no se sostiene. Sea como sea, el procedimiento sirve para indicar que se trata de un término.

 

3. También se incluyen aquí los derivados de nombres propios, entre los cuales los hay con tradición histórica, como los derivados del nombre del célebre matemático persa al‑Juarizmí: algoritmo, guarismo. La mayo­ría son modernos: vatio, wolframio, seleni­ta.

 

4. La ampliación de los medios lexicográficos propios es el último de este tipo. El incre­mento de las posibilidades del sistema puede ser el de una vía (aumento de la composición en español contemporáneo), o dentro de una vía: nuevos sufijos, como ‑ema, (morfema, virtuema, lexema), o prefi­jos, como no‑ (no‑aplicación).

 

c) Procedimientos terminológicos marginales al sistema lingüístico

 

Se trata de signos o medios relacionados con la expresión o representación de la lengua, pero no propiamente lingüísticos.

 

Signos de puntuación, tales las comillas sim­ples o dobles, corchetes, paréntesis o barras.

Signos especiales tomados de otros sistemas, como los que expresan "igual, semejante, idén­tico, procedente de".

Signos tipográficos, como el cambio del tipo de letra: VERSAL, cursiva, negrita.

 

El uso de la expresión aclaradora. Aunque aparentemente se trata de un uso lingüístico, en realidad la aclaración funciona con un signo es­pecial. Se trata de que un término más divulga­do (frecuentemente de otra lengua) va a conti­nuación del término que se ha introducido, ge­neralmente entre paréntesis, pero también en­tre comillas o destacado de algún modo:

"El componente físico (hardware)..."

El término hardware aparece para indicar que la frase española componente físico es un término.

 

d) Procedimientos propios de cada ciencia

 

Además de los incluidos en los tipos anterio­res, algunas ciencias tienen sus propios meca­nismos para representar nuevos conceptos. Es­tos términos especiales son las fórmulas, que se presentan de tres modos diferenciados (Sager, Dungworth y McDonald: 1980, 308‑311).

a) el término en lengua natural: metano

 

b) el término en fórmula lineal: CH4

 

c) el término en fórmula no lineal, de desa­rrollo difícilmente verbalizable:

 

H

I

H ‑ C ‑ H

I

H

 

Sin. embargo, como ocurre con la notación musical, las representaciones b) y c) tienen la indudable ventaja de que no precisan traduc­ción, son equiparables a un gráfico, permane­cen idénticas sea cual sea la lengua en la que se hable de ellas.

Los términos se forman de acuerdo con uno o varios de los procedimientos que acabamos de ver. Una vez formados se incorporan a la lengua (aunque sea dentro de sus usos especiales), io que significa que pertenecen a una de las cate­gorías gramaticales, clases de palabras o tipos de frase. La mayoría son sustantivos, pero no faltan adjetivos y verbos, siendo más raros los adverbios y los relacionantes. En las frases abundan las prepositivas y las nominales y son raros los que llegan a tener una estructura ora­cional o proposicional (Rey: 1979, 79‑80). Una vez incorporados, por supuesto, pueden dar ori­gen a nuevas categorías derivadas (verbos de sustantivos, frecuentemente: holding, holdear).

Los sistemas propios de creación de térmi­nos, como las fórmulas, y los medios auxiliares para diferenciarlos (signos de puntuación, etc.) son procedimientos de especificación o diferen­ciación de términos que facilitan la labor del traductor o, en el caso de los primeros, elimi­nan la necesidad de éste: un libro totalmente integrado por fórmulas necesitaría tan poco la traducción como una partitura musical o un pro­grama de ordenador en cualquier lenguaje de alto nivel, en el que las expresiones en lengua natural se han reducido al papel de fórmulas, igual que C y H en las combinaciones que aca­bamos de ver.

Fuera de estos usos específicos, los términos técnicos, como ha señalado K. Opitz (en Hart­mann: 1983, 59‑60) no suelen entrar en las len­guas de forma abrupta. La creación es un pro­cedimiento poco usual. Lo habitual es que se formen siguiendo las reglas que cada lengua tiene para la formación y ampliación de su léxi­co, bien por medios lexicológicos (derivación y composición), bien por el préstamo, tomando de otra el término que necesita. También es frecuente la aplicación del cambio semántico: una forma léxica existente adquiere, como tér­mino, un valor semántico nuevo. De este modo la forma léxica se hace polisémica, o incremen­ta su polisemia anterior.

No es, por tanto, lo formal lo que caracteriza al término, aunque sea lo que permite diferen­ciarlo en los textos. Lo característico es que po­see un significado rígidamente limitado. Opitz (cit., 60) señala con acierto que "ésta es precisa­mente la significación de la expresión 'término'. Como terminus denota el final de una línea de cambios y desarrollos de la cual ha sido sacado por su seguridad, aunque haya sido forzosa­mente".

 

TERMINOGRAFÍA Y LEXICOGRAFIA

 

El encargado de la terminología en un pro­yecto de traducción por ordenador no ha de ser necesariamente un terminólogo, sino un ter­minógrafo. Terminología tiene dos acepciones, "conjunto de términos que constituyen una disciplina" y "ciencia que estudia los términos, su formación, clasificación y difusión". La‑ termino­grafía, por su parte, es una técnica, que permite la recolección y fijación (de forma gráfica o magnética) de la terminología en su primera acepción, del conjunto de términos.

 

Aunque ya hemos señalado, siguiendo a Rey (1979, 52), que la terminología (mejor ahora "terminografía") no debe confundirse con una lexi­cografía de dominios especiales, no cabe duda de que el terminógrafo precisa tener una for­mación básica como lexicógrafo, con el fin de beneficiarse de los avances teóricos y prácticos de una disciplina y una técnica bien conocidas y desarrolladas.

En la vida de todo término hay tres aspectos: su acuñación, con la correspondiente descrip­ción, su transmisión y difusión, que exigen coherencia y aceptación, y su normalización, es decir, su fijación precisa y "definitiva" dentro del corpus terminológico. Los términos se des­criben, transmiten y fijan por medio de diccio­narios, vocabularios o glosarios (sea en su ver­sión tradicional o en la moderna de bases de datos). Los procedimientos que se siguen para ello son lexicográficos, aunque con diferencias que hay que tener en cuenta.

La lexicografía, en general, puede partir de un vocablo y analizarlo en sus rasgos, en lo que se llama procedimiento semasiológico, o puede partir del conjunto de rasgos, nociones o carac­terísticas para llegar a la forma léxica, en el procedimiento onomasiológico.

El procedimiento semasiológico es el habitual en la traducción: se parte de una forma léxica en una lengua dada y se obtiene otra forma lé­xica en la lengua a la que se traduce. Si los tér­minos están bien construidos y no son polisémi­cos, este procedimiento dará resultados exac­tos, lo que significa que el terminólogo‑traduc­tor deberá proporcionar un glosario terminoló­gico como contribución al desarrollo del pro­yecto de traducción por ordenador en el que esté implicado.

Sin embargo, no siempre es tan sencillo cons­truir ese glosario como subcomponente del lé­xico, por lo que deben tenerse en cuenta as­pectos generales.

Los diccionarios se dividen tradicionalmente en dos grandes bloques: los diccionarios de nombres, que son los que conocemos habitual­mente como diccionarios de una lengua o, casi sin excepción, los diccionarios bilingües o pluri­lingües, y los diccionarios de objetos, llamados por regla general enciclopedias o tesauros.

Una terminología monolingüe tiene más de la estructura de un diccionario de objetos que de un diccionario de nombres. La terminografía bi­lingüe que un sistema de traducción requiere debe contener, sin embargo, un componente lexicográfico de nombres. Esto afecta a la ela­boración del glosario de varias maneras. Tanto en un caso como en otro nos movemos en el dominio de la metalengua, puesto que las entra­das del vocabulario o glosario terminológico son términos de una lengua natural (ya hemos precisado que las fórmulas, p. ej., que no son lingüísticas, no se traducen). Con esto se quiere decir que la metalengua de las entradas termi­nográficas tiene una mayor dependencia del hecho lingüístico. Los descriptores de los tesau­ros, en cambio, emplean una metalengua de descripción libre.

Si consideramos una obra terminográfica, en general, y no un mero glosario de correspon­dencias biunívocas de términos en diversas len­guas, estaremos de acuerdo en la necesidad de que el término vaya explicado por una defini­ción. La definición lexicográfica debe evitar la circularidad (en la práctica la retrasa lo más po­sible) y hacer uso de unos elementos o rasgos mínimos, para los que incluso puede postularse el carácter de "universales de la descripción le­xicográfica". En terminografía esto no es nece­sario (o, al menos, tan necesario): la circulari­dad de la definición no preocupa mucho (Rey: 1979, 95, n. 1). La explicación está en la línea de lo que hemos defendido antes: el terminógrafo no permanece en el campo de lo metalingüísti­co, sino que pasa a un dominio específico ulte­rior, que hemos llamado ultralingüístico para di­ferenciarlo, pero que podría tener cualquier nombre que indicara que hemos abandonado no sólo los dominios de la lengua de uso co­rriente, sino también de la metalingüística.

La norma DIN2330 de julio de 1961 (p. 6) dice que la "definición (Begriffsbestimmung) en sen­tido amplio es la descripción de un concepto mediante conceptos conocidos". Aunque Wie­gand (en Felber, Lang y Wersig: 1979, 111‑112) encuentre que esta definición de la definición deja demasiadas cosas pendientes, podemos pensar que ésta es la postura ‑muy justifica­da‑ del lexicógrafo y que quizás al terminó­grafo le bastaría con añadir un adjetivo cuantita­tivo y decir "mediante suficientes conceptos co­nocidos". Es cierto que se introduce una peli­grosa variante de subjetivismo; pero también es verdad que no necesitan la misma descripción de un término el especialista en el dominio de este término y otro científico de campo distinto (y no decimos nada del hablante ordinario por­que se entiende que hemos salido ya de su es­fera de empleo de la lengua, si no, sus necesi­dades serían indudablemente mayores).

Lo anterior no debe llevarnos a creer que la terminología sea una simple nomenclatura: en ella habríamos permanecido si no hubiéramos abandonado el plano *metalingüístico; estaría­mos en el dominio de los nombres, denomina­ciones o designaciones de los objetos, lo cual es inexacto. Si el terminógrafo que construye un sistema general o particular dentro de una len­gua no permanece recluido en el círculo de los nombres, tampoco parece que esto sea lo más aconsejable en el caso del que trabaja en un proyecto concreto de traducción entre lenguas. Por supuesto, la opción es doble, y elegir un tra­bajo terminográfico que, además de las corres­pondencias entre los términos en las distintas lenguas, añada un componente de descripción y explicación, requiere unas notas aclaratorias.

 

RECOLECCIÓN, SELECCIóN Y CLASIFICACIÓN DÉ LOS TÉRMINOS

 

La realidad del trabajo de aplicación y los hermosos conceptos teóricos no tienen siempre mucha relación, aunque el terminógrafo, com­parado con su pariente, el constructor de anali­zadores o trazadores sintácticos (parsers), es un ser afortunado. El pragmatismo está en la raíz misma de la lexicografía, por lo cual el paso de ésta a la terminografía no es tan gigantesco como el que va de la teoría sintáctica al trazado oracional (parsing).

El terminógrafo dispone su material a partir de unas bases bien determinadas:

 

1. Un corpus lexicográfico, integrado por dic­cionarios técnicos y especializados, voca­bularios y glosarios bi‑ o monolingües.

2. Los índices de términos que, cada vez con más frecuencia, por fortuna, . acompañan a las obras especializadas.

3. Los medios lexicográficos de la lengua ge­neral, es decir, los diccionarios y vocabu­larios de las lenguas sobre las que trabaja, directos, inversos, generales, de frecuen­cias, ideológicos, de todo tipo.

4. Su corpus específico, que deberá extraer de textos, libros o artículos, normas, dispo­siciones legales o administrativas, etc., en los cuales deberá reconocer los términos aplicando los criterios formales que repa­samos al ocuparnos de ellos.

5. Por la índole de su trabajo, puede tener que añadir una serie de términos que no son términos en general, pero sí en los textos que ha de traducir (caso de los valo­res específicos de instituciones europeas en EUROTRA).

 

Esta labor inicial, que podrá realizar mejor con la ayuda de una base de datos y en la que podrá utilizar al menos parcialmente alguna de las ya existentes, como EURODICAUTOM en el caso de la Comunidad Europea (Knowless, en Hartmann: 1983, 187), e incluso redes terminoló­gicas, como TermNet, se puede completar acu­diendo a organismos específicos, como la Comi­sión de Terminología de la Real Academia de Ciencias, en España, internacionales, como IN­FOTERM, en Viena, sea directamente, sea a través de publicaciones como Infoterm News­letter (anejo de Lebende Sprachen), o elencos como la World Guide to Terminological Activi­ties. Además, las normas y estándares como ISO o DIN proporcionan un rico muestrario de términos.

Confrontados con la realidad de treinta millo­nes de términos es obligado reconocer que un terminógrafo, sea una persona o un grupo, no puede abarcar toda esa extensión. Por ello es imprescindible trabajar sobre dominios o cam­pos especiales (subfields). Este hecho innega­ble ocasiona sin embargo discrepancias que los participantes en proyectos concretos de traduc­ción por ordenador conocen bien. (Entramos ahora en un terreno en el que se reflejará inme­diatamente nuestra propia experiencia en EU­ROTRA y en el que es necesario citar a Henrik Sorensen, defensor de las tesis que, general­mente, apoyaremos desde aquí).

Homogeneidad en el corpus, claridad, breve­dad y sencillez en las definiciones son los re­quisitos razonables de cualquier diccionario ter­minológico estándar que sea útil (Opitz en Hart­mann: 1983, 163‑180). El primero de ellos coinci­de con el hecho natural de que los diccionarios técnicos son usualmente "segmentales". Se pro­duce así, de modo simultáneo, una selección y clasificación terminológica del léxico, junto con un proceso de estandarización, ya que, se quie­ra o no, todos los diccionarios son instrumentos de codificación y normalización lingüísticas. Su peligro radica en que el léxico se mueve más de prisa que ellos, por lo cual se encuentran pronto con que contienen un buen número de formas y acepciones anticuadas, mientras que les faltan una serie de voces y acepciones nue­vas.

La electrónica, especialmente por medio de las bases de datos, puede solucionar esta situa­ción; pero se encuentra con los dos obstáculos que señala Al‑Kasimi (en Hartman: 1983, 156): los bancos terminológicos usan distintos tipos de máquinas y de programas, muchas veces in­compatibles o difíciles de trasladar y, al mismo tiempo ‑lo cual es mucho más grave‑, no hay un sistema universal de clasificación (véanse Lang, en Felber, Lang y Wersig: 1979, 208‑225; y Supper, ibíd., 226‑236).

Existen dominios temáticos relativamente bien cubiertos, como la Botánica, con el sistema de Linneo. Sin embargo, aun en estos casos se trata de sistemas parciales y que sólo a duras penas cubren todas sus necesidades. Lo mismo ocurre con los sistemas de clasificación deci­mal, el de Dewey o el de la Biblioteca del Con­greso de los Estados Unidos, el último de los cuales parece irse imponiendo, no por su per­fección, que no pretende, sino por su amplitud, especialmente. El problema rebasa el campo del terminógrafo y corresponde al documentalis­ta. El primero deberá tener en cuenta la nece­sidad de informarse sobre documentación, para encontrar ayudas en este terreno.

 

BANCOS DE DATOS TERMINOLÓGICOS

 

Anteriormente nos hemos referido a bases y bancos de datos, cuyas ventajas para los usua­rios son innegables. Pueden clasificar y distri­buir el contenido, mantenerlo al día y ponerlo a disposición de una pluralidad de usuarios (se­guimos a Schneider: 1985, quien describe el banco que explicamos a continuación).

TEAM es un ejemplo claro de este tipo de instrumentos. Se trata de una base de datos plu­rilingüe, desarrollado para funcionar en un en­torno de máquinas SIEMENS en los años sesen­ta. Cuando lo describió Schneider contenía unos dos millones de registros en ocho lenguas (alemán, español, francés, holandés, inglés, ita­liano, portugués y ruso). Cada registro se subdi­vide en 99 campos, puede contener 4.000 octe­tos (bytes) de información y se estructura de este modo:

 

00‑09 Encabezamiento

10‑89 Secciones por lenguas, o sea:

10‑19 Alemán 20‑29 Inglés 30‑39 Francés 40‑49 Español 50‑59 Ruso 60‑69 Italiano 70‑79 Portugués 80‑89 Holandés 90‑98 (sin asignar en concreto) 99 Fin‑del‑registro

 

La información que se da en el encabeza­miento tiene validez para todo el registro:

 

00  Número de serie de la entrada (dos le­        tras, cuatro dígitos)

01 (vacío para usos futuros) 02 (vacío)

03  Tipo/calidad del registro

     E = entrada monolingüe

     A = provisional, "equivalencia" aproximada

     D = equivalencia absoluta

04 Fecha de entrada o puesta al día 05 Código de conjunto (pool code)

06  Campo(s) temático(s)

07  (vacío)

08  (vacío)

09  Panorama o uso del concepto (p. ej., sis­tema, proyecto)

 

Cada una de las secciones individuales con­tiene la información siguiente:

 

n0 Término (o frase)

n 1 Parte de la oración (término)

n2 Fuente(s) del término

n3 (vacío)

n4  Definición del término con fuente(s) o re­ferencia

n5  Término y su contexto

n6  Sinónimo(s) del término con indicación de fuente y parte de la oración

n7 Palabras clave de la frase para n0

n8 Etiqueta(s) para campo(s) temático(s)

n9 (vacío)

 

En la organización del banco se combinan los aspectos de carácter administrativo o de orga­nización con los de distribución de un conteni­do científico. Así, hemos visto que 00 es una di­rección que se necesita para la puesta al día, o que 05 indica la pertenencia a un cierto conjun­to (pool) del cual es responsable una persona o grupo. Dado que uno de los problemas de la terminología es que podemos habérnoslas con un término que todavía no sea estándar, son im­prescindibles campos como 04, n2 ó 03 que nos indican la fecha, la fuente o el grado de fiabili­dad.

Aunque n4 sea el principal actor en la defini­ción, la asignación de un campo temático ade­cuado (06) es imprescindible, lo mismo que la capacidad para proseguir subclasificando.

No sólo importa la lengua en que se expresa el término, sino también el mundo al que perte­nece. En inglés se dice "Secretary of State" tan­to al del Canadá como al de los Estados Unidos. El primero es un ministro del Interior, el segun­do del Exterior. Además, sus funciones pueden no ser las mismas de sus correspondientes en el sistema español, por lo que la traducción deja siempre un vacío que sólo se puede evitar con unas explicaciones complementarias que lo precisen y acompañen a la definición.

La ventaja de un banco de datos bien estruc­turado es que permite la fácil obtención de glo­sarios, vocabularios y subdivisiones, con lo que facilita un material de lexicografía terminológica complementario de suma utilidad, con el que los usuarios trabajan más cómodos que directa­mente sobre el terminal del ordenador.

 

EL SUBCOMPONENTE TERMINOLÓGICO DEL LÉXICO EN UN PROYECTO DE TRADUCCIÓN POR ORDENADOR

Lo anteriormente expuesto nos lleva a con­cluir que el resultado del trabajo terminográfico en un proyecto de traducción y por ello tam­bién de traducción por ordenador es un sub­componente del léxico que no requiere la apli­cación de reglas de trazado o análisis sintáctico y que puede proporcionar una serie de corres­pondencias biunívocas de los términos en va­rias lenguas, con traducción de término a térmi­no. Así sería si viviéramos en un mundo ideal y no en el mejor de los mundos posibles. La reali­dad desmiente este hecho, como desmiente la univocidad de buen número de términos que, por tanto, no tienen un equivalente univoco para su traducción, sino varias corresponden­cias.

Este hecho afecta a la construcción del léxico en su conjunto, o lexicón, dentro de un proyec­to, ya que este subcomponente, a cuyas unida­des no se aplican una serie de reglas del siste­ma, se diferencia del léxico general como tal precisamente porque a los componentes de éste sí se les aplican las reglas. Por ejemplo, goods and services es un término al que corres­ponde bienes y servicios; en un léxico general figurarán good, and y services, por un lado, bie­nes, y, servicios, por otro. Lo que hace que goods and services se traduzca por bienes y servicios no depende de que haya un good o un service sustantivos que se ponen en plural con ‑s, a los que corresponden bien (plural + ‑es) y servicio (plural + ‑s), así como una con­junción copulativa and a la que corresponde y. La traducción depende de que hay un bloque, un conjunto de elementos inseparables, goods and services, forma única, al que corresponde otra forma única, bienes y servicios. Este senci­llo e innegable hecho obliga a construir un léxi­co de doble componente y a asegurar distintas vías mecánicas de acceso a ambos, con prela­ción del subcomponente terminográfico, segu­ramente.

La solución, en este caso, está en la línea de las propuestas de los autores que se han ocupa­do de la clasificación, como Lang o Knowless, o de las comunicaciones internas de Sorensen en EUROTRA. El terminógrafo debe construir su subcomponente léxico bilingüe atendiendo a reglas de este tipo:

 

1. Una entrada para cada término, entendien­do por tal el signo que relaciona una mis­ma forma con distintas acepciones, si éste fuera el caso. Por ejemplo, producto tiene un valor distinto en Aritmética y en Econo­mía, tendría así, al menos, esas dos entra­das.

2. Una cita explícita y clara de un texto don­de el término tenga el valor que corres­ponde a esa acepción.

 

3. Una indicación de clasificación en dominios, según 1 y 2.

4. El término que lo traduce a cada lengua a la que se ha de verter, con indicación de las restricciones y peculiaridades que se puedan presentar, abriendo en cada caso nuevos subdomlnios, si se requiere.

 

Todo lo anterior debe situarse en relación con el tipo de texto (tipología textual) y con el uso específico (LSP), que, no obstante, no pue­den proporcionar una información definitiva. En medio de un texto descriptivo matemático pue­de aparecer un término usado con el valor que tiene en el dominio de la Botánica y no en el de la Matemática. La experiencia demuestra la fre­cuencia con la que los textos ofrecen muestras de estas teóricas "rarezas".

La perspectiva del terminógrafo en un pro­yecto de traducción por ordenador debe se­guir, de todos modos, clara: al sistema de tra­ducción se le pide que proporcione el mejor de los resultados posibles, no la perfección. Como se repite tanto parece que en el fondo no se cree: no sólo los traductores, también los lecto­res monolingües especializados dejan de perci­bir con frecuencia aspectos de un texto, o sim­plemente se confunden, dan interpretaciones equivocadas. Las páginas anteriores no son un camino de perfección, sino un intento de pun­tualizar, con la finalidad de aclarar unos proble­mas teóricos concretos para una mejor aplica­ción. Si participa también en la discusión gene­ral sobre la terminología es porque la existen­cia de un subcomponente terminográfico afecta indudablemente al léxico, al menos en dos pun­tos fundamentales: el tamaño del mismo y la descripción.

 

Nota: Este artículo ha sido redactado gracias a una ayuda de la Alexander von HumboldtStiftung para 1987, en el Instituto de Tra­ducción e Interpretación y el Romanisches Semmar de la Universi­dad de Heidelberg, Alemania, y en el Centro Científico de IBM en esta ciudad.

 

REFERENCIAS BIBLIOGRÁFICAS

 

Alzugaray, Juan José (1979), Voces extranjeras en el lenguaje tec­nológico, Madrid: Alhambra.

Arnt, Remen y Picht, Heribert (1982), Einfülhrung m die überser­zungsbezogene Terminologiearben, Hildesheim: Georg Olms Ver­lag.

Baldmger, Kurt (1970), Teoría Semántica, Madrid: Alcalá.

Barr, Avron, y Feigenbaum, Edward A, (edj (1982), The Hand­bood of Artificial Intelligence, Pitman, Londres, 3 vols.

Bossong, Georg (1978), "Semantik der Terminologie. (Zur Vorges­chichte der alphonsinischen Schachtermmi) ZRPh, XCIV, 48‑68.

Drozd, L„ y Seibicke, W. (1973), Deutsche Fach‑ und Wissens­chaftssprache. BestandsaufnahmeTheoneGeschichte,'. Wiesba­den: Oscar Brandstetter.

Felber, Helmut (1984), Terminology Manual, París: UNESCO.

Felber, Helmut; Lang, Friednch; Wersig, Gernot (1979), Termino­logie als Angewandte Sprachwissenschaft. Gedenkschnft für Univer­sitáts Professor Dr E Wüster, München: Saur Verlag.

Fluck, Hans‑Rüdiger (1976), Fachsprachen, Munich, Francke.

Galmski, Chrishan (ed.) (1976), International Cooperation in Termi­nology München: Verlag Documentation (Infoterm Series n 3).

Galinski, Christian (ed.) (1982), Terminologies for the 1980x, Mün­chen: Saur Verlag (Infoterm Series n 7.).

Hartmann, R. R. K. (ed.) (1983), Lexicography: Principles and Practice, London: Academic Press.

Heger, Klaus (1974), Teoría Semántica, Madrid: Alcalá.

Hogben, L. T. (1971), The vocabulary of Science, London.

Hohnhold. Ingo (1982), "Principles of and Cooperation m Transla­tion‑oriented Terminology Work", Infoterm Series 7 Terminologies for the Eighties, Munich: Saur, 380‑390.

Kittredge, Richard, y Lechrberger, John (eds.) (1982), Sublangua­ge: Studies of language in restricted semantic domaras, Berlín/N.. York. De Gruyter.

Lehrberger, John, cfr. Kittredge, Richard.

Lyons, Sir John (1977), Semantics, I y II. Cambridge: University Press. Traducción española de Ramón Cerdá, Barcelona: Teide.

Marcos Marin, Francisco (1975), Lingüística y Lengua Española. Madrid Cincel.

Marcos Marin, Francisco (1979), Reforma y Modernización del Es­pañol (Ensayo de Sociolingüística Histórica), Madrid: Cátedra.

Marcos Marín, Francisco (1984), Curso de Gramática Española. Madrid. Cincel‑ Kapelusz, 1980, 2." ed. Madrid: Cincel.

Ogden, C. K. y Richards, 1. A. (1923), El significado del significado, traducción española, Buenos Aires: Paidós, 2.° ed. 1964.

Picht, Heribert, y Draskau, Jennifer (1985), Terminology an intro­duction, Guilford: The University Surrey.

Rey, Alam (1979), La terminologie: noms et notions, Paris: Collec­tion Que sais‑le? no. 1780, PUF,

Rondeau, Cuy (1981), Introduction á la terminologie, Chicouhmi: Gaetan Morra (2.1 ed. 1984).

Sager, Juan C.; Dungworth, David; McDonald, Peter F. (1980), En­glish Special Languages, Wiesbaden Oscar Brandsetter Verlag K. G.

Schneider, Thomas (1985), "Terminology Teaming Up Homo Fa­ber and Homo Linguisticus", Computers and the Humanities, 19, 103­108.

Schulz, Joachim (1980), A Terminology Data Bank for Translators (Team)", Meta 24, 211‑229.

Vollnhals, Otto (1982), "Technical Dictionaries Retrieved from a Databasé', Meta, 27, 157‑166

Wiegand, Herbert Ernst (1987), "Was eigentlich ist Fachlexiko­graphie?", Mecanografiado. Heidelberg.

Wüster, Eugen (1970), Internationale Sprachnormung m der Tech­nik, 3,a ed., Bonn: Bouvier.

Wüster, Eugen (1974), "Die allgememe Termmologielehre ‑era Grenzgebiet zwischen Sprachwlssenschaft, Logik, Ontologie, Infor­matik und den Sachwnssenschaften", Lingmstics, 119, 61‑106.

Wüster, Eugen (1979), Emführung m die Allgerneíne Terminolo­gielehre und Terminologische Lexikographie, Wien/New York, Sprmger Verlag