La
terminología en la traducción por ordenador
Francisco Marcos Marín
Una revisión de los
problemas de la terminología, de la generación, selección y clasificación de
términos, plantea una base firme para un proyecto de traducción por ordenador.
Las páginas que siguen nacen de la preocupación por
asignar el lugar adecuado a la terminología dentro de un proyecto de
traducción mecánica (MT). Sin embargo, no pueden
limitarse a unas consideraciones técnicas, pues están también motivadas por
una necesidad pedagógica: explicar a las personas que desarrollen esta
actividad en un proyecto de traducción por ordenador cuáles son los problemas
básicos, además de algunas de las vías que parecen más seguras para su
resolución.
Esta necesidad pedagógica es la que nos hace
también elegir como lengua de trabajo para este artículo el español. La
bibliografía terminológica está escrita, de modo predominante, en alemán, ruso
e inglés. Los franceses, coherentes con su conocida política idiomática, que
tan buenos resultados proporciona, mantienen una
información suficiente para sus hablantes. En el vasto dominio de la lengua
española, en cambio, falta una producción propia en este terreno. Esa laguna
no puede quedar cubierta por un trabajo tan modesto como el presente; pero el
conjunto de esfuerzos de terminólogos, lexicógrafos, lingüistas y
documentalistas puede colocar al español en el rango que su difusión mundial
hace esperar.
Dos consideraciones preliminares son evidentes:
la primera es que en el mundo actual existen unos treinta millones de objetos
identificados, según los cálculos de INFOTERM, lo cual supone multiplicar por
cien el mayor de los diccionarios de cualquier lengua natural. (Como objetos
entendemos tanto objetos físicos como conceptuales.) Sager,
Dungworth y McDonald:
1980, toman de Hogben (1969) las siguientes cifras:
"En 1950 tenían nombre
cerca de un cuarto de millón de plantas fanerógamas y un número igual de escarabajos, se habían identificado más de mil
enfermedades y el número de los compuestos orgánicos denominados excedía los
tres cuartos del millón, entre ellos más de diez mil colorantes, más de mil
doscientos de los cuales se usaban con fines comerciales. Se dice que la
química orgánica contiene más de cuatro millones de nombres y la inorgánica
más de treinta mil".
La segunda consideración es que las necesidades
actuales de la traducción superan en mucho las posibilidades físicas de los
traductores humanos.
En una situación tal, es imprescindible recurrir
a las máquinas, que tienen una triple función:
1. Bases
de datos y clasificación de la información.
2. Traducción por ordenador.
3. Tratamiento de textos.
El primer punto se justifica por la
existencia de ese ingente número de objetos identificados, que requieren su
término que los designe y su clasificación coherente. El segundo por la actual
imposibilidad humana de solucionar el problema por otros medios. En cuanto al
tercero, es claro que si los productos de 1) y 2) han de ser reelaborados
humanamente para su publicación y difusión, lo único que hacemos es crear un
nuevo cuello de botella. La solución es que el resultado obtenido por la
aplicación de los dos primeros puntos sea tal que los productos resultantes
puedan ser inmediatamente tratados por un procesador que permita su presentación
con todas las garantías y requisitos tipográficos.
Aunque el punto que nos concierne aquí es un
subcomponente del segundo, resulta imprescindible
situarlo en su contexto general. Mal podremos saber qué hacer con la
terminología en un proyecto de traducción por ordenador, si no sabemos qué es y
cuáles son sus problemas.
Una advertencia o precisión más: nuestro
planteamiento es el de un lingüista (hipotético o real) encargado de la
terminología en un proyecto de traducción por ordenador. Con ello queremos
indicar que no vamos a entrar en los aspectos teóricos generales, que se pueden
consultar con amplitud y provecho en la bibliografía que incluimos, aunque sí
lo haremos en las nociones, que examinaremos desde el punto de vista del
lingüista. Hay terminólogos tan destacados como Christian
Galinski que defienden que la terminología no es una
ciencia lingüística. Si aceptamos esta postura, lo que aquí se diga será sólo
lo atingente a la terminología y a la lingüística, o a éstas entre sí. Con
todo, el volumen de preguntas y conocimientos que se abre ante el lingüista
que se ocupa de terminología es asombroso.
SISTEMA NOCIONAL Y SISTEMA TERMINOLÓGICO
El científico teórico trabaja sobre el mundo
de los conceptos más que sobre el de los objetos a los que éstos se refieren.
El científico aplicado, en cambio, va del mundo conceptual al mundo de los
objetos. Conceptos y objetos, a su vez, son en el mundo de la gestión y la
administración meros referidos de los símbolos. Nos encontramos, por ello,
ante un triángulo en el que símbolo y concepto se refieren al objeto. A diferencia
del triángulo lingüístico básico (Ogden y Richards, Lyons) y sus
posteriores ampliaciones y modificaciones (Heger, Baldinger), el triángulo terminológico se caracteriza por
moverse en el terreno metalingüístico, en el que la propia lengua se considera
objeto. Una terminología, como sistema terminológico, se construye en una
lengua, con medios que ‑como veremos‑ van más lejos del sistema
lingüístico (incluyen amplias convenciones del subcomponente
representativo: el subsistema gráfico y de escritura), pero no es propiamente
lingüística: el contenido de los términos no es en realidad la referencia al
objeto, sino al nombre del objeto. Tampoco podemos decir, sin embargo, que la
terminología sea metalingüística, porque en ella la lengua no se utiliza para
estudiarse a sí misma, para categorizarse a sí misma,
sino para la categorización y clasificación del universo, si bien no desde los
objetos, como hace la lengua natural, sino desde sus nombres. El término metalengua debe dejarse para el uso lingüístico y
diferenciarse decisivamente de la terminología. En ésta lo metalingüístico es
un componente, es la expresión del símbolo o unidad terminológica, cuyo
contenido es ultralingüístico: abarca no sólo la
relación nombre<== >objeto, como parte de la teoría del conocimiento,
sino también la relación entre el objeto y el orden del universo, como
componente de un sistema de clasificación.
El orden al que pertenece la terminología no
es el orden natural, al que pertenecen las lenguas, sino un orden artificial,
hecho a través de las lenguas y de símbolos y sistemas de répresentación
metalingüísticos. (Véanse Arntz y Picht:
1982, 22 y ss., para una detallada discusión teórica.)
Consideramos imprescindible esta consideración
ultralingüística de la terminología, porque de lo
contrario no podríamos comprender la enorme difusión de las unidades de conocimiento.
Si el número y propiedades de éstas es infinito, sólo es posible al cerebro
humano llegar al conocimiento del universo mediante una reducción, por la
selección de algunas de las propiedades, que se toman como características (el
equivalente de los rasgos en el proceso lingüístico de categorización).
Para el terminólogo (y aún menos para el terminógrafo) carece de interés que un objeto sea, puesto
que todos sus objetos son. Lo que le preocupa es cuál puede ser precisamente el
rasgo que debe permitirle su diferenciación del más próximo. Si una unidad más
de un componente (sea el carbono) le permite pasar del bicarbonato al tri‑carbonato, su interés no acaba ahí, sino que se
prolonga en la utilización de esas expresiones lingüísticas bi‑
y tri‑ que, aplicadas a otro componente (sea
el azufre), le permitirán formar tri‑sulfato a
partir de bi‑sulfato, para expresar
precisamente el aumento de una unidad. Mientras que, para el lingüista, bi‑ es "multiplicado por 2" y tri‑ es "multiplicado por '2+1`, para el terminógrafo se trata de algo distinto, de que se forma
una unidad de designación y clasificación de una clase de objetos en un
dominio conocido, un término, mediante la construcción regular de bi‑ y tri‑ como
multiplicadores de un compuesto que se expresa en el radical siguiente
(carbono en 'carbonato', azufre en 'sulfato', hierro en 'ferrato', si necesita
diferenciar y clasificar unos objetos mediante las expresiones biférrato y triferrato.)
Si el papel del científico es llegar a la
exacta descripción, clasificación y diferenciación de conceptos, a los que
corresponden precisas denominaciones, términos, el papel de terminógrafo (mejor que terminólogo, en este caso) es la
difusión y regularización de los términos, convertidos en símbolos.
Sigamos con nuestro ejemplo, no sin advertir
que, aun en el caso de que la crítica del ejemplo demostrara que ha sido mal
elegido, esto no supone que la teoría subyacente se invalide. El químico llega
a la conclusión de que hay una serie de moléculas caracterizadas por tener tres
átomos (tri‑) de hierro (‑ferr‑) con una estructura particular en la molécula
(‑ato). El terminógrafo
toma el término triferrato del mismo modo que hubiera
tomado 1387‑49b si el químico hubiera tomado la determinación de designar
por medio de esa combinación de letras guión y números la nueva clase de
objetos o (caso de un científico egocéntrico llamado, p. ej., Smith)
el smithín, Ahora bien, en el primer caso lo sitúa en
relación con el principio de orden que le permite formar, por un lado bicarbonato,
tri‑carbonato, y por otro sulfato o bisulfuro.
En el segundo caso, en cambio, lo relaciona con el principio que permite
denominaciones como 4562n. En el tercero, por último, lo relaciona por un
lado con formas como sulfidrin, por otro con formas
como watio y, por otro todavía, con formas como Colombia
o América.
El cerebro humano procesa los conceptos subyacentes
a los símbolos, no los símbolos mismos. La lengua natural le proporciona un
auxiliar imprescindible mediante la función metalingüística. Un sistema de
designación de compuestos químicos basado en los nombres (y apellidos) de sus
descriptores y descubridores sería tan difícil de aprender (por anárquico) como
un sistema exclusivamente numérico (en este segundo caso por excesivamente
simbólico). En cambio, el sistema del tipo tri‑ferr‑ato permite
una reconceptualización de sus componentes, apoyada
en el análisis metalingüístico: tri
"significa" que se multiplica por tres, ferr
que tiene relación con el hierro y ato que tiene una configuración de un tipo
preciso ‑irrelevante para nosotros ahora‑. Este tercer sistema, naturalmente,
resulta mucho más útil y está mucho más extendido que los dos primeros, los
cuales, sin embargo, no quedan excluidos: la lectura de cualquier libro
científico nos da buenas y continuas pruebas de ello.
Junto al sistema nocional existe, por tanto,
un sistema terminológico. Ambos dominios corresponden a la terminología,
encargada de cumplir una misión esencial, el mantenimiento de un sistema
coherente y transmisible de designaciones y denominaciones de los objetos, conceptualmente
estructurados.
La terminología no es, simplemente, un medio
de inventariar objetos, ni un sistema de rotulación. Se ha advertido repetidas
veces del riesgo de confundirla con una lexicografía de dominios especiales
(Rey: 1979, 52). La terminología se ocupa de dos
actitudes, el uso y la transferencia. La primera, el uso, incluye al científico
teórico descubridor de conceptos, al aplicado que los lleva a la práctica y al
gestor o administrativo que los considera en su plano simbólico. La
transferencia, por su parte, tiene un doble fin posible: la clasificación, que
hace el documentalista a partir de la descripción y actualización, y la
equivalencia entre los términos en distintas lenguas que, a partir de la conjunción
del sistema nominal y el sistema terminológico, hace el traductor.
EL TÉRMINO
En los párrafos anteriores, a pesar de su carácter
introductorio, hemos tenido que emplear la noción de término. La terminología
es la ciencia de los términos y la terminografía la
técnica de su representación gráfica en cuerpos organizados según su análisis
léxico. Antes de plantearnos los problemas de terminografía
que nos interesan para el fin concreto de la traducción por ordenador, hemos
de detenernos necesariamente en el objeto de estas disciplinas, en el término.
Un término es, como hemos dicho, una unidad
de designación y clasificación de una clase de objetos. Como unidad de
designación es un signo lingüístico, que asocia una expresión con un contenido,
es la representación lingüística de un concepto, entendido como 'unidad de
pensamiento', en el sentido de la definición del Vocabulary
of Terminology (ISO/R 1087,
cf. Arntz y Picht: 1982, 42‑43.) Como unidad de clasificación es
un signo metalingüístico, que tiene como referido el nombre del objeto o
concepto. Esta definición, en consecuencia, hasta aquí, no escapa a lo
lingüístico y es todavía insuficiente. Para completarla debemos partir del
concepto de clasificación a fin de preguntarnos dónde y cómo clasificar. La
respuesta sería que los términos son unidades de designación y clasificación
de clases de objetos en lenguas especiales. Con este concepto de "lengua
especial", que hay que relacionar con la bibliografía sobre lenguas para
propósitos específicos, LSP (Sager, en Felber et al.: 1979, 149‑163;
Sager, Dungworth y McDonald: 1980), alcanzamos ese punto más allá de la
función metalingüística en el cual la terminología se mueve, con la ventaja de
que las lenguas especiales utilizan los medios lingüísticos para expresar sus
conceptos, tanto simples como complejos, de tal modo que los segundos se pueden
analizar y descomponer en sus partes integrantes con métodos puramente
lingüísticos.
El concepto de lengua especial o de lengua
para un fin específico, que va ligado al de un dominio o zona del conocimiento
del universo, añade a la definición de término el rasgo necesario de
finalidad. Los términos se construyen para establecer una distinción que va más
allá de las que permite el uso general de la lengua. La ventaja evidente es que
las expresiones lingüísticas de cualquier clase pueden pasar a convertirse en
términos cuando sea necesario, basta aplicarles esa finalidad determinada o,
como también se dice, situarlas en un concreto campo de conocimientos. Balón,
en la lengua general, tiene una serie de referidos que no corresponden a los
términos balón en los campos del fútbol, baloncesto o balonmano. Si utilizamos
balón como término futbolístico, las dos últimas clases quedan excluidas y
viceversa, cosa que no ocurre en la lengua general. El inconveniente que tiene
esta facilidad de convertir formas léxicas de la lengua general en términos es
la necesidad de realizar un esfuerzo especial para actualizar los términos,
diferenciando su uso en la lengua común y en la lengua especial, entre los
cuales se producen trasvases frecuentes. Por ello el sistema terminológico
precisa una norma prescriptiva y funciona apoyado en
unos organismos e instituciones capacitados para prescribir e incluso imponer
los términos.
Todo término se constituye, por tanto, como
una unidad especial, ultralingüística y estándar, lo
cual repercute en su representación. En efecto, los términos han de ser
diferenciados del resto de las unidades léxicas, mediante procedimientos
específicos.
Los términos, además, pueden estar formados
por varias palabras (en el sentido lexicográfico de unidad limitada por dos
blancos en la escritura) o por varios morfemas (en el sentido lingüístico de
unidad mínima dotada de significado). Esta
característica es esencial a la hora de asignarles un lugar en una lista léxica
o vocabulario. El concepto de vocabulario como "conjunto de voces o
palabras" es demasiado estrecho para abarcar el conjunto de términos.
Al mismo tiempo, su posible carácter compuesto
hace que deban ser estudiados en relación con la sintagmática, en lo que
concierne a las reglas de construcción de frases. Esta peculiaridad es
peligrosa para la transferencia: un término puede expresarse en una lengua mediante
un conjunto de palabras, una frase de unidades separadas en la escritura, y
transferirse a otra mediante una sola palabra, o viceversa; p. ej., alemán
Wohnzimmer, español cuarto de estar. La forma
integrada por varias palabras no tiene por qué tener un contenido que sea
simplemente equivalente a la suma de los contenidos de sus elementos
integrantes, lo cual la equipara ‑para efectos prácticos, formales‑
a la locución o el modismo. Esta consideración de la necesidad de tener en
cuenta el conjunto como una unidad, para garantizar la transferencia, es
imprescindible si se quiere entender el papel de la terminología en el conjunto
de aspectos que un sistema mecánico de traducción debe considerar.
En consecuencia, los términos, desde el punto
de vista de su estructura lingüística formal, pueden ser:
1. Monomorfémicos: gas.
2. Dimorfémicos, monolexémicos: ferr‑ita.
3. Plurimorfémicos, monolexémicos: bi‑carbon‑a to.
4. Plurimorfémicos, plurilexémicos:
llave de contacto.
Su actualización como palabra o frase
depende de las lenguas, no de la estructura interna del término. La coherencia
de un sistema terminológico internacional consiste, en este punto,
precisamente en la preservación de la estructura lingüística o léxico‑morfémica
del término en la transferencia de una lengua a otra, independientemente de su
forma externa, de su constitución sintagmática.
Si la anterior era la consideración tipológica (que admite, obviamente, precisiones y diferenciaciones
más finas, si se desea ampliar), podemos tomar ahora en cuenta además el
aspecto diacrónico y establecer las siguientes maneras de aparición o creación
de un término.
a) Procedimientos propios, de cada lengua
En este grupo se incluyen una serie de medios de
los que se valen las lenguas naturales en sus procesos de cambio semántico, no
específicamente empleados (ni mayoritariamente) para formar términos, aunque
perfectamente válidos y aptos para ello.
1. Lexicológicos (reflejados en la expresión). a. Composición: aguafuerte. b. Derivación (uno o varios
de los modelos siguientes, combinables): prefijación: telé‑fono infijación: merca‑nc‑ía sufijación: nitr‑ato c. Abreviación monolexémica:
radio. polilexémica: junta de portavoces (se entiende
"de los grupos parlamentarios") de ahí se puede pasar, en el
contexto oportuno, a los monolexémicos junta o
portavoces. d. Préstamo de las lenguas clásicas: memorandum, per capita de las
lenguas modernas: software, mise au
point e. Calco: puesta a punto
2. Semánticos: alteraciones del
contenido, dentro del dominio de la polisemia. ampliación: coche, piñón
metonimia: diente conversión (Sager, Dungworth y McDonald: 1980, 78):
polisemia sintáctica, un lexema puede aparecer como expresión de distintas
categorías gramaticales: 'cut', 'cut
glass', 'to cut', respectivamente, sustantivo, adjetivo y verbo.
3. Fraseológicos o sintagmáticos
En este caso lo que permite reconocer al término
es la construcción sintáctica de la frase que lo forma, en uno de los
siguientes aspectos:
a. Empleo de formas verbales especiales, terminológicamente marcadas, caracterizadoras del lenguaje
científico:
"sean AB, CD los lados paralelos de un
polígono..."
b. Construcciones oracionales atributivas, como
las del ser definidor o se llama, llamamos designadores,
o predicativas como el contiene clasificador (Wiegand, en Felber, Lang y Wersig: 1979, 117118.)
"La hipotenusa es el lado mayor de un
triángulo rectángulo"
"Se llama hipotenusa el lado
mayor..."
"Una novela contiene un cierto número
de capítulos"
c. Alteraciones del orden sintáctico habitual. Se
trata del procedimiento bien conocido históricamente que explica construcciones
clásicas como Sumo Pontífice o la imperial ciudad en vez de pontífice sumo,
ciudad imperial, modernamente: alto voltaje, con adjetivo especificativo
antepuesto, en vez del esperable, por no marcado "voltaje alto".
4. Morfológicos
Es un procedimiento menos
corriente, pero también posible, que consiste en emplear como recurso habitual
un morfema gramatical unido a un lexema con el que en la lengua general no
suele combinarse. El ejemplo más claro es el de los sustantivos abstractos
que, mediante el morfema de plural, pasan a concretos: tecnología ==D
tecnologías. Este procedimiento es conocido en español (cortesía, cortesías) y
más llamativo en otras lenguas, como el inglés, por infrecuente en la lengua
general.
b) Procedimientos terminológicos
específicos, dentro del sistema lingüístico
1. En primer lugar tenemos la creación, que puede
ser motivada (gas, de caos) o ex nihilo, muy rara (kodak).
2. Siglas,
y abreviaturas
Hay múltiples estudios sobre la
clasificación y definición de siglas, acrónimos y abreviaturas. Con la
exclusiva finalidad de diferenciar tipos posibles, presentamos lo siguiente:
En la abreviatura lo característico es el
punto que la cierra, olvidado muchas veces por descuido o por considerarlo innecesario.
Los ejemplos típicos son los lexicográficos: adj., vb.,
por adjetivo, verbo.
La distinción entre sigla y acrónimo, que
tienen en común el estar compuestos por varias letras
de las distintas palabras que forman el término que abrevian, podría
establecerse razonablemente diciendo que el acrónimo se lee como si fuera una
palabra, mientras que la sigla se deletrea. Así, USA sería un acrónimo y EE.UU. una sigla. En la práctica esta distinción no se
sostiene. Sea como sea, el procedimiento sirve para indicar que se trata de un
término.
3. También se incluyen aquí los derivados de
nombres propios, entre los cuales los hay con tradición histórica, como los
derivados del nombre del célebre matemático persa al‑Juarizmí: algoritmo,
guarismo. La mayoría son modernos: vatio, wolframio,
selenita.
4. La ampliación de los medios lexicográficos
propios es el último de este tipo. El incremento de las posibilidades del
sistema puede ser el de una vía (aumento de la composición en español contemporáneo),
o dentro de una vía: nuevos sufijos, como ‑ema,
(morfema, virtuema, lexema), o prefijos, como no‑
(no‑aplicación).
c) Procedimientos terminológicos marginales
al sistema lingüístico
Se trata de signos o medios relacionados con
la expresión o representación de la lengua, pero no propiamente lingüísticos.
Signos de puntuación, tales las comillas simples
o dobles, corchetes, paréntesis o barras.
Signos especiales tomados de otros sistemas,
como los que expresan "igual, semejante, idéntico, procedente de".
Signos tipográficos, como el cambio del tipo
de letra: VERSAL, cursiva, negrita.
El uso de la expresión aclaradora. Aunque
aparentemente se trata de un uso lingüístico, en realidad la aclaración
funciona con un signo especial. Se trata de que un término más divulgado
(frecuentemente de otra lengua) va a continuación del término que se ha
introducido, generalmente entre paréntesis, pero también entre comillas o
destacado de algún modo:
"El componente físico
(hardware)..."
El término hardware aparece para indicar que
la frase española componente físico es un término.
d) Procedimientos propios de cada ciencia
Además de los incluidos en los tipos anteriores,
algunas ciencias tienen sus propios mecanismos para representar nuevos
conceptos. Estos términos especiales son las fórmulas, que se presentan de
tres modos diferenciados (Sager, Dungworth
y McDonald: 1980, 308‑311).
a) el término en lengua natural: metano
b) el término en fórmula lineal: CH4
c) el término en fórmula no
lineal, de desarrollo difícilmente verbalizable:
H
I
H ‑ C ‑ H
I
H
Sin. embargo, como
ocurre con la notación musical, las representaciones b) y c) tienen la
indudable ventaja de que no precisan traducción, son equiparables a un
gráfico, permanecen idénticas sea cual sea la lengua en la que se hable de
ellas.
Los términos se forman de
acuerdo con uno o varios de los procedimientos que acabamos de ver. Una vez
formados se incorporan a la lengua (aunque sea dentro de sus usos especiales), io que significa que pertenecen a una de las categorías
gramaticales, clases de palabras o tipos de frase. La mayoría son sustantivos,
pero no faltan adjetivos y verbos, siendo más raros los adverbios y los relacionantes. En las frases abundan las prepositivas y las
nominales y son raros los que llegan a tener una estructura oracional o proposicional (Rey: 1979, 79‑80).
Una vez incorporados, por supuesto, pueden dar origen a nuevas categorías
derivadas (verbos de sustantivos, frecuentemente: holding, holdear).
Los sistemas propios de creación de términos,
como las fórmulas, y los medios auxiliares para diferenciarlos (signos de
puntuación, etc.) son procedimientos de especificación o diferenciación de
términos que facilitan la labor del traductor o, en el caso de los primeros,
eliminan la necesidad de éste: un libro totalmente integrado por fórmulas
necesitaría tan poco la traducción como una partitura musical o un programa de
ordenador en cualquier lenguaje de alto nivel, en el que las expresiones en
lengua natural se han reducido al papel de fórmulas, igual que C y H en las
combinaciones que acabamos de ver.
Fuera de estos usos específicos, los
términos técnicos, como ha señalado K. Opitz (en Hartmann: 1983, 59‑60) no suelen entrar en las lenguas
de forma abrupta. La creación es un procedimiento
poco usual. Lo habitual es que se formen siguiendo las reglas que cada lengua
tiene para la formación y ampliación de su léxico, bien por medios
lexicológicos (derivación y composición), bien por el préstamo, tomando de otra
el término que necesita. También es frecuente la aplicación del cambio
semántico: una forma léxica existente adquiere, como término, un valor
semántico nuevo. De este modo la forma léxica se hace polisémica,
o incrementa su polisemia anterior.
No es, por tanto, lo formal lo que
caracteriza al término, aunque sea lo que permite diferenciarlo en los textos.
Lo característico es que posee un significado rígidamente limitado. Opitz (cit., 60) señala con
acierto que "ésta es precisamente la significación de la expresión
'término'. Como terminus denota el final de una línea
de cambios y desarrollos de la cual ha sido sacado por su seguridad, aunque
haya sido forzosamente".
TERMINOGRAFÍA Y LEXICOGRAFIA
El encargado de la terminología en un proyecto
de traducción por ordenador no ha de ser necesariamente un terminólogo, sino un
terminógrafo. Terminología tiene dos acepciones,
"conjunto de términos que constituyen una disciplina" y "ciencia
que estudia los términos, su formación, clasificación y difusión". La‑
terminografía, por su parte, es una técnica, que
permite la recolección y fijación (de forma gráfica o magnética) de la
terminología en su primera acepción, del conjunto de términos.
Aunque ya hemos señalado, siguiendo a Rey
(1979, 52), que la terminología (mejor ahora "terminografía")
no debe confundirse con una lexicografía de dominios especiales, no cabe duda
de que el terminógrafo precisa tener una formación
básica como lexicógrafo, con el fin de beneficiarse de los avances teóricos y
prácticos de una disciplina y una técnica bien conocidas y desarrolladas.
En la vida de todo término hay tres
aspectos: su acuñación, con la correspondiente descripción, su transmisión y
difusión, que exigen coherencia y aceptación, y su normalización, es decir, su
fijación precisa y "definitiva" dentro del corpus terminológico. Los
términos se describen, transmiten y fijan por medio de diccionarios,
vocabularios o glosarios (sea en su versión tradicional o en la moderna de
bases de datos). Los procedimientos que se siguen para
ello son lexicográficos, aunque con diferencias que hay que tener en cuenta.
La lexicografía, en general, puede partir de
un vocablo y analizarlo en sus rasgos, en lo que se llama procedimiento
semasiológico, o puede partir del conjunto de rasgos, nociones o características
para llegar a la forma léxica, en el procedimiento onomasiológico.
El procedimiento semasiológico es el
habitual en la traducción: se parte de una forma léxica en una lengua dada y se
obtiene otra forma léxica en la lengua a la que se traduce. Si los términos
están bien construidos y no son polisémicos, este
procedimiento dará resultados exactos, lo que significa que el terminólogo‑traductor
deberá proporcionar un glosario terminológico como contribución al desarrollo
del proyecto de traducción por ordenador en el que esté implicado.
Sin embargo, no siempre es tan sencillo construir
ese glosario como subcomponente del léxico, por lo
que deben tenerse en cuenta aspectos generales.
Los diccionarios se dividen tradicionalmente
en dos grandes bloques: los diccionarios de nombres, que son los que conocemos
habitualmente como diccionarios de una lengua o, casi sin excepción, los
diccionarios bilingües o plurilingües, y los diccionarios de objetos, llamados
por regla general enciclopedias o tesauros.
Una terminología monolingüe tiene más de la
estructura de un diccionario de objetos que de un diccionario de nombres. La terminografía bilingüe que un sistema de traducción
requiere debe contener, sin embargo, un componente lexicográfico de nombres.
Esto afecta a la elaboración del glosario de varias maneras. Tanto en un caso
como en otro nos movemos en el dominio de la metalengua,
puesto que las entradas del vocabulario o glosario terminológico son términos
de una lengua natural (ya hemos precisado que las fórmulas, p. ej., que
no son lingüísticas, no se traducen). Con esto se quiere decir que la metalengua de las entradas terminográficas
tiene una mayor dependencia del hecho lingüístico. Los descriptores de los
tesauros, en cambio, emplean una metalengua de
descripción libre.
Si consideramos una obra terminográfica,
en general, y no un mero glosario de correspondencias biunívocas de términos
en diversas lenguas, estaremos de acuerdo en la necesidad de que el término
vaya explicado por una definición. La definición lexicográfica debe evitar la circularidad (en la práctica la retrasa lo más posible) y
hacer uso de unos elementos o rasgos mínimos, para los que incluso puede
postularse el carácter de "universales de la descripción lexicográfica".
En terminografía esto no es necesario (o, al menos,
tan necesario): la circularidad de la definición no
preocupa mucho (Rey: 1979, 95, n. 1). La explicación
está en la línea de lo que hemos defendido antes: el terminógrafo
no permanece en el campo de lo metalingüístico, sino que pasa a un dominio
específico ulterior, que hemos llamado ultralingüístico
para diferenciarlo, pero que podría tener cualquier nombre que indicara que
hemos abandonado no sólo los dominios de la lengua de uso corriente, sino
también de la metalingüística.
La norma DIN2330 de julio de 1961 (p. 6)
dice que la "definición (Begriffsbestimmung) en
sentido amplio es la descripción de un concepto mediante conceptos
conocidos". Aunque Wiegand (en Felber, Lang y Wersig: 1979, 111‑112) encuentre que esta definición
de la definición deja demasiadas cosas pendientes, podemos
pensar que ésta es la postura ‑muy justificada‑ del lexicógrafo y
que quizás al terminógrafo le bastaría con añadir un
adjetivo cuantitativo y decir "mediante suficientes conceptos conocidos".
Es cierto que se introduce una peligrosa variante de subjetivismo; pero
también es verdad que no necesitan la misma descripción de un término el
especialista en el dominio de este término y otro científico de campo distinto
(y no decimos nada del hablante ordinario porque se entiende que hemos salido
ya de su esfera de empleo de la lengua, si no, sus necesidades serían
indudablemente mayores).
Lo anterior no debe llevarnos a creer que la
terminología sea una simple nomenclatura: en ella habríamos permanecido si no
hubiéramos abandonado el plano *metalingüístico; estaríamos en el dominio de
los nombres, denominaciones o designaciones de los objetos, lo cual es
inexacto. Si el terminógrafo que construye un sistema
general o particular dentro de una lengua no permanece recluido en el círculo
de los nombres, tampoco parece que esto sea lo más aconsejable en el caso del
que trabaja en un proyecto concreto de traducción entre lenguas. Por supuesto,
la opción es doble, y elegir un trabajo terminográfico
que, además de las correspondencias entre los términos en las distintas
lenguas, añada un componente de descripción y explicación, requiere unas notas
aclaratorias.
RECOLECCIÓN, SELECCIóN Y CLASIFICACIÓN
DÉ LOS TÉRMINOS
La realidad del trabajo de aplicación y los
hermosos conceptos teóricos no tienen siempre mucha relación, aunque el terminógrafo, comparado con su pariente, el constructor de
analizadores o trazadores sintácticos (parsers), es un ser afortunado. El pragmatismo está en la
raíz misma de la lexicografía, por lo cual el paso de ésta a la terminografía no es tan gigantesco como el que va de la
teoría sintáctica al trazado oracional (parsing).
El terminógrafo
dispone su material a partir de unas bases bien determinadas:
1. Un corpus lexicográfico, integrado por diccionarios
técnicos y especializados, vocabularios y glosarios bi‑
o monolingües.
2. Los índices de términos que, cada vez con más
frecuencia, por fortuna, . acompañan
a las obras especializadas.
3. Los medios lexicográficos de la lengua general,
es decir, los diccionarios y vocabularios de las lenguas sobre las que
trabaja, directos, inversos, generales, de frecuencias, ideológicos, de todo
tipo.
4. Su corpus específico, que deberá extraer de
textos, libros o artículos, normas, disposiciones legales o administrativas,
etc., en los cuales deberá reconocer los términos aplicando los criterios
formales que repasamos al ocuparnos de ellos.
5. Por la índole de su trabajo, puede tener que añadir
una serie de términos que no son términos en general, pero sí en los textos que
ha de traducir (caso de los valores específicos de instituciones europeas en
EUROTRA).
Esta labor inicial, que podrá realizar mejor
con la ayuda de una base de datos y en la que podrá utilizar al menos
parcialmente alguna de las ya existentes, como EURODICAUTOM en el caso de la
Comunidad Europea (Knowless, en Hartmann:
1983, 187), e incluso redes terminológicas, como TermNet,
se puede completar acudiendo a organismos específicos, como la Comisión de
Terminología de la Real Academia de Ciencias, en España, internacionales, como
INFOTERM, en Viena, sea directamente, sea a través de publicaciones como Infoterm Newsletter (anejo de Lebende Sprachen), o elencos como
la World Guide to Terminological Activities.
Además, las normas y estándares como ISO o DIN proporcionan un rico muestrario
de términos.
Confrontados con la realidad de treinta
millones de términos es obligado reconocer que un terminógrafo,
sea una persona o un grupo, no puede abarcar toda esa extensión. Por ello es
imprescindible trabajar sobre dominios o campos especiales (subfields). Este hecho innegable
ocasiona sin embargo discrepancias que los participantes en proyectos concretos
de traducción por ordenador conocen bien. (Entramos ahora en un terreno en el
que se reflejará inmediatamente nuestra propia experiencia en EUROTRA y en el
que es necesario citar a Henrik Sorensen,
defensor de las tesis que, generalmente, apoyaremos desde aquí).
Homogeneidad en el corpus, claridad, brevedad
y sencillez en las definiciones son los requisitos razonables de cualquier
diccionario terminológico estándar que sea útil (Opitz
en Hartmann: 1983, 163‑180).
El primero de ellos coincide con el hecho natural de que los diccionarios
técnicos son usualmente "segmentales". Se produce así, de modo simultáneo, una selección y
clasificación terminológica del léxico, junto con un proceso de
estandarización, ya que, se quiera o no, todos los diccionarios son
instrumentos de codificación y normalización lingüísticas. Su peligro radica en
que el léxico se mueve más de prisa que ellos, por lo
cual se encuentran pronto con que contienen un buen número de formas y
acepciones anticuadas, mientras que les faltan una serie de voces y acepciones
nuevas.
La electrónica, especialmente por medio de
las bases de datos, puede solucionar esta situación; pero se encuentra con los
dos obstáculos que señala Al‑Kasimi (en Hartman:
1983, 156): los bancos terminológicos usan distintos tipos de máquinas y de
programas, muchas veces incompatibles o difíciles de trasladar y, al mismo
tiempo ‑lo cual es mucho más grave‑, no hay un sistema universal de
clasificación (véanse Lang, en Felber,
Lang y Wersig: 1979, 208‑225;
y Supper, ibíd.,
226‑236).
Existen dominios temáticos relativamente
bien cubiertos, como la Botánica, con el sistema de Linneo.
Sin embargo, aun en estos casos se trata de sistemas parciales y que sólo a
duras penas cubren todas sus necesidades. Lo mismo ocurre con los sistemas de
clasificación decimal, el de Dewey o el de la
Biblioteca del Congreso de los Estados Unidos, el último de los cuales parece
irse imponiendo, no por su perfección, que no pretende, sino por su amplitud,
especialmente. El problema rebasa el campo del terminógrafo
y corresponde al documentalista. El primero deberá tener en cuenta la necesidad
de informarse sobre documentación, para encontrar ayudas en este terreno.
BANCOS DE DATOS
TERMINOLÓGICOS
Anteriormente nos hemos referido a bases y
bancos de datos, cuyas ventajas para los usuarios son innegables. Pueden
clasificar y distribuir el contenido, mantenerlo al día y ponerlo a
disposición de una pluralidad de usuarios (seguimos a Schneider:
1985, quien describe el banco que explicamos a continuación).
TEAM es un ejemplo claro de este tipo de
instrumentos. Se trata de una base de datos plurilingüe, desarrollado para
funcionar en un entorno de máquinas SIEMENS en los años sesenta. Cuando lo
describió Schneider contenía unos dos millones de
registros en ocho lenguas (alemán, español, francés, holandés, inglés, italiano,
portugués y ruso). Cada registro se
subdivide en 99 campos, puede contener 4.000 octetos (bytes)
de información y se estructura de este modo:
00‑09 Encabezamiento
10‑89 Secciones por lenguas, o sea:
10‑19 Alemán 20‑29 Inglés 30‑39
Francés 40‑49 Español 50‑59 Ruso 60‑69 Italiano 70‑79
Portugués 80‑89 Holandés 90‑98 (sin asignar en concreto) 99 Fin‑del‑registro
La información que se da en el encabezamiento
tiene validez para todo el registro:
00 Número
de serie de la entrada (dos le tras,
cuatro dígitos)
01 (vacío para usos futuros) 02 (vacío)
03 Tipo/calidad
del registro
E
= entrada monolingüe
A
= provisional, "equivalencia" aproximada
D
= equivalencia absoluta
04 Fecha de entrada o puesta al día 05
Código de conjunto (pool code)
06 Campo(s)
temático(s)
07 (vacío)
08 (vacío)
09 Panorama
o uso del concepto (p. ej.,
sistema, proyecto)
Cada una de las secciones individuales contiene
la información siguiente:
n0 Término (o frase)
n 1 Parte de la oración (término)
n2 Fuente(s) del término
n3 (vacío)
n4 Definición
del término con fuente(s) o referencia
n5 Término
y su contexto
n6 Sinónimo(s)
del término con indicación de fuente y parte de la oración
n7 Palabras clave de la frase para n0
n8 Etiqueta(s) para campo(s) temático(s)
n9 (vacío)
En la organización del banco se combinan los
aspectos de carácter administrativo o de organización con los de distribución
de un contenido científico. Así, hemos visto que 00 es una dirección que se
necesita para la puesta al día, o que 05 indica la pertenencia a un cierto
conjunto (pool) del cual es responsable una persona o grupo. Dado que uno de
los problemas de la terminología es que podemos habérnoslas con un término que
todavía no sea estándar, son imprescindibles campos como 04, n2 ó 03 que nos
indican la fecha, la fuente o el grado de fiabilidad.
Aunque n4 sea el principal actor
en la definición, la asignación de un campo temático adecuado (06) es
imprescindible, lo mismo que la capacidad para proseguir subclasificando.
No sólo importa la lengua en que
se expresa el término, sino también el mundo al que pertenece. En inglés se
dice "Secretary of State" tanto al del Canadá como al de los Estados
Unidos. El primero es un ministro del Interior, el segundo del Exterior.
Además, sus funciones pueden no ser las mismas de sus correspondientes en el
sistema español, por lo que la traducción deja siempre un vacío que sólo se
puede evitar con unas explicaciones complementarias que lo precisen y acompañen
a la definición.
La ventaja de un banco de datos
bien estructurado es que permite la fácil obtención de glosarios,
vocabularios y subdivisiones, con lo que facilita un material de lexicografía
terminológica complementario de suma utilidad, con el que los usuarios trabajan
más cómodos que directamente sobre el terminal del ordenador.
EL SUBCOMPONENTE TERMINOLÓGICO DEL LÉXICO EN UN
PROYECTO DE TRADUCCIÓN POR ORDENADOR
Lo anteriormente expuesto nos
lleva a concluir que el resultado del trabajo terminográfico
en un proyecto de traducción y por ello también de traducción por ordenador es
un subcomponente del léxico que no requiere la aplicación
de reglas de trazado o análisis sintáctico y que puede proporcionar una serie
de correspondencias biunívocas de los términos en varias lenguas, con
traducción de término a término. Así sería si viviéramos en un mundo ideal y
no en el mejor de los mundos posibles. La realidad desmiente este hecho, como
desmiente la univocidad de buen número de términos que, por tanto, no tienen un
equivalente univoco para su traducción, sino varias correspondencias.
Este hecho afecta
a la construcción del léxico en su conjunto, o lexicón, dentro de un proyecto,
ya que este subcomponente, a cuyas unidades no se aplican
una serie de reglas del sistema, se diferencia del léxico general como tal
precisamente porque a los componentes de éste sí se les aplican las reglas. Por
ejemplo, goods and services es un término al que corresponde bienes y
servicios; en un léxico general figurarán good, and y services, por un lado, bienes,
y, servicios, por otro. Lo que hace que goods and services se traduzca por
bienes y servicios no depende de que haya un good o
un service sustantivos que se ponen en plural con ‑s,
a los que corresponden bien (plural + ‑es) y servicio (plural + ‑s),
así como una conjunción copulativa and a la que
corresponde y. La traducción depende de que hay un bloque, un conjunto de
elementos inseparables, goods and
services, forma única, al que corresponde otra forma
única, bienes y servicios. Este sencillo e innegable hecho obliga
a construir un léxico de doble componente y a asegurar distintas vías
mecánicas de acceso a ambos, con prelación del subcomponente
terminográfico, seguramente.
La solución, en este caso, está en la línea
de las propuestas de los autores que se han ocupado de la clasificación, como Lang o Knowless, o de las
comunicaciones internas de Sorensen en EUROTRA. El terminógrafo debe construir su subcomponente
léxico bilingüe atendiendo a reglas de este tipo:
1. Una entrada para cada término, entendiendo por
tal el signo que relaciona una misma forma con distintas acepciones, si éste
fuera el caso. Por ejemplo, producto tiene un valor distinto en Aritmética y en
Economía, tendría así, al menos, esas dos entradas.
2. Una cita explícita y clara de un texto donde
el término tenga el valor que corresponde a esa acepción.
3. Una
indicación de clasificación en dominios, según 1 y 2.
4. El término que lo traduce a cada lengua a la
que se ha de verter, con indicación de las restricciones y peculiaridades que
se puedan presentar, abriendo en cada caso nuevos subdomlnios,
si se requiere.
Todo lo anterior debe situarse en relación
con el tipo de texto (tipología textual) y con el uso específico (LSP), que, no
obstante, no pueden proporcionar una información definitiva. En medio de un
texto descriptivo matemático puede aparecer un término usado con el valor que
tiene en el dominio de la Botánica y no en el de la Matemática. La experiencia demuestra
la frecuencia con la que los textos ofrecen muestras de estas teóricas
"rarezas".
La perspectiva del terminógrafo
en un proyecto de traducción por ordenador debe seguir, de todos modos,
clara: al sistema de traducción se le pide que proporcione el mejor de los
resultados posibles, no la perfección. Como se repite tanto parece que en el
fondo no se cree: no sólo los traductores, también los lectores monolingües
especializados dejan de percibir con frecuencia aspectos de un texto, o simplemente
se confunden, dan interpretaciones equivocadas. Las páginas anteriores no son
un camino de perfección, sino un intento de puntualizar, con la finalidad de
aclarar unos problemas teóricos concretos para una mejor aplicación. Si
participa también en la discusión general sobre la terminología es porque la
existencia de un subcomponente terminográfico
afecta indudablemente al léxico, al menos en dos puntos fundamentales: el
tamaño del mismo y la descripción.
Nota: Este artículo ha sido redactado gracias a una
ayuda de la Alexander von Humboldt‑Stiftung para 1987, en el Instituto de Traducción e
Interpretación y el Romanisches Semmar
de la Universidad de Heidelberg, Alemania, y en el
Centro Científico de IBM en esta ciudad.
REFERENCIAS BIBLIOGRÁFICAS
Alzugaray, Juan José (1979), Voces extranjeras en el
lenguaje tecnológico, Madrid: Alhambra.
Arnt, Remen y Picht, Heribert (1982), Einfülhrung m die überserzungsbezogene
Terminologiearben, Hildesheim:
Georg Olms Verlag.
Baldmger, Kurt (1970),
Teoría Semántica, Madrid: Alcalá.
Barr, Avron, y Feigenbaum, Edward A, (edj
(1982), The Handbood of Artificial Intelligence,
Pitman, Londres, 3 vols.
Bossong, Georg (1978), "Semantik der Terminologie.
(Zur Vorgeschichte der alphonsinischen Schachtermmi) ZRPh, XCIV, 48‑68.
Drozd, L„ y Seibicke, W. (1973),
Deutsche Fach‑ und Wissenschaftssprache.
Bestandsaufnahme ‑ Theone
‑ Geschichte,'. Wiesbaden: Oscar Brandstetter.
Felber, Helmut (1984), Terminology Manual, París: UNESCO.
Felber, Helmut; Lang, Friednch; Wersig, Gernot (1979), Terminologie als
Angewandte Sprachwissenschaft.
Gedenkschnft für Universitáts Professor Dr E Wüster,
München: Saur Verlag.
Fluck, Hans‑Rüdiger (1976),
Fachsprachen, Munich, Francke.
Galmski, Chrishan (ed.) (1976),
International Cooperation in Terminology München: Verlag Documentation (Infoterm
Series n.° 3).
Galinski, Christian (ed.) (1982), Terminologies for the 1980x,
München: Saur Verlag (Infoterm Series n.° 7.).
Hartmann, R. R. K. (ed.) (1983), Lexicography:
Principles and Practice, London: Academic Press.
Heger, Klaus (1974),
Teoría Semántica, Madrid: Alcalá.
Hogben, L. T. (1971), The
vocabulary of Science, London.
Hohnhold. Ingo (1982), "Principles of and Cooperation m
Translation‑oriented Terminology Work", Infoterm
Series 7 Terminologies for the Eighties,
Kittredge, Richard, y Lechrberger,
John (eds.) (1982), Sublanguage: Studies of language in restricted semantic domaras, Berlín/N.. York. De Gruyter.
Lehrberger, John, cfr. Kittredge, Richard.
Lyons, Sir John (1977),
Semantics, I y II. Cambridge: University Press. Traducción española de Ramón Cerdá,
Barcelona: Teide.
Marcos Marin,
Francisco (1975), Lingüística y Lengua Española. Madrid Cincel.
Marcos Marin,
Francisco (1979), Reforma y Modernización del Español (Ensayo de
Sociolingüística Histórica), Madrid: Cátedra.
Marcos Marín, Francisco (1984), Curso de
Gramática Española. Madrid. Cincel‑ Kapelusz,
1980, 2." ed. Madrid: Cincel.
Ogden, C. K. y Richards,
1. A. (1923), El significado del significado, traducción española, Buenos
Aires: Paidós, 2.° ed. 1964.
Picht, Heribert, y Draskau, Jennifer (1985), Terminology an introduction,
Rey, Alam (1979), La
terminologie: noms et notions, Paris: Collection Que sais‑le? no. 1780, PUF,
Rondeau, Cuy (1981),
Introduction á la terminologie, Chicouhmi: Gaetan Morra (2.1 ed. 1984).
Sager, Juan C.; Dungworth,
David; McDonald, Peter F. (1980), English Special Languages, Wiesbaden Oscar Brandsetter Verlag K. G.
Schneider, Thomas (1985), "Terminology
Teaming Up Homo Faber and Homo Linguisticus",
Computers and the Humanities, 19, 103108.
Schulz, Joachim (1980), A
Terminology Data Bank for Translators (Team)",
Vollnhals, Otto (1982), "Technical Dictionaries Retrieved
from a Databasé', Meta, 27, 157‑166
Wiegand, Herbert Ernst (1987), "Was eigentlich
ist Fachlexikographie?", Mecanografiado.
Heidelberg.
Wüster, Eugen (1970), Internationale Sprachnormung m der Technik, 3,a
ed.,
Wüster, Eugen (1974), "Die allgememe Termmologielehre ‑era
Grenzgebiet zwischen Sprachwlssenschaft, Logik, Ontologie, Informatik und den Sachwnssenschaften", Lingmstics,
119, 61‑106.
Wüster, Eugen (1979), Emführung m die Allgerneíne Terminologielehre und Terminologische
Lexikographie, Wien/New
York, Sprmger Verlag