LA LENGUA EN USO:
DISTRIBUCIÓN DE
Autora: Mónica Noemí Trípodi
e-mail:
monica900@ciudad.com.ar
En este trabajo se describen los
resultados obtenidos en mis investigaciones presentando el enfoque en que las
enmarco, los aportes al área temática de los equipos de los que formo parte y
las aplicaciones de las investigaciones llevadas a cabo hasta ahora.
Mi trabajo se enmarca en dos
proyectos: UBACyT F014 (UBA)[1] y PIP
02489 (CONICET)[2]. El
UBACyT se especializa en el estudio de problemas lingüísticos con correlato en
la enseñanza de la de la comprensión y producción de discursos orales y
escritos. El PIP profundiza el estudio fonético y prosódico del lenguaje en
relación con la sintaxis con el fin de aplicar los resultados a la síntesis del
habla.
Para demostrar que existe
correlación entre lo que el hablante quiere lograr, la entonación y la sintaxis
analicé la prosodia, en conjunción con la sintaxis posicional y funcional de
321 oraciones declarativas en español de Buenos Aires, leídas por una locutora
y otras 133 con iguales características leídas por un locutor.
Palabras claves: estudio fonético, prosodia, sintaxis,
síntesis del habla, entonación, español de Buenos Aires, oraciones
declarativas, comprensión y producción de discursos orales y escritos.
1. INTRODUCCIÓN
1.1
Resumen
A lo largo de este
trabajo se describirán los resultados obtenidos en mis investigaciones acerca
de la relación entre los aspectos prosódico, pragmático y sintáctico del
lenguaje, se presentarán el enfoque en que los enmarco, los aportes del área
temática llevados a cabo por los equipos de los que formo parte y, por último,
las aplicaciones de las investigaciones que se realizaron hasta ahora.
Mi actual trabajo se
enmarca en investigaciones previas que fueron desarrolladas en el marco de dos
proyectos: UBACyT F014 (UBA) y PIP 02489 (CONICET). El primero, el UBACyT, se especializa en el
estudio de problemas lingüísticos con correlato en la enseñanza de la
comprensión y producción de discursos orales y escritos, desde un enfoque
integrador de los diversos aspectos del lenguaje: el enfoque
Cognitivo-prototípico.
El segundo, el PIP,
profundiza el estudio fonético y fonológico de la lengua en relación a las
clases de palabras y a la sintaxis, con el fin de aplicar los resultados a la
síntesis del habla y producir un conversor de alta calidad; para lo cual
desarrolla e integra los aspectos lingüísticos con los últimos avances
tecnológicos en análisis del sonido.
1.2. Laboratorio de Investigaciones
Sensoriales (LIS)
El Laboratorio se
conformó hace treinta y tres años, en 1972, y se encuentra dirigido desde ese
momento por la Dra. Miguelina Guirao.
Como su nombre lo indica, el LIS dependiente del Consejo Nacional de
Investigaciones Científicas y Técnicas (CONICET) se dedica a investigar los
sentidos y las percepciones que a través de ellos tienen las personas. El área
de Audición y Habla, en la que me desempeño, se encuentra dirigida por el
Ingeniero Jorge Gurlekian.
Durante toda la
trayectoria del LIS se han llevado a cabo numerosas investigaciones. Las últimas en lo que concierne al área de
Audición y Habla, se encuentran relacionadas con el reconocimiento de patrones
acústicos y fonéticos en la secuencia de habla, cuyas aplicaciones son
múltiples. Por ejemplo, en Educación,
permitiría avanzar sobre la rehabilitación de discapacitados auditivos y
comprender los procesos de aprendizaje del habla; en Otorrinolaringología, se
estudiarían patologías del habla con pruebas computarizadas y logoaudiometrías;
en Inteligencia Artificial, se lograría el reconocimiento de patrones y el
procesamiento de lenguaje natural; en Bioingeniería; posibilita el desarrollo
de sistemas de comandos de dispositivos para la voz y finalmente en
Telecomunicaciones se aplicaría al desarrollo de modelos del sistema fonatorio.
Los últimos trabajos¹ se
enmarcan en los proyectos PICT (2000) y PIP (2004-6) cuyo tema para ambos es:
“Sistemas de texto a habla: desarrollo de métodos automáticos para la
generación de contornos prosódicos”.
En los dos proyectos se
pusieron en marcha investigaciones relacionadas con la entonación, el ritmo, el
acento y la pronunciación de la voz humana para lograr su misma naturalidad, en
la voz que generan los sistemas de información oral automáticos a partir de
texto escrito. Para lograrlo se propuso
1) marcar y medir dichas características en un gran número de oraciones, 2)
asociar estas características a la estructura y componentes de la oración y
finalmente, 3) generar los contornos más probables para las nuevas oraciones
que deban generarse.
En este momento estamos
llevando a cabo la etapa 2) del proyecto PIP 02489; aunque cabe aclarar que
también existen otros proyectos, algunos de ellos subsidiados y otros no:
b) Proyecto no subsidiado: Proyecto BASE DE
DATOS DE PACIENTES HIPOACÚSICOS. (Iniciado
año 2002).
Actualmente el equipo ha quedado
conformado de la siguiente manera: el director, el Ingeniero Jorge Gurlekian;
el tesista de doctorado Bioingeniero Humberto Torres, becario del CONICET; el
recientemente incorporado tesista de doctorado Bioingeniero Diego Evin, becario
PAV; las candidatas a tesistas de doctorado Licenciada en Fonoaudiología,
Natalia Elisei y la Profesora Licenciada en Letras, Mónica N. Trípodi. Todos
sus integrantes conforman un equipo interdisciplinario que aportan desde sus
disciplinas los conocimientos necesarios para llevar adelante los Proyectos.
El bioingeniero Humberto Torres
estudia en su tesis “Generación de prosodia para un conversor de texto a voz”,
las pausas, la duración, las unidades de síntesis y la validación de la
frecuencia fundamental. El bioingeniero
Diego Evin trabaja en “reconocimiento” de la voz para generar texto, es decir
el proceso inverso de la síntesis. La
Licenciada Natalia Elisei se dedica a la “Evaluación objetiva de la voz para el
diseño de una prueba de detección y caracterización del grado de desórdenes
vocales”, título de su tesis, es decir que intenta encontrar un medio a través
de un método científico que mida objetivamente los síntomas para la resolución
de distintos problemas de la voz.
Por último, yo, licenciada Mónica
Trípodi que trabajo para encontrar correlatos entre los diferentes elementos
que conforman la prosodia de la voz hablada y la sintaxis del discurso.
1.3.Instituto de Lingüística
Los proyectos UBACyT tienen una
extensa tradición en la Universidad de Buenos Aires. Desde el año 1999 realizo investigaciones
sobre la lengua española, específicamente acerca del adjetivo: su posición y
clasificación; y en la actualidad sobre la relación entre la sintaxis y la
prosodia, en el marco de distintos UBACyT bajo la dirección de la Dra. en
Lingüística Románica Claudia Borzi.
Durante el primero en el que
participé, AF049 (2000-2001) “Enfoque Cognitivo y gramática aplicada a la
enseñanza del español: relaciones sintácticas”,
realicé investigaciones que se vieron reflejadas en el trabajo “La
posición del adjetivo en español” (1999). Dichas investigaciones continuaron a
lo largo de los UBACyT F157 (2002-2003) y F014 (2004-2006), en los que se
enmarcaron “La posición del adjetivo en español en contexto literario (2001),
“El adjetivo descriptivo: una clasificación posible” (2002), “Cambio de orden
¿cambio de significado?” (2003), “El adjetivo descriptivo: un enfoque cognitivo
en relación a la clasificación” (2004) y por último “Etiquetamiento sintáctico
para el desarrollo de un sistema TTS” (2005), realizado como miembro de ambos
equipos.
Todos estos trabajos se encuentran
reunidos bajo un enfoque común, el enfoque cognitivo-prototípico, postura
teórica que resulta integradora de los distintos aspectos de la lengua
española: pragmática, sintaxis, semántica, morfología y fonética-fonología.
La pragmática estudia para qué se
usa la lengua; la semántica, su significado; la sintaxis, el orden, la posición
de las palabras en la oración y sus relaciones; la morfología, cómo se componen
las palabras; la fonética y la fonología, los componentes mínimos distintivos
de significado, la entonación y el ritmo.
Este enfoque está fundamentado en
la teoría cognitivista, es decir en la forma en que conocemos los humanos, los
procesos que llevamos a cabo para producir el conocimiento, cómo categorizamos
la realidad o lo que conocemos de ella.
Se basa en una noción nueva de categoría, pues ésta no representa mentalmente
la realidad sino el conocimiento de la
forma en que usamos un objeto, en este caso, el lenguaje. Por lo tanto el conocimiento tiene una
estructura semiótica motivada para el uso del objeto en situaciones reales.
Las categorías pueden no tener límites
precisos (categoría no discreta) y quedan definidas por un conjunto de
propiedades que no son ni necesarias ni suficientes. Como ejemplo basten las
clases de palabras, en la cual una misma palabra puede ser sustantivo o verbo,
dependiendo del contexto su clasificación (llama,
tomo, suelo, canto).
De esta forma vamos a encontrar
mejores ejemplos unos que otros, casos poco claros, una estructura gradual que
va desde los ejemplos más representativos hasta los no-miembros de la
categoría.
Prototípico porque considera que en
la mente de los hablantes nativos de una lengua en un momento dado existe el
“mejor ejemplo”, el prototipo de la categoría. Ejemplos: “rosa” de la categoría
flor; “perro/gato” de la categoría animal doméstico.
El equipo que integra el UBACyT, con sede en el
Instituto de Lingüística dependiente de la Facultad de Filosofía y Letras de la
UBA, está conformado por su directora, la Dra. Claudia Borzi; la Dra. María
Amalia García Jurado y el Licenciado Carlos Luis, ambos Profesionales Principales
del CONICET, la Profesora Licenciada Magíster Laura Miñones y la Licenciada
Vanina Barbeito, ambas becarias doctorales del CONICET, la Licenciada Marisa
Macchi, adscripta a la cátedra de Gramática de la F.F. y L. de la UBA y la
Profesora Licenciada Mónica Trípodi, investigadora en formación.
Este equipo, del cual también formo parte, estudia
el español en sus distintos aspectos. La Dra. García Jurado se especializa en
fonética, fonología y prosodia; el Lic. Carlos Luis se dedica a la Historia de
las ideas gramaticales; la Lic. Macchi, a la voz pasiva; yo, al adjetivo y las
relaciones entre prosodia y sintaxis; y el resto del equipo a las relaciones
sintácticas: la Lic. Miñones, a los conectores concesivos, la Lic. Barbeito, a
la posición; la Lic. Silva a las proposiciones relativas y la Dra. Borzi, a las
conexiones adverbiales.
2. DESARROLLO
2.1.
PROBLEMA
A lo largo de la
enseñanza de la lengua durante el período de escolarización se detectan en los
textos y discursos producidos por los alumnos errores gramaticales que creemos,
ocurren debido a la influencia de la oralidad en la escritura y la falta de
adecuación de esos discursos a aspectos pragmáticos propios de la situación
comunicativa en la que se enmarcan. Por
dicha razón consideramos pertinente realizar un estudio pormenorizado y
profundo sobre la prosodia, en relación con la sintaxis del español de Buenos
Aires, con el fin de determinar en el futuro las causas que provocan los
errores.
Un enfoque que
encara el fenómeno lingüístico desde una perspectiva integradora de los
distintos aspectos del lenguaje (pragmático, sintáctico, semántico,
morfológico, fonético y prosódico) es el enfoque cognitivo- prototípico; que es
el que aquí se adoptará para describir de qué modo los fenómenos prosódicos, en
particular las pausas, marcan la diferencia entre información conocida
(asociada formalmente al sujeto) e información nueva (asociada al predicado).
Por otra parte este
estudio también servirá para el desarrollo de los procesos de síntesis del
habla, ya que sus resultados se aplicarán para producir un conversor de alta
calidad.
2.2. CORPUS DE DATOS
El corpus con que se
trabajará consiste en 381 oraciones declarativas, aisladas, de sujeto expreso inicial (posición 1) que
fueron leídas y a la vez grabadas por una locutora profesional adulta de origen
rioplatense y 133 oraciones con las mismas características, leídas y grabadas
por un locutor profesional adulto originario de Buenos Aires; las cuales fueron
seleccionadas de un corpus de datos total de 741 oraciones de foco amplio, con
distintas características sintácticas (Oraciones unimembres, bimembres,
compuestas, complejas y con proposiciones incluidas).
2.3. METODOLOGÍA
En una primera fase,
anterior a la actual, estas oraciones fueron analizadas tonalmente y luego,
considerando la frecuencia fundamental (F0) de cada una de ellas se
establecieron sus pausas de manera perceptual², en una gradación de 0 a 4;
siendo los niveles 3 y 4 los que marcan una verdadera pausa. El nivel 4 indica
límite de frase, pausa física, silencio; el nivel 3 señala límite de frase por
diferencia tonal marcada; el 2 indica el encuentro de una consonante con otra
en el límite de palabras; el 1, el de una consonante con una vocal y el 0, el encuentro de una vocal con otra.
En una segunda instancia
también anterior, se procedió a realizar el etiquetado sintáctico de las
secuencias en cinco niveles. Sin embargo
en esta fase del proyecto, como en las anteriores, se etiquetó un corpus total de 741 oraciones declarativas, aisladas y
grabadas por dos locutores, uno de sexo femenino y otro de sexo masculino, con
un programa computacional diseñado en el
Laboratorio de Investigaciones Sensoriales (LIS) denominado “Anagraf”³, el cual
permite etiquetar palabra por palabra en los niveles que se requieran. Estas oraciones contienen el 97 % de todas
las combinaciones silábicas posibles -considerando sílabas acentuadas y no
acentuadas- del castellano, por lo cual algunas resultaron un tanto extrañas. Las mismas poseen características diferentes
en cuanto a su sintaxis. Si bien
predominan las oraciones bimembres de sujeto inicial y predicado verbal,
también las hay con predicado no verbal. Existe una interesante variación en
las estructuras: sujetos en distintas posiciones, construcciones unimembres,
oraciones pasivas y con proposiciones incluidas. Para etiquetarlas se emplearon
códigos de clases de palabras y de cuatro niveles sintácticosﮫ.
Finalmente, como
punto de partida del presente trabajo se lograron establecer correlaciones
entre las junturas tonales de las oraciones y su sintaxis posicional y
funcional.
2.4. HIPÓTESIS
De acuerdo con lo recientemente expuesto, consideramos que existe correlación entre lo que el hablante quiere lograr cuando emite un mensaje (distinguir información nueva de la conocida/vieja), la entonación y la sintaxis de las emisiones que utiliza.
2.5.
EXPERIENCIA
Como ya fue
expresado con anterioridad, las investigaciones se llevaron a cabo por etapas,
es decir, que se contaba con el etiquetado tonal y el sintáctico; por lo tanto
en esta instancia del proyecto se hacía necesario determinar los criterios
sintácticos con que se ordenaría el material.
Para ello se consideró el artículo de Ana M. Barrenechea (1980) “Las
clases de palabras en español como clases funcionales”.
Se decidió entonces,
agrupar las oraciones según fueran, en primer lugar, bimembres o unimembres;
luego se tomaron las bimembres y se tuvo en cuenta si el sujeto estaba
mencionado o no; después se consideraron únicamente las oraciones de sujeto
expreso y se las agrupó según la posición que éste ocupara: 1 para posición
inicial, 2 para posición media y 3 para sujeto final.
Además se
distinguieron las oraciones cuyo predicado era verbal de aquellas que poseían
predicados no verbales (nominales o adverbiales).
Finalmente el nuevo corpus quedó
compuesto por el total de las oraciones declarativas de sujeto inicial (pos. 1)
con predicado verbal leídas por la locutora y 133 con las mismas
características grabadas por el locutor.
Se incluyeron también aquellas que poseían en su interior una
proposición subordinada.
Una vez delimitado y
constituido el corpus, se procedió a tomar nota de manera exhaustiva sobre el
lugar exacto donde se producían las pausas niveles 3 y 4 en cada oración. De
este trabajo se extrajeron los siguientes datos: a) de las 381 oraciones leídas
por el hablante femenino, 356 de ellas (el 93,44 %) presentaban pausas de los
niveles mencionados en el momento en que se inicia el predicado; las restantes
25 (6,56% del total) sólo registraban pausas de 0 a 2 en los límites entre
sujeto y predicado; b) con respecto a las 133 oraciones leídas por el hablante
masculino, en 99 de las mismas (el 74,44 %) se producían pausas niveles 3 o 4
en los límites entre sujeto y predicado, las otras 34 oraciones (el 25,56 % del
total) sólo tenían pausas de los niveles 0 a 2.
LOCUTORA LOCUTOR
NIVEL DE PAUSA |
CANTIDAD |
PORCENTAJE |
CANTIDAD |
PORCENTAJE |
3 – 4 |
356 |
93,44 |
99 |
74,44 |
0 a 2 |
25 |
6,56 |
34 |
25,56 |
TOTALES |
381 |
100 |
133 |
100 |
Luego se observó qué
ocurría con las oraciones que presentaban las pausas tonales de los niveles 3 y
4 en otro lugar que no fuera el límite entre sujeto y predicado. Los datos obtenidos fueron concluyentes: el
62,72 % de las 25 oraciones restantes emitidas por el hablante femenino y el
61,76 % de las grabadas por el hablante masculino marcaban la juntura
inmediatamente después del verbo.
LOCUTOR LOCUTORA
|
cantidad |
porcentaje |
cantidad |
Porcentaje |
Después del verbo |
21 |
61,76 |
15 |
62,72 |
Después del 1er. Complemento |
5 |
14,70 |
7 |
23,65 |
Otros lugares |
2 |
5,88 |
3 |
13,63 |
Sin pausa |
6 |
17,66 |
--- |
------ |
Totales 34 100 25 100
¿Por qué podemos
decir que los datos son sumamente relevantes? Porque el verbo representa una
transición entre la información nueva y la conocida/vieja, ya que en sí mismo
contiene una para de ambas, pues su
desinencia nos remite, por un lado al sujeto, es decir a la información
ya mencionada y por otro nos da datos nuevos, como el tiempo y el modo, a la
vez que su raíz brinda al oyente información antes desconocida, por lo
cual se asocia con el predicado (J.
Firbas, 1965 y 1970).
Por lo tanto, se
puede afirmar que las pausas, en un alto
porcentaje ocurren en el límite entre la información nueva y la conocida, pero
cuando no es así entonces se producen en la transición.
3. CONCLUSIONES
Según los datos
obtenidos, se concluye que existe una fuerte correlación entre los aspectos
pragmático, sintáctico y prosódico del lenguaje; que el hablante al emitir su
mensaje distingue información que el receptor debe decodificar y para lograr su
objetivo se vale no sólo de la sintaxis sino de la entonación que la acompaña.
Además se
extrae que un porcentaje muy importante
de las oraciones presenta pausa en al inicio del predicado y cuando esto no
sucede la juntura se traslada a la transición, es decir inmediatamente después
del verbo.
Si bien se han
estudiado hasta ahora sólo oraciones declarativas de sujeto en posición 1, son
significativos los resultados obtenidos, por lo cual se continuarán las
investigaciones considerando las variaciones de las posiciones del sujeto y las
oraciones cuyo sujeto permanece tácito.
4. APLICACIONES
Si se tienen en cuenta
estas investigaciones y se continúan hallando correlatos entre la prosodia y la
sintaxis del español, la gramática del uso, que es la que aquí se está tomando
como fundamento teórico, resultaría de gran ayuda al enseñar la lengua
castellana. Pues partimos del uso que el hablante le da a su lengua para luego
volcarlo en datos sistematizados que lo reflejan y su posterior análisis, lo
que nos permite decir, por ejemplo: si la información que vas a dar es nueva,
no mencionada antes y querés continuar tu discurso hablando acerca de ella, es
conveniente que esté dentro del predicado y hacia la derecha, en lo posible
justo después del verbo; pero si la querés enfatizar tendrás que usar alguno/s
de los mecanismos de realceﻜ y al leerla o decirla, utilizar un tono más
alto de voz, cambiando la entonación.
6. BIBLIOGRAFÍA
Barrenechea,
Ana M. (1980) “Las clases de palabras en español, como clases funcionales” en Estudios
de gramática estructural, Paidós, Bs. As.-Argentina.
Borzi,
Claudia (2002) “Iconicidad y sintaxis: estrategias de realce nominal en corpus
escrito” en Víctor Sánchez Corrales (ed) Actas XIII del Congreso
Internacional del ALFIL, Universidad de Costa Rica, Costa Rica.
Firbas,
J. (1965) “A note on transition propoer in functional sentence análisis en Philologica
Pragensia, nº 8:170-176.
Firbas;
J. (1970) “On the interplay of means of functional sentence perspective” en Actes
du Xe Congres International des Linguistes, Bucarest, 28 de agosto al 2 de
septiembre, 1967, 741-744.
Gurlekian, Jorge; H. Torres
y L. Colantoni (2004) Estudios de
Fonética Experimental XIII, Barcelona-España, Universidad de Barcelona ed.
Gurlekian, Jorge A.(1997) “El
laboratorio de Audición y Habla del LIS” en Guirao, Miguelina (ed) Procesos
Sensoriales y Cognitivos, Buenos Aires-Argentina, Ediciones Dunken.
Gurlekian, Jorge A., Hernán Rodríguez, Laura
Colantoni y Humberto Torres (2001) “Development of a Prosodic Database for
an Argentine
Spanish Text to Speech System” en Steven Bird, Meter Buneman y Mark Liberman
(eds.) Proceedings of IRCS Workshop on Linguistic Databases,
Filadelfia-Pensilvania-EE.UU., Innstitute for Research in Cognitive Science.
Trípodi,
Mónica N. (2005) “Etiquetamiento sintáctico para un sistema de conversión de
texto a habla.” En Actas del X Congreso de la SAL, Salta-Argentina.
5. NOTAS
1. Ver en Gurlekian, Jorge; H.
Torres y L. Colantoni (2004) Estudios de
Fonética Experimental XIII, Barcelona-España, Universidad de Barcelona ed.
2. Ver en:
Gurlekian, Jorge A.(1997) “El laboratorio de Audición y Habla del LIS” en
Guirao, Miguelina (ed) Procesos Sensoriales y Cognitivos, Buenos
Aires-Argentina, Ediciones Dunken, pp.55-81;
y en : Gurlekian, Jorge A., Hernán Rodríguez, Laura Colantoni y Humberto
Torres (2001) “Development of a Prosodic Database for an Argentine Spanish Text to Speech System” en
Steven Bird, Meter Buneman y Mark Liberman (eds.) Proceedings of IRCS Workshop
on Linguistic Databases, Filadelfia-Pensilvania-EE.UU., Innstitute for
Research in Cognitive Science, pp. 99-104.
3.
Ver en Trípodi, Mónica N. (2005) “Etiquetamiento sintáctico para un sistema de
conversión de texto a habla.” En Actas del X Congreso de la SAL,
Salta-Argentina.
4. Ver en la página del LIS en internet, www.lis.secyt.gov.ar.
5.
Ver Borzi, Claudia (2002) “Iconicidad y sintaxis: estrategias de realce nominal
en corpus escrito” en Víctor Sánchez Corrales (ed) Actas XIII del Congreso
Internacional del ALFIL, Universidad de Costa Rica, Costa Rica.
[1] “Enfoque Cognitivo-prototípico y Gramática
aplicada a la enseñanza del español”, dirigido por
[2] “Sistemas de texto a habla: desarrollo de
métodos automáticos para la generación de contornos prosódicos” dirigido por el
Ingeniero Jorge Gurlekian (CONICET) con sede en el Laboratorio de
Ivestigaciones Sensoriales de