LA LENGUA EN USO: DISTRIBUCIÓN DE LA INFORMACIÓN, SINTAXIS Y PROSODIA

 

Autora:              Mónica Noemí Trípodi

e-mail:              monica900@ciudad.com.ar

 

En este trabajo se describen los resultados obtenidos en mis investigaciones presentando el enfoque en que las enmarco, los aportes al área temática de los equipos de los que formo parte y las aplicaciones de las investigaciones llevadas a cabo hasta ahora.

Mi trabajo se enmarca en dos proyectos: UBACyT F014 (UBA)[1]  y  PIP 02489 (CONICET)[2]. El UBACyT se especializa en el estudio de problemas lingüísticos con correlato en la enseñanza de la de la comprensión y producción de discursos orales y escritos. El PIP profundiza el estudio fonético y prosódico del lenguaje en relación con la sintaxis con el fin de aplicar los resultados a la síntesis del habla.

Para demostrar que existe correlación entre lo que el hablante quiere lograr, la entonación y la sintaxis analicé la prosodia, en conjunción con la sintaxis posicional y funcional de 321 oraciones declarativas en español de Buenos Aires, leídas por una locutora y otras 133 con iguales características leídas por un locutor.

 

Palabras claves: estudio fonético, prosodia, sintaxis, síntesis del habla, entonación, español de Buenos Aires, oraciones declarativas, comprensión y producción de discursos orales y escritos.

 

1. INTRODUCCIÓN

1.1              Resumen

A lo largo de este trabajo se describirán los resultados obtenidos en mis investigaciones acerca de la relación entre los aspectos prosódico, pragmático y sintáctico del lenguaje, se presentarán el enfoque en que los enmarco, los aportes del área temática llevados a cabo por los equipos de los que formo parte y, por último, las aplicaciones de las investigaciones que se realizaron hasta ahora.

Mi actual trabajo se enmarca en investigaciones previas que fueron desarrolladas en el marco de dos proyectos: UBACyT F014 (UBA) y PIP 02489 (CONICET).  El primero, el UBACyT, se especializa en el estudio de problemas lingüísticos con correlato en la enseñanza de la comprensión y producción de discursos orales y escritos, desde un enfoque integrador de los diversos aspectos del lenguaje: el enfoque Cognitivo-prototípico.

El segundo, el PIP, profundiza el estudio fonético y fonológico de la lengua en relación a las clases de palabras y a la sintaxis, con el fin de aplicar los resultados a la síntesis del habla y producir un conversor de alta calidad; para lo cual desarrolla e integra los aspectos lingüísticos con los últimos avances tecnológicos en análisis del sonido.

 

1.2. Laboratorio de Investigaciones Sensoriales (LIS)

El Laboratorio se conformó hace treinta y tres años, en 1972, y se encuentra dirigido desde ese momento por la Dra. Miguelina Guirao.  Como su nombre lo indica, el LIS dependiente del Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET) se dedica a investigar los sentidos y las percepciones que a través de ellos tienen las personas. El área de Audición y Habla, en la que me desempeño, se encuentra dirigida por el Ingeniero Jorge Gurlekian.

Durante toda la trayectoria del LIS se han llevado a cabo numerosas investigaciones.  Las últimas en lo que concierne al área de Audición y Habla, se encuentran relacionadas con el reconocimiento de patrones acústicos y fonéticos en la secuencia de habla, cuyas aplicaciones son múltiples.  Por ejemplo, en Educación, permitiría avanzar sobre la rehabilitación de discapacitados auditivos y comprender los procesos de aprendizaje del habla; en Otorrinolaringología, se estudiarían patologías del habla con pruebas computarizadas y logoaudiometrías; en Inteligencia Artificial, se lograría el reconocimiento de patrones y el procesamiento de lenguaje natural; en Bioingeniería; posibilita el desarrollo de sistemas de comandos de dispositivos para la voz y finalmente en Telecomunicaciones se aplicaría al desarrollo de modelos del sistema fonatorio.

Los últimos trabajos¹ se enmarcan en los proyectos PICT (2000) y PIP (2004-6) cuyo tema para ambos es: “Sistemas de texto a habla: desarrollo de métodos automáticos para la generación de contornos prosódicos”.

En los dos proyectos se pusieron en marcha investigaciones relacionadas con la entonación, el ritmo, el acento y la pronunciación de la voz humana para lograr su misma naturalidad, en la voz que generan los sistemas de información oral automáticos a partir de texto escrito.  Para lograrlo se propuso 1) marcar y medir dichas características en un gran número de oraciones, 2) asociar estas características a la estructura y componentes de la oración y finalmente, 3) generar los contornos más probables para las nuevas oraciones que deban generarse.

En este momento estamos llevando a cabo la etapa 2) del proyecto PIP 02489; aunque cabe aclarar que también existen otros proyectos, algunos de ellos  subsidiados y otros no:

a) Proyectos  subsidiados  por la Agencia Nacional de Promoción Científica y tecnológica (ANPCyT): Proyecto PME Nro:151  de  Modernización del Equipamiento Científico y Tecnológico ANPCyT   ANÁLISIS DE SEÑALES Y MODELIZACIÓN DE SISTEMAS BIOMÉDICOS; Proyecto de áreas de Vacancia  PAV Nro 127, ANPCyT TECNOLOGÍA DE LA INFORMACIÓN Y LAS COMUNICACIONES. Minería de datos y bio-informática. Modelos Generativos y discriminativos: Desarrollo y Aplicaciones. (Sistemas de Diálogo Automático).

b) Proyecto no subsidiado: Proyecto BASE DE DATOS DE PACIENTES HIPOACÚSICOS. (Iniciado año 2002).

 

Actualmente el equipo ha quedado conformado de la siguiente manera: el director, el Ingeniero Jorge Gurlekian; el tesista de doctorado Bioingeniero Humberto Torres, becario del CONICET; el recientemente incorporado tesista de doctorado Bioingeniero Diego Evin, becario PAV; las candidatas a tesistas de doctorado Licenciada en Fonoaudiología, Natalia Elisei y la Profesora Licenciada en Letras, Mónica N. Trípodi. Todos sus integrantes conforman un equipo interdisciplinario que aportan desde sus disciplinas los conocimientos necesarios para llevar adelante los Proyectos.

El bioingeniero Humberto Torres estudia en su tesis “Generación de prosodia para un conversor de texto a voz”, las pausas, la duración, las unidades de síntesis y la validación de la frecuencia fundamental.  El bioingeniero Diego Evin trabaja en “reconocimiento” de la voz para generar texto, es decir el proceso inverso de la síntesis.  La Licenciada Natalia Elisei se dedica a la “Evaluación objetiva de la voz para el diseño de una prueba de detección y caracterización del grado de desórdenes vocales”, título de su tesis, es decir que intenta encontrar un medio a través de un método científico que mida objetivamente los síntomas para la resolución de distintos problemas de la voz.

Por último, yo, licenciada Mónica Trípodi que trabajo para encontrar correlatos entre los diferentes elementos que conforman la prosodia de la voz hablada y la sintaxis del discurso.

1.3.Instituto de Lingüística

Los proyectos UBACyT tienen una extensa tradición en la Universidad de Buenos Aires.  Desde el año 1999 realizo investigaciones sobre la lengua española, específicamente acerca del adjetivo: su posición y clasificación; y en la actualidad sobre la relación entre la sintaxis y la prosodia, en el marco de distintos UBACyT bajo la dirección de la Dra. en Lingüística Románica Claudia Borzi.

Durante el primero en el que participé, AF049 (2000-2001) “Enfoque Cognitivo y gramática aplicada a la enseñanza del español: relaciones sintácticas”,  realicé investigaciones que se vieron reflejadas en el trabajo “La posición del adjetivo en español” (1999). Dichas investigaciones continuaron a lo largo de los UBACyT F157 (2002-2003) y F014 (2004-2006), en los que se enmarcaron “La posición del adjetivo en español en contexto literario (2001), “El adjetivo descriptivo: una clasificación posible” (2002), “Cambio de orden ¿cambio de significado?” (2003), “El adjetivo descriptivo: un enfoque cognitivo en relación a la clasificación” (2004) y por último “Etiquetamiento sintáctico para el desarrollo de un sistema TTS” (2005), realizado como miembro de ambos equipos.

Todos estos trabajos se encuentran reunidos bajo un enfoque común, el enfoque cognitivo-prototípico, postura teórica que resulta integradora de los distintos aspectos de la lengua española: pragmática, sintaxis, semántica, morfología y fonética-fonología.

La pragmática estudia para qué se usa la lengua; la semántica, su significado; la sintaxis, el orden, la posición de las palabras en la oración y sus relaciones; la morfología, cómo se componen las palabras; la fonética y la fonología, los componentes mínimos distintivos de significado, la entonación y el ritmo.

Este enfoque está fundamentado en la teoría cognitivista, es decir en la forma en que conocemos los humanos, los procesos que llevamos a cabo para producir el conocimiento, cómo categorizamos la realidad o lo que conocemos de ella.  Se basa en una noción nueva de categoría, pues ésta no representa mentalmente la realidad sino  el conocimiento de la forma en que usamos un objeto, en este caso, el lenguaje.  Por lo tanto el conocimiento tiene una estructura semiótica motivada para el uso del objeto en situaciones reales.

Las categorías pueden no tener límites precisos (categoría no discreta) y quedan definidas por un conjunto de propiedades que no son ni necesarias ni suficientes. Como ejemplo basten las clases de palabras, en la cual una misma palabra puede ser sustantivo o verbo, dependiendo del contexto su clasificación (llama, tomo, suelo, canto).

De esta forma vamos a encontrar mejores ejemplos unos que otros, casos poco claros, una estructura gradual que va desde los ejemplos más representativos hasta los no-miembros de la categoría.

Prototípico porque considera que en la mente de los hablantes nativos de una lengua en un momento dado existe el “mejor ejemplo”, el prototipo de la categoría. Ejemplos: “rosa” de la categoría flor; “perro/gato” de la categoría animal doméstico.

El equipo que integra el UBACyT, con sede en el Instituto de Lingüística dependiente de la Facultad de Filosofía y Letras de la UBA, está conformado por su directora, la Dra. Claudia Borzi; la Dra. María Amalia García Jurado y el Licenciado Carlos Luis, ambos Profesionales Principales del CONICET, la Profesora Licenciada Magíster Laura Miñones y la Licenciada Vanina Barbeito, ambas becarias doctorales del CONICET, la Licenciada Marisa Macchi, adscripta a la cátedra de Gramática de la F.F. y L. de la UBA y la Profesora Licenciada Mónica Trípodi, investigadora en formación.

Este equipo, del cual también formo parte, estudia el español en sus distintos aspectos. La Dra. García Jurado se especializa en fonética, fonología y prosodia; el Lic. Carlos Luis se dedica a la Historia de las ideas gramaticales; la Lic. Macchi, a la voz pasiva; yo, al adjetivo y las relaciones entre prosodia y sintaxis; y el resto del equipo a las relaciones sintácticas: la Lic. Miñones, a los conectores concesivos, la Lic. Barbeito, a la posición; la Lic. Silva a las proposiciones relativas y la Dra. Borzi, a las conexiones adverbiales.

2.         DESARROLLO

2.1.  PROBLEMA

A lo largo de la enseñanza de la lengua durante el período de escolarización se detectan en los textos y discursos producidos por los alumnos errores gramaticales que creemos, ocurren debido a la influencia de la oralidad en la escritura y la falta de adecuación de esos discursos a aspectos pragmáticos propios de la situación comunicativa en la que se enmarcan.  Por dicha razón consideramos pertinente realizar un estudio pormenorizado y profundo sobre la prosodia, en relación con la sintaxis del español de Buenos Aires, con el fin de determinar en el futuro las causas que provocan los errores.

Un enfoque que encara el fenómeno lingüístico desde una perspectiva integradora de los distintos aspectos del lenguaje (pragmático, sintáctico, semántico, morfológico, fonético y prosódico) es el enfoque cognitivo- prototípico; que es el que aquí se adoptará para describir de qué modo los fenómenos prosódicos, en particular las pausas, marcan la diferencia entre información conocida (asociada formalmente al sujeto) e información nueva (asociada al predicado).

Por otra parte este estudio también servirá para el desarrollo de los procesos de síntesis del habla, ya que sus resultados se aplicarán para producir un conversor de alta calidad.

2.2.   CORPUS DE DATOS

El corpus con que se trabajará consiste en 381 oraciones declarativas, aisladas,  de sujeto expreso inicial (posición 1) que fueron leídas y a la vez grabadas por una locutora profesional adulta de origen rioplatense y 133 oraciones con las mismas características, leídas y grabadas por un locutor profesional adulto originario de Buenos Aires; las cuales fueron seleccionadas de un corpus de datos total de 741 oraciones de foco amplio, con distintas características sintácticas (Oraciones unimembres, bimembres, compuestas, complejas y con proposiciones incluidas).

 

2.3.   METODOLOGÍA

En una primera fase, anterior a la actual, estas oraciones fueron analizadas tonalmente y luego, considerando la frecuencia fundamental (F0) de cada una de ellas se establecieron sus pausas de manera perceptual², en una gradación de 0 a 4; siendo los niveles 3 y 4 los que marcan una verdadera pausa. El nivel 4 indica límite de frase, pausa física, silencio; el nivel 3 señala límite de frase por diferencia tonal marcada; el 2 indica el encuentro de una consonante con otra en el límite de palabras; el 1, el de una consonante con una vocal  y el 0, el encuentro de una vocal con otra.

En una segunda instancia también anterior, se procedió a realizar el etiquetado sintáctico de las secuencias en cinco niveles.  Sin embargo en esta fase del proyecto, como en las anteriores, se etiquetó un corpus total  de 741 oraciones declarativas, aisladas y grabadas por dos locutores, uno de sexo femenino y otro de sexo masculino, con un programa computacional  diseñado en el Laboratorio de Investigaciones Sensoriales (LIS) denominado “Anagraf”³, el cual permite etiquetar palabra por palabra en los niveles que se requieran.  Estas oraciones contienen el 97 % de todas las combinaciones silábicas posibles -considerando sílabas acentuadas y no acentuadas- del castellano, por lo cual algunas resultaron un tanto extrañas.  Las mismas poseen características diferentes en cuanto a su sintaxis.  Si bien predominan las oraciones bimembres de sujeto inicial y predicado verbal, también las hay con predicado no verbal. Existe una interesante variación en las estructuras: sujetos en distintas posiciones, construcciones unimembres, oraciones pasivas y con proposiciones incluidas. Para etiquetarlas se emplearon códigos de clases de palabras y de cuatro niveles sintácticosﮫ.

Finalmente, como punto de partida del presente trabajo se lograron establecer correlaciones entre las junturas tonales de las oraciones y su sintaxis posicional y funcional.

2.4.   HIPÓTESIS

De acuerdo con lo recientemente expuesto, consideramos que existe correlación entre lo que el hablante quiere lograr cuando emite un mensaje (distinguir información nueva de la conocida/vieja), la entonación y la sintaxis de las emisiones que utiliza.

2.5.  EXPERIENCIA

Como ya fue expresado con anterioridad, las investigaciones se llevaron a cabo por etapas, es decir, que se contaba con el etiquetado tonal y el sintáctico; por lo tanto en esta instancia del proyecto se hacía necesario determinar los criterios sintácticos con que se ordenaría el material.  Para ello se consideró el artículo de Ana M. Barrenechea (1980) “Las clases de palabras en español como clases funcionales”.

Se decidió entonces, agrupar las oraciones según fueran, en primer lugar, bimembres o unimembres; luego se tomaron las bimembres y se tuvo en cuenta si el sujeto estaba mencionado o no; después se consideraron únicamente las oraciones de sujeto expreso y se las agrupó según la posición que éste ocupara: 1 para posición inicial, 2 para posición media y 3 para sujeto final.

Además se distinguieron las oraciones cuyo predicado era verbal de aquellas que poseían predicados no verbales (nominales o adverbiales).

Finalmente el nuevo corpus quedó compuesto por el total de las oraciones declarativas de sujeto inicial (pos. 1) con predicado verbal leídas por la locutora y 133 con las mismas características grabadas por el locutor.  Se incluyeron también aquellas que poseían en su interior una proposición subordinada.

Una vez delimitado y constituido el corpus, se procedió a tomar nota de manera exhaustiva sobre el lugar exacto donde se producían las pausas niveles 3 y 4 en cada oración. De este trabajo se extrajeron los siguientes datos: a) de las 381 oraciones leídas por el hablante femenino, 356 de ellas (el 93,44 %) presentaban pausas de los niveles mencionados en el momento en que se inicia el predicado; las restantes 25 (6,56% del total) sólo registraban pausas de 0 a 2 en los límites entre sujeto y predicado; b) con respecto a las 133 oraciones leídas por el hablante masculino, en 99 de las mismas (el 74,44 %) se producían pausas niveles 3 o 4 en los límites entre sujeto y predicado, las otras 34 oraciones (el 25,56 % del total) sólo tenían pausas de los niveles 0 a 2.

                                               LOCUTORA                             LOCUTOR

NIVEL DE PAUSA

CANTIDAD

PORCENTAJE

CANTIDAD

PORCENTAJE

       3 – 4

     356

      93,44

    99

      74,44

       0 a 2

      25

       6,56

    34

      25,56

TOTALES

    381

    100

   133

    100

Luego se observó qué ocurría con las oraciones que presentaban las pausas tonales de los niveles 3 y 4 en otro lugar que no fuera el límite entre sujeto y predicado.  Los datos obtenidos fueron concluyentes: el 62,72 % de las 25 oraciones restantes emitidas por el hablante femenino y el 61,76 % de las grabadas por el hablante masculino marcaban la juntura inmediatamente después del verbo.

 

                                                LOCUTOR                  LOCUTORA

 

cantidad

porcentaje

cantidad

Porcentaje

Después del verbo

  21

61,76

  15

62,72

Después del 1er. Complemento

   5

14,70

   7

23,65

Otros lugares

   2

  5,88

   3

13,63

Sin pausa

   6

17,66

   ---

 ------

Totales                                             34              100             25              100

 

¿Por qué podemos decir que los datos son sumamente relevantes? Porque el verbo representa una transición entre la información nueva y la conocida/vieja, ya que en sí mismo contiene una para de ambas, pues su  desinencia nos remite, por un lado al sujeto, es decir a la información ya mencionada y por otro nos da datos nuevos, como el tiempo y el modo, a la vez que su raíz brinda al oyente información antes desconocida, por lo cual  se asocia con el predicado (J. Firbas, 1965 y 1970).

Por lo tanto, se puede afirmar que  las pausas, en un alto porcentaje ocurren en el límite entre la información nueva y la conocida, pero cuando no es así entonces se producen en la transición.

 

 

3.  CONCLUSIONES

 

Según los datos obtenidos, se concluye que existe una fuerte correlación entre los aspectos pragmático, sintáctico y prosódico del lenguaje; que el hablante al emitir su mensaje distingue información que el receptor debe decodificar y para lograr su objetivo se vale no sólo de la sintaxis sino de la entonación que la acompaña.

Además se extrae  que un porcentaje muy importante de las oraciones presenta pausa en al inicio del predicado y cuando esto no sucede la juntura se traslada a la transición, es decir inmediatamente después del verbo.

Si bien se han estudiado hasta ahora sólo oraciones declarativas de sujeto en posición 1, son significativos los resultados obtenidos, por lo cual se continuarán las investigaciones considerando las variaciones de las posiciones del sujeto y las oraciones cuyo sujeto permanece tácito.

 

4.   APLICACIONES

Si se tienen en cuenta estas investigaciones y se continúan hallando correlatos entre la prosodia y la sintaxis del español, la gramática del uso, que es la que aquí se está tomando como fundamento teórico, resultaría de gran ayuda al enseñar la lengua castellana. Pues partimos del uso que el hablante le da a su lengua para luego volcarlo en datos sistematizados que lo reflejan y su posterior análisis, lo que nos permite decir, por ejemplo: si la información que vas a dar es nueva, no mencionada antes y querés continuar tu discurso hablando acerca de ella, es conveniente que esté dentro del predicado y hacia la derecha, en lo posible justo después del verbo; pero si la querés enfatizar tendrás que usar alguno/s de los mecanismos de realceﻜ y al leerla o decirla, utilizar un tono más alto de voz, cambiando la entonación.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6.         BIBLIOGRAFÍA

 

Barrenechea, Ana M. (1980) “Las clases de palabras en español, como clases funcionales” en Estudios de gramática estructural, Paidós, Bs. As.-Argentina.

 

Borzi, Claudia (2002) “Iconicidad y sintaxis: estrategias de realce nominal en corpus escrito” en Víctor Sánchez Corrales (ed) Actas XIII del Congreso Internacional del ALFIL, Universidad de Costa Rica, Costa Rica.

 

Firbas, J. (1965) “A note on transition propoer in functional sentence análisis en Philologica Pragensia, nº 8:170-176.

 

Firbas; J. (1970) “On the interplay of means of functional sentence perspective” en Actes du Xe Congres International des Linguistes, Bucarest, 28 de agosto al 2 de septiembre, 1967, 741-744.

 

Gurlekian, Jorge; H. Torres y L. Colantoni (2004) Estudios de Fonética Experimental XIII, Barcelona-España, Universidad de Barcelona ed.

 

Gurlekian, Jorge A.(1997) “El laboratorio de Audición y Habla del LIS” en Guirao, Miguelina (ed) Procesos Sensoriales y Cognitivos, Buenos Aires-Argentina, Ediciones Dunken.

 

 Gurlekian, Jorge A., Hernán Rodríguez, Laura Colantoni y Humberto Torres (2001) “Development of a Prosodic Database for an  Argentine Spanish Text to Speech System” en Steven Bird, Meter Buneman y Mark Liberman (eds.) Proceedings of IRCS Workshop on Linguistic Databases, Filadelfia-Pensilvania-EE.UU., Innstitute for Research in Cognitive Science.

 

Trípodi, Mónica N. (2005) “Etiquetamiento sintáctico para un sistema de conversión de texto a habla.” En Actas del X Congreso de la SAL, Salta-Argentina.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5.    NOTAS

1. Ver en Gurlekian, Jorge; H. Torres y L. Colantoni (2004) Estudios de Fonética Experimental XIII, Barcelona-España, Universidad de Barcelona ed.

 

2. Ver en: Gurlekian, Jorge A.(1997) “El laboratorio de Audición y Habla del LIS” en Guirao, Miguelina (ed) Procesos Sensoriales y Cognitivos, Buenos Aires-Argentina, Ediciones Dunken, pp.55-81;  y en : Gurlekian, Jorge A., Hernán Rodríguez, Laura Colantoni y Humberto Torres (2001) “Development of a Prosodic Database for an  Argentine Spanish Text to Speech System” en Steven Bird, Meter Buneman y Mark Liberman (eds.) Proceedings of IRCS Workshop on Linguistic Databases, Filadelfia-Pensilvania-EE.UU., Innstitute for Research in Cognitive Science, pp. 99-104.

 

3. Ver en Trípodi, Mónica N. (2005) “Etiquetamiento sintáctico para un sistema de conversión de texto a habla.” En Actas del X Congreso de la SAL, Salta-Argentina.

 

4. Ver en la página del LIS en internet, www.lis.secyt.gov.ar.

5. Ver Borzi, Claudia (2002) “Iconicidad y sintaxis: estrategias de realce nominal en corpus escrito” en Víctor Sánchez Corrales (ed) Actas XIII del Congreso Internacional del ALFIL, Universidad de Costa Rica, Costa Rica.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



[1] “Enfoque Cognitivo-prototípico y Gramática aplicada a la enseñanza del español”, dirigido por la Dra. Claudia Borzi (CONICET-UBA) con sede en el Instituto de Lingüística de la Facultad de Filosofía y Letras de la Universidad de Buenos Aires.

[2] “Sistemas de texto a habla: desarrollo de métodos automáticos para la generación de contornos prosódicos” dirigido por el Ingeniero Jorge Gurlekian (CONICET) con sede en el Laboratorio de Ivestigaciones Sensoriales de la Facultad de Medicina de la Universidad de Buenos Aires.