Los corpus lingüísticos en lenguas de morfología compleja. El caso del vasco

9 Jul

El post de hoy está dedicado a otro de los proyectos que se presentaron en el IX Encuentro de Morfólogos celebrado en la Universidad de Cádiz en mayo de este año. Se trata en esta ocasión de un proyecto que se está desarrollando en el Instituto de Euskara de la UPV/EHU, bajo la dirección de nuestro colega el profesor Pello Salaburu, a quien agradecemos el envío de la información que podéis ver a continuación.

Los corpus lingüísticos en lenguas de morfología compleja. El caso del vasco

En realidad, el proyecto que el Instituto de Euskera de la Universidad del País Vasco está desarrollando desde hace algunos años es más amplio que el que da a entender este título, adoptado para el Encuentro de Morfólogos. Se trata de una gramática sobre la lengua vasca llamada SEG (Sareko Euskal Gramatika, Gramática Vasca en Red), que tiene tres características fundamentales con respecto a las gramáticas, digámoslo así, tradicionales. Por un lado, abarca muchas más materias; por otro, se trata de una gramática en red, por lo que la propia forma y presentación son muy distintas a las habituales de papel. Por último, se trata de una gramática que está en proceso de elaboración, por lo que hay algunos apartados tratados en mucho más detalle que otros, en los que simplemente se ha diseñado un esquema básico o se han dicho cosas muy generales.

La gramática se puede consultar en la página del instituto (www.ei.ehu.es) y, más en concreto, en la página de la propia gramática: http://www.ehu.es/seg.

Las partes de la “gramática” son las siguientes:

– Léxico

– Morfosintaxis

– Lengua y persona

– Lengua y sociedad

– Lingüística aplicada

– Fonética y fonología

– Historia de la lengua

– Rincón de dudas

– Observatorio de calcos

En cada una de esas partes hay distintas aplicaciones y recursos que todos los interesados pueden utilizar de forma libre. Por ejemplo, en “Léxico” hay varios diccionarios y corpus lingüísticos, alguno de ellos muy extenso (todos son del siglo XXI). “Morfosintaxis” tiene dos apartados grandes (morfología y sintaxis) y se parece mucho más a lo esperable en una gramática. En “Lengua y persona” se tratan aspectos de adquisición de lenguaje, por un lado, y de procesamiento del lenguaje, por otro. En “Lengua y sociedad” hay cuestiones de sociolingüística e información sobre los dialectos de la lengua, con decenas y decenas de enlaces que recogen, mediante grabaciones de vídeo o audio, testimonios de hablantes de distintos territorios, etc. El acceso a muchos de estos apartados se puede realizar directamente desde la primera página del instituto, sin pasar por la gramática, porque se considera que tienen suficiente autonomía.

En cuanto a la forma, se trata de textos con enlaces que amplían la información, remitiendo a otras partes de la propia gramática, o que amplían la información básica profundizando mucho más: por ejemplo, si se habla de las oraciones de relativo, la información puede acabar accediendo a una tesis doctoral sobre el tema. Los enlaces abren vías a recursos muy variados (propios o ajenos): si se cita el ejemplo de un autor se puede pinchar en el nombre para acceder a su biografía, o a la obra señalada que, dependiendo de derechos de autor, se puede acabar incluso descargando en el propio ordenador. Esta nueva forma de ordenar la gramática permite presentar los materiales de modo mucho más accesible.

Este proyecto, iniciado de forma muy rudimentaria en 2006, ha tenido varias fases, y ha recibido el apoyo económico, en diferentes años, del Ministerio de Ciencia e Innovación, del Gobierno Vasco, de la Diputación Foral de Gipuzkoa, del Ayuntamiento de San Sebastián, de la Universidad del País Vasco y de entidades privadas como Fundación Aurten Bai, Fundación Lagun Aro o Dorothy Lamelson Trust. Tendrá un costo final aproximado, a fines de 2015, y si los acuerdos económicos suscritos se siguen manteniendo, de unos 400.000 euros.

El equipo de trabajo está señalado en la página siguiente: http://www.ehu.es/seg/doku.php?id=egileak

De ese equipo hay dos personas contratadas a tiempo completo (una informática y una redactora), y un auxiliar administrativo a tiempo parcial. El resto de los investigadores colabora en la investigación en sus horas de universidad.

Se puede consultar el documento adjunto (Instituto de Euskera UPV-EHU) para más información sobre aspectos más detallados del proyecto.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: