MORFOGEN

31 Jul

MORFOGEN IMAGEN

MORFOGEN

La aplicación MORFOGEN (http://bdme.usc.es/) consta de dos partes: 1) Una base de datos donde se almacenan propiedades morfológicas del léxico de diferentes lenguas, preferentemente español y latín, pero también otras lenguas fuentes de préstamos. 2) Una herramienta de visualización que permite representar, bien en forma de grafos (próximos a diagramas arbóreos), bien en forma lineal, las familias y subfamilias léxicas del español.

Objetivos del proyecto

1. Proporcionar al NDHE (Nuevo diccionario histórico del español) de la RAE apoyo o cobertura en cuanto a su configuración morfológica y genética.
2. Suministrar a los especialistas en morfología y léxico herramientas que les permitan ejecutar búsquedas refinadas para sus investigaciones.

La hipótesis de partida es que la clasificación y definición de las palabras derivadas no puede ofrecerse de manera aislada, como si fuesen entidades autónomas, según se ofrecen generalmente en las obras lexicográficas tradicionales. Bajo el supuesto de que las relaciones existentes entre las palabras resultan imprescindibles para comprender su evolución, se confecciona una base de datos que ofrece información detallada no sólo sobre el étimo concreto de cada una de ellas, sino también sobre las relaciones léxicas existentes entre las palabras de una misma familia.

Los objetivos específicos son estos:

  1. Unir todas las voces de la misma familia
  2. Describir qué procesos de formación de palabras han intervenido en su constitución
  3. Identificar, en la medida de lo posible, las raíces, los afijos y las bases de los procesos de formación de palabras
  4. Establecer relaciones entre los sufijos que actúan en un mismo paradigma derivativo
  5. Suministrar datos esenciales sobre el significado que aportan los afijos, etc., de tal modo que cualquier usuario pueda acceder a una información básica sobre la constitución de esta familia.

La base de datos

La Base de datos de morfología del español (BDME) está concebida como un archivo morfológico de carácter diacrónico, que permitirá obtener información precisa sobre como se organizan las palabras en el interior de familias léxicas. En este banco de datos se almacenan propiedades morfológicas del léxico de varias lenguas emparentadas, en especial del español y del latín. A partir de la palabra-raíz de cada familia léxica que, en muchos casos, tendrá origen latino, se agrupan todas las voces que la integran y se efectúa un análisis morfológico minucioso de cada uno de los vocablos incorporados a la base.

El trabajo del equipo consiste en introducir el léxico documentado en diferentes épocas del español, en analizar cada palabra morfológicamente (categoría léxica o clase de palabras, base, proceso morfológico, etc.) y en establecer su relación genética (origen latino, griego, préstamo de otras lenguas), con objeto de obtener una representación de las familias y subfamilias léxicas en diferentes épocas del español.

El número de términos almacenados (enero 2013) en la BDME es el siguiente: 43.000 del español, 30.000 del latín, 926 del francés, 561 del griego, 229 del italiano, 96 del inglés, 71 del catalán, 16 del occitano, 5 del portugués y 200 de otras lenguas. Se pretende completar el lemario español para que armonice en lo posible con el del CDH (en 2012 la BDME registra un 41% de los lemas del CDH). Se prevé que existan algunas discordancias a causa de las distinciones morfológicas llevadas a cabo en la BDME.

Los términos están relacionados por dos tipos de parentesco (simultánea o alternativamente, según la historia de cada palabra):
1. Origen, que establece los vínculos etimológicos.
2. Base, que establece los vínculos morfológicos dentro de una misma lengua.

Se ha diseñado un formulario estándar de introducción de datos, que en el periodo 2009-2011 ha sido sometido a diversos reajustes motivados por la incorporación de un mayor número de propiedades.

Para cada término, se recogen informaciones como las siguientes:
LENGUA: el idioma al que pertenece el término analizado. El desplegable de lenguas es accesible alfabéticamente, salvo las lenguas más frecuentes que aparecen en primer lugar (español, latín, catalán, francés, gallego, griego, inglés, italiano, occitano, portugués).
TÉRMINO: la forma de cita de la palabra analizada.
ENTRADA: ofrece las variaciones flexivas.
SINONIMIA AFIJAL: términos con afijos distintos e idéntico valor morfológico.
VARIANTES: variaciones gráficas.
HIPOTÉTICA: indica si el vocablo no está documentado.
SIGNIFICADO: subdividido en SIMPLE, glosa breve para las palabras raíces y MORFOLÓGICO, significado tipo para las palabras derivadas.
MARCAS DE FORMA: Culta / Popular
MARCAS DE USO (Geográfica, Histórica, Social, Registro, Ámbito, Histórica NDHE), específicas en función de la lengua analizada. Las marcas están jerarquizadas y son seleccionadas mediante desplegables).
CLASE de palabras del término analizado.
ORIGEN: antecedente inmediato de la palabra analizada. Mediante un Buscador, se localiza la palabra asociada a la lengua originaria, lo que impone un orden rígido a la introducción de datos.
BASE: para palabras derivadas y compuestas, bases morfológicas del término analizado. Las bases provienen del listado de términos de una lengua y se localizan mediante un buscador, lo que impone secuencialidad al análisis.
PROCESO de formación: con selección del procedimiento de formación. Está admitida la combinación de procesos.
TIPO DE AFIJO: Al marcar prefijación se accede a un desplegable con la lista de prefijos para seleccionar el adecuado. Al marcar sufijación, se accede a uno (o varios) desplegable(s) con una lista de sufijos.
HISTORIAL: campo de observaciones.
EJEMPLOS
DATACIÓN: primera documentación e última documentación

Miembros

Miembros del equipo de investigación

Personal contratado

Supervisor de la aplicación web (periodo 2009-2011)

Colaboradores

  • José Manuel Piñeiro Mourín
  • Alicia Santamaría Nieto (Becaria de colaboración curso 2009-10)

3 comentarios to “MORFOGEN”

  1. José Calvo 3 de septiembre de 2013 a 10:27 #

    Un post muy interesante sobre una herramienta muy interesante. Tengo una duda, ¿se pueden hacer consultas a la base de datos? ¿Es necesario solicitar una cuenta de usuario?

    Enhorabuena por el blog, creo que sois una herramienta necesaria sobre divulgación sobre morfología.
    Saludos!

    • morforetem 3 de septiembre de 2013 a 23:07 #

      Estimado José:

      Muchas gracias por tu valoración positiva sobre nuestro blog MORFORETEM.
      En cuanto a la duda que planteas sobre MORFOGEN, ya la he trasladado a uno de los responsables de esa herramienta. Esperemos respuesta…
      Un saludo.

      • José Calvo 4 de septiembre de 2013 a 8:40 #

        Estupendo, muchas gracias.
        Saludos!

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: