Tesis doctoral: NOMINALIZACIONES DEVERBALES: DENOTACIÓN Y ESTRUCTURA ARGUMENTAL

3 May

Universitat Barcelona

Autora: Peris Morant, Aina
Directores: Taulé Delor, Mariona / Rodriguez Montoria, Horacio
Departamento/Instituto:  Universitat de Barcelona. Departament de Lingüística General
Fecha de defensa: 11-05-2012

 

Acceso a la tesis completahttp://clic.ub.edu/sites/default/files/pagines/TESIS_0.pdf

 

RESUMEN

Las nominalizaciones deverbales del español son construcciones lingüísticas que se caracterizan por presentar propiedades propias de los sustantivos pero al mismo tiempo poder heredar la estructura argumental de los verbos de los que derivan. Esta dualidad les confiere un notable interés lingüístico porque, por una parte, pueden denotar tanto un estado o el resultado de la denotada por el verbo base correspondiente, como pueden también denotar la misma acción o evento que expresa el verbo base, y por tanto, ser paráfrasis de cláusulas oracionales. Por otra parte, son sustantivos que tienen capacidad argumental, es decir, seleccionan argumentos y, en este sentido, es relevante observar los patrones de realización sintáctico-semántica de los argumentos de las nominalizaciones, ya que suponen una manera alternativa de expresar el significado contenido en una oración.

Además del intrínseco valor lingüístico que tiene el estudio de estas construcciones, también desde un punto de vista del Procesamiento del Lenguaje Natural resulta interesante disponer de herramientas y recursos que traten y representen las nominalizaciones deverbales del español, tanto en lo que se refiere a la denotación como a la estructura argumental. Tareas como la resolución de la correferencia o la detección de paráfrasis pueden beneficiarse de una herramienta o un recurso que trate el tipo denotativo de las nominalizaciones, y aplicaciones de extracción de información o de búsqueda de respuestas, así como los sistemas de etiquetado semántico, pueden aprovechar herramientas y recursos que representen la estructura argumental de las nominalizaciones deverbales.

Esta tesis pretende conjugar el estudio de las nominalizaciones deverbales tanto desde un punto de vista lingüístico como desde la perspectiva del Procesamiento del Lenguaje Natural. La tesis está dividida en cuatro partes que responden a esa voluntad.

La primera parte de este trabajo nos pone en antecedentes acerca de las nominalizaciones deverbales. Se define el objeto de estudio, se presenta la metodología utilizada y se ofrece una revisión bibliográfica amplia que incluye tanto trabajos fundamentalmente teóricos como trabajos esencialmente computacionales sobre las nominalizaciones deverbales.

La segunda parte se centra en la estructura argumental de las nominalizaciones deverbales. En primer lugar, se presenta el estudio lingüístico basado en corpus sobre la realización sintáctico-semántica de los argumentos. A partir de este estudio, se extraen una serie de hipótesis lingüísticas sobre qué constituyentes son argumentos de las nominalizaciones y cuáles no, y qué tipo de argumento verbal se asocia a constituyentes específicos en el dominio nominal. En segundo lugar, estas hipótesis lingüísticas están en la base del paquete de reglas heurísticas (RHN) creado para anotar automáticamente la estructura argumental de las nominalizaciones deverbales en el corpus AnCora-Es. La evaluación de estas reglas heurísticas aporta nuevas observaciones sobre la realización de la estructura argumental de las nominalizaciones deverbales y confirma parte de las hipótesis iniciales.

La tercera parte trata sobre la denotación de las nominalizaciones deverbales. Primero, se presenta el estudio empírico basado en corpus realizado sobre la distinción entre evento y resultado. De este estudio empírico se obtienen una serie de criterios lingüísticos para establecer dicha distinción, y además, se establece una nueva clase denotativa subespecificada para aquellos casos en los que el contexto oracional es insuficiente. Los criterios lingüísticos resultan de la determinación de qué criterios propuestos en la bibliografía son relevantes para el español, del análisis lingüístico realizado, y de la observación de las reglas simbólicas generadas en los experimentos computacionales para evaluar los criterios anteriores. Estos experimentos están en la base del clasificador ADN, un sistema automático cuyo objetivo es clasificar las nominalizaciones deverbales según su denotación. Este clasificador se desarrolló como herramienta necesaria para la anotación de la denotación de las nominalizaciones deverbales del corpus AnCora-Es y, finalmente, se ha convertido en el primer clasificador de denotaciones del español capaz de trabajar en diferentes escenarios.

En la cuarta parte se describen los dos recursos generados en esta tesis: el enriquecimiento del corpus AnCora-Es con la anotación de la denotación y la estructura argumental de las nominalizaciones deverbales, y la inducción del léxico AnCora-Nom a partir de esta anotación. En relación a AnCora-Es, se detallan los procesos de validación manual de la estructura argumental y la denotación, concretamente, los criterios específicos de validación y las pruebas de acuerdo entre anotadores. Respecto a AnCora-Nom, se especifica la generación automática del léxico a partir del corpus validado, evidenciando la posibilidad de obtener dos recursos con un único proceso de validación manual, el del corpus.

Finalmente, en las conclusiones se recogen las aportaciones de esta tesis a la comunidad científica. Estas aportaciones consisten básicamente en herramientas y recursos computacionales para el tratamiento y representación de las nominalizaciones deverbales del español, y en el análisis lingüístico que caracterizan las nominalizaciones deverbales tanto con respecto a la denotación como a la estructura argumental, conjugando las dos perspectivas de estudio de este trabajo.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: