Objetivos

La hipótesis principal de este proyecto se basa en la existencia de una relación directa entre el uso del lenguaje por parte de un individuo y su comportamiento en los medios digitales. Por lo tanto, modelar el lenguaje utilizado dentro de una contextualización en diferentes niveles nos permite establecer las relaciones entre diferentes entidades, así como establecer la evolución de estas entidades y sus relaciones a lo largo del tiempo. Al mismo tiempo, podemos inferir nuevas relaciones y predecir estados o comportamientos futuros.

Por lo tanto, el objetivo principal de este proyecto es el estudio y desarrollo de diferentes técnicas, recursos y herramientas HLT dirigidas a modelar entidades digitales, sus relaciones en las redes sociales y su evolución en el tiempo. Estas herramientas se integrarán en una plataforma tecnológica que permitirá la detección y extracción de relaciones semánticas entre entidades digitales, obteniendo así información de diferentes tipos de fuentes (datos no estructurados, estructurados y vinculados abiertos), así como determinar la calidad, coherencia y veracidad de estas relaciones. El objetivo final de la plataforma es predecir comportamientos futuros de entidades digitales, así como prevenir situaciones de alto riesgo antes de que ocurran.

Este proyecto involucra una serie de desafíos y objetivos específicos dentro del alcance de la investigación HLT que se describen a continuación:

  • OBJ1. Generación de los modelos de lenguaje humano utilizados por las entidades digitales a través del reconocimiento de sus características primarias (lingüísticas, cognitivas, sociales, culturales y emocionales) e independientes de los dominios y escenarios en los que actúan.
  • OBJ2. Uso del conocimiento generado por entidades digitales y descubrimiento de las relaciones semánticas entre ellas. Se tendrán en cuenta todas las fuentes de información disponibles (datos vinculados estructurados, abiertos y no estructurados), mecanismos de extracción, enriquecimiento de identidad y otros mecanismos de inferencia. Esto permitirá la integración de información relacionada con una identidad, determinando los roles y propiedades asociados a un marco espacio-temporal. También permite la definición de relaciones entre identidades utilizando aspectos dinámicos como el contexto, la naturaleza temporal o la importancia.
  • OBJ3. Uso del conocimiento de las relaciones para determinar la coherencia, calidad y contraste de las relaciones semánticas extraídas. Para esto, utilizaremos técnicas de evaluación de veracidad, análisis de emociones y subjetividad, así como la detección de sesgos en la información para garantizar y contrastar la información que surge de la relación.
  • OBJ4. Predicción del comportamiento futuro de las entidades digitales mediante el descubrimiento de posibles relaciones semánticas futuras entre ellas, a través del análisis de redes preexistentes y basadas en relaciones detectadas previamente.

En resumen, este proyecto contribuye al Plan nacional español para la promoción de tecnologías del lenguaje humano, cuyo objetivo es promover el desarrollo del procesamiento del lenguaje natural desde 2015.