Exponentia Team proyecto promovido por el desarrollo tecnológico, la innovación e investigación
Exponentia||Innovación|1 minutos de lectura

Exponentia team S.L. "IA DATASETS CREATOR” Este proyecto ha sido cofinanciado por el Fondo Europeo de Desarrollo Regional (FEDER) y CDTI con el objetivo de promover el desarrollo tecnológico, la innovación y una investigación de calidad.


El objetivo general del presente proyecto consiste en el desarrollo de una plataforma de generación de documentos no estructurados desde fuentes estructuradas, que puedan ser utilizados para el entrenamiento de algoritmos basados en IA que permitan la automatización
en la gestión de documentos.
Resultados del proyecto
En el marco del proyecto financiado por el Fondo Europeo de Desarrollo Regional (FEDER), Exponentia ha desarrollado una herramienta innovadora para el etiquetado inteligente de datos y la generación de datasets documentales mediante técnicas de inteligencia artificial.
El objetivo del proyecto ha sido facilitar el entrenamiento de modelos de IA, especialmente en entornos donde la escasez o sesgo de datos reales puede comprometer la precisión de los resultados. Para ello, se ha creado un sistema que permite la generación de datasets sintéticos, contribuyendo a evitar problemas de sobreajuste o ajuste insuficiente, y mejorando la calidad de los modelos desarrollados.
Funcionalidades clave implementadas
- Gestión y etiquetado de plantillas documentales, permitiendo un tratamiento estructurado de datos semánticos y visuales.
- Comparación visual entre documentos reales y generados, facilitando la validación y control de calidad del contenido sintético.
- Generación automatizada de datasets documentales, con posibilidad de exportación en formato comprimido (ZIP), para facilitar su uso en proyectos de entrenamiento y validación de modelos de IA.
Durante el desarrollo del proyecto se ha llevado a cabo un análisis exhaustivo de diferentes tecnologías de inteligencia artificial, incluyendo modelos de lenguaje de última generación (LLMs) y modelos de difusión para generación de texto e imágenes.
Como resultado de esta evaluación, se seleccionó la API de OpenAI, que ha permitido una integración ágil, flexible en costes y con alta capacidad de escalabilidad, cumpliendo así con los requisitos técnicos y estratégicos del proyecto.
Este desarrollo representa un paso importante en nuestra estrategia de innovación, al dotar al ecosistema de herramientas que combinan IA generativa y eficiencia operativa para resolver uno de los principales desafíos en el entrenamiento de modelos: la calidad y disponibilidad de los datos.
Lugar de ejecución del proyecto: Calle Pedro Duque Nº 7, Ed. 9B Acceso Oeste, 46022 Valencia
Plazo de ejecución del proyecto: 01/09/2022 - 31/08/2024
Presupuesto del proyecto: 288.881,00 €