Lecciones Aprendidas al Construir RAGs Reales en GenAIIC: Parte 1

Elena Digital López

En un esfuerzo por ayudar a las empresas a integrar la inteligencia artificial generativa de manera más eficaz, el AWS Generative AI Innovation Center (GenAIIC) ha formado un equipo de expertos en ciencia y estrategia. Este equipo se dedica a desarrollar soluciones de Prueba de Concepto utilizando la Generación Aumentada por Recuperación (RAG), un enfoque que combina modelos de lenguaje de gran tamaño con fuentes de datos externas para mejorar la precisión y relevancia de las respuestas.

Desde su creación en mayo de 2023, GenAIIC ha visto una creciente demanda de chatbots que pueden extraer información y generar conocimientos a partir de bases de datos extensas y heterogéneas. El método RAG se divide en tres procesos principales: la recuperación de información relevante, el aumento de esta información junto con preguntas del usuario, y finalmente, la generación de respuestas informadas. Este enfoque promete revolucionar la interacción con datos complejos en diversos sectores.

El centro ha publicado recientemente una serie de artículos para orientar a sus usuarios en la implementación de RAG, comenzando con una explicación básica de su arquitectura y optimización del uso del texto en estos sistemas. Se anticipa un análisis más profundo sobre el trabajo con múltiples formatos de datos, como los tabulares y visuales, que será presentado en futuras publicaciones.

Uno de los aspectos clave abordados por el GenAIIC es la importancia de un sistema de recuperación eficiente. La capacidad de un RAG para entregar respuestas precisas depende en gran medida de la efectividad de su módulo recuperador. Almacenar documentos en almacenes vectoriales, donde los textos se segmentan y convierten en vectores, facilita las búsquedas semánticas. Sin embargo, la búsqueda por palabras clave sigue siendo valiosa, especialmente para el lenguaje técnico y nombres propios.

En un contexto práctico, se han analizado casos de uso en ámbitos como el servicio al cliente, entrenamiento de empleados, mantenimiento industrial, búsqueda de información de productos y resumen de noticias financieras. Estos ejemplos muestran cómo implementar y evaluar soluciones RAG en diferentes industrias y su potencial para transformar procesos empresariales.

Para asegurar y evaluar la calidad de la recuperación y generación de respuestas, GenAIIC propone varias métricas como la precisión, el recuerdo y la evaluación por expertos. Además, sugiere métodos para mejorar la calidad de las respuestas generadas, como la ingeniería de prompt, la generación de citas y la verificación de estas con los documentos originales.

Asimismo, el centro enfatiza que, a pesar del potencial de los modelos de lenguaje, la calidad de las respuestas depende de la información contextual proporcionada durante la recuperación. Evaluar y optimizar la arquitectura de RAG es fundamental para su éxito y adopción a gran escala.

Además, AWS facilita la creación de chatbots RAG mediante servicios como Amazon Bedrock Knowledge Bases vinculadas con Amazon S3, que automatiza el indexado y fragmentación de documentos. Estas herramientas simplifican la integración de estas tecnologías para las empresas que buscan innovar con inteligencia artificial generativa. En un futuro cercano, se espera que estos avances abran las puertas a la gestión y utilización de datos más estructurados y visuales mediante soluciones multimodales.

Scroll al inicio