Operar un servidor de seguimiento de MLflow autogestionado implica una considerable carga administrativa, que incluye tanto el mantenimiento como la necesidad de escalar recursos. A medida que los equipos amplían sus experimentos de aprendizaje automático, gestionar eficientemente los recursos en picos de uso y periodos de inactividad se convierte en un reto. Para las organizaciones que ejecutan MLflow en Amazon EC2 o servidores locales, la transición a Amazon SageMaker AI con MLflow sin servidor promete optimizar costos y liberar recursos de ingeniería.
Una reciente guía publicada ofrece un claro camino para migrar un servidor de seguimiento autogestionado de MLflow a una solución sin servidor en SageMaker AI. Esta aplicación ajusta automáticamente los recursos en función de la demanda, eliminando la gestión manual de servidores y almacenamiento sin coste adicional. La guía incluye instrucciones para utilizar la herramienta MLflow Export Import para trasladar experimentos, ejecuciones, modelos y otros recursos, asegurando el éxito de la migración.
Aunque el principal enfoque es la migración de servidores autogestionados a SageMaker, la herramienta MLflow Export Import también facilita el traslado de servidores de seguimiento administrados a la nueva capacidad sin servidor en MLflow. Asimismo, es útil para actualizaciones de versión y rutinas de respaldo ante desastres.
El proceso de migración consta de tres fases: exportación de artefactos MLflow a un almacenamiento intermedio, configuración de una nueva aplicación MLflow, e importación de los artefactos. Este proceso puede ejecutarse desde una instancia de EC2, un ordenador personal o un cuaderno de SageMaker, asegurando conexión con el servidor de origen y el de destino.
Es crucial verificar la compatibilidad de la versión de MLflow antes de iniciar la migración, asegurando versiones soportadas tanto en el servidor original como en el nuevo entorno en SageMaker. La última versión de MLflow disponible en Amazon SageMaker facilitará el proceso.
Una vez creada una nueva aplicación MLflow en SageMaker, el siguiente paso es instalar MLflow y el plugin de SageMaker en el entorno de ejecución. Esto asegura una conexión adecuada con la nueva aplicación. Posteriormente, la instalación de la herramienta MLflow Export Import es esencial para exportar los recursos necesarios e importarlos al nuevo entorno.
Finalmente, es vital confirmar que todos los recursos de MLflow se han transferido correctamente, verificando que los experimentos y ejecuciones estén completos y los artefactos de modelo accesibles. Si se trata de una migración a gran escala, se recomienda realizar el proceso en lotes más pequeños.
Debe considerarse que un servidor de seguimiento administrado por SageMaker generará costos hasta ser eliminado o detenido. Para evitar gastos innecesarios, se sugiere detener o eliminar los servidores cuando no se utilicen.
La migración a una aplicación MLflow sin servidor en Amazon SageMaker AI reduce la carga operativa del mantenimiento de infraestructura MLflow, ofreciendo una integración fluida con los servicios de AI/ML de SageMaker. Los interesados en llevar a cabo su migración pueden seguir la guía paso a paso y consultar la documentación adicional para más detalles.