Vemos a la como un buen punto de inicio predeterminado para cualquier soluci¨®n de aprendizaje autom¨¢tico que se despliegue en producci¨®n. Muchas organizaciones dependen cada vez m¨¢s de soluciones de aprendizaje autom¨¢tico tanto para las ofertas a sus clientes como para operaciones internas, as¨ª que tiene sentido comercial aplicar las lecciones y las buenas practicas capturadas por la entrega continua (CD) a las soluciones de aprendizaje autom¨¢tico.
Hace aproximadamente una d¨¦cada introdujimos la entrega continua, nuestra manera por defecto de entregar soluciones de software. Las soluciones actuales incluyen, cada vez m¨¢s, modelos de aprendizaje autom¨¢tico y no los consideramos una excepci¨®n para la adopci¨®n de pr¨¢cticas de entrega continua. Lo llamamos . A pesar de que los principios de la entrega continua siguen siendo los mismos, las herramientas y pr¨¢cticas para implementar el proceso de principio a fin de entrenamiento, pruebas, despliegue y monitoreo de modelos requiere de algunas modificaciones. Por ejemplo: el control de versiones no solo incluye el c¨®digo si no tambi¨¦n los datos, los modelos y sus par¨¢metros; la pir¨¢mide de pruebas se extiende para incluir an¨¢lisis y validaci¨®n de sesgos, de equidad, de datos y caracter¨ªsticas; el proceso de despliegue debe considerar como promover y evaluar el rendimiento de los nuevos modelos contra los actuales modelos campeones. Mientras la industria est¨¢ celebrando el nuevo t¨¦rmino de moda, MLOps, creemos que CD4ML es la aproximaci¨®n hol¨ªstica para implementar un proceso integral para entregar de forma fiable y mejorar continuamente los modelos de aprendizaje autom¨¢tico, desde la ideaci¨®n hasta producci¨®n.
Aplicar aprendizaje autom¨¢tico para hacer inteligentes a las aplicaciones y servicios de negocio no es solo entrenar modelos y servirlos. Requiere implementar, de principio a fin y continuamente, ciclos de entrenamiento, pruebas, despliegues, monitoreo y operaci¨®n de los modelos. La es una t¨¦cnica que habilita la realizaci¨®n de ciclos fiables, de principio a fin, de desarrollo, despliegue y monitoreo de modelos de aprendizaje autom¨¢tico. La tecnolog¨ªa subyacente sobre la que se sustenta CD4ML incluye herramientas para el acceso y el descubrimiento de datos, control de versiones de artefactos (como los datos, el modelo y el c¨®digo), pipelines de entrega continua, aprovisionamiento automatizado de entornos para distintas entregas y experimentos, evaluaci¨®n y seguimiento del rendimiento del modelo y observabilidad operacional del modelo. Las compa?¨ªas pueden elegir su propio conjunto de herramientas dependiendo de su stack tecnol¨®gico actual. CD4ML se focaliza en la automatizaci¨®n y la eliminaci¨®n de traspasos manuales. CD4ML es nuestro enfoque de facto para desarrollar modelos de ML
Con el aumento en popularidad de las aplicaciones basadas en machine learning, y la complejidad t¨¦cnica que significa construirlas, nuestros equipos dependen mucho de la para entregar estas aplicaciones de manera segura, r¨¢pida y sustentable. CD4ML es la disciplina de traer los principios y pr¨¢cticas de entrega continua a las aplicaciones de machine learning. Elimina los largos ciclos entre el entrenamiento de los modelos y su despliegue a producci¨®n. CD4ML tambi¨¦n elimina las transferencias manuales entre distintos equipos, ingenieras/os de datos, cient¨ªficas/os de datos e ingenieras/os de machine learning en el proceso de extremo a extremo de construcci¨®n y despliegue de un modelo servido por una aplicaci¨®n ML. Utilizando CD4ML nuestros equipos han logrado implementar de manera exitosa el versionamiento, prueba y despliegue automatizado de todos los componentes de sus aplicaciones basadas en ML: datos, modelos y c¨®digo.
Continuous delivery for machine learning (CD4ML) apply continuous delivery practices to developing machine learning models so that they are always ready for production. This technique addresses two main problems of traditional machine learning model development: long cycle time between training models and deploying them to production, which often includes manually converting the model to production-ready code; and using production models that had been trained with stale data.
A continuous delivery pipeline of a machine learning model has two triggers: (1) changes to the structure of the model and (2) changes to the training and test data sets. For this to work we need to both version the data sets and the model's source code. The pipeline often includes steps such as testing the model against the test data set, applying automatic conversion of the model (if necessary) with tools such as , and deploying the model to production to deliver value.

