Documentos - Pruébalo - Comunidad de apoyoy - Informe de error - Solicitud de función
UpTrain es una herramienta segura de datos de código abierto para que los profesionales de ML observen y perfeccionen sus modelos de ML al monitorear su rendimiento, verificar los cambios de distribución (de datos) y recopilar casos extremos para volver a capacitarlos. Se integra a la perfección con sus canales de producción existentes y solo toma unos minutos para comenzar ⚡.
- Comprobaciones de deriva de datos - Identifique los cambios de distribución en las entradas de su modelo.
- Supervisión del rendimiento - Realice un seguimiento del rendimiento de sus modelos en tiempo real y reciba alertas de degradación.
- Soporte de incrustaciones - Tableros especializados para comprender las incrustaciones deducidas del modelo.
- Señales de caso de borde - Señales definidas por el usuario y técnicas estadísticas para detectar puntos de datos fuera de distribución.
- Comprobaciones de integridad de datos - Comprobaciones de datos faltantes o incoherentes, registros duplicados, calidad de los datos, etc.
- Métricas personalizables - Defina métricas personalizadas que tengan sentido para su caso de uso.
- Reciclaje automatizado - Automatice el reentrenamiento de modelos adjuntando sus canalizaciones de entrenamiento e inferencia.
- Sesgo del modelo - Realice un seguimiento del sesgo en las predicciones de su modelo ML.
- Explicabilidad de la AI - Comprender la importancia relativa de múltiples características en las predicciones.
- Seguridad de datos - Sus datos nunca salen de su máquina.
- Integración de Slack - Recibe alertas en Slack.
- Tableros en tiempo real - Para visualizar la salud de tu modelo en vivo.
- Cambio de etiqueta - Identificar desviaciones en sus predicciones. Especialmente útil en los casos en que la realidad del terreno no está disponible.
- Intervalo de confianza del modelo - Intervalos de confianza para las predicciones del modelo
- Técnicas avanzadas de detección de deriva - Métodos de detección de deriva basados en valores atípicos
- Rebanado de características avanzadas - Capacidad para dividir propiedades estadísticas
- Prueba de Kolmogorov-Smirnov - Para la detección de turnos de distribución
- Estabilidad de predicción - Filtrar los casos en los que la predicción del modelo no es estable.
- Cheques contradictorios - Combatir los ataques adversarios
Y más.
Puede comenzar rápidamente con Google Colab aquí.
Para ejecutarlo en su máquina, siga los pasos a continuación:
pip install uptrain
git clone [email protected]:uptrain-ai/uptrain.git
cd uptrain/examples
pip install jupyterlab
jupyter lab
Para obtener una descripción general rápida de cómo funciona UpTrain, consulte nuestro tutorial de inicio rápido.
UpTrain en acción🎬
Uno de los casos de uso más comunes de ML en la actualidad son los modelos de lenguaje, ya sea resumen de texto, NER, chatbots, traducción de idiomas, etc. UpTrain proporciona formas de visualizar las diferencias en la capacitación y los datos del mundo real a través de la agrupación UMAP de incrustaciones de texto (inferidos de BERT). Las siguientes son algunas repeticiones del tablero de UpTrain.
Los modelos de aprendizaje automático (ML) se utilizan ampliamente para tomar decisiones comerciales críticas. Aún así, ningún modelo de ML es 100 % preciso y, además, su precisión se deteriora con el tiempo 😣. Por ejemplo, la predicción de ventas se vuelve imprecisa con el tiempo debido a un cambio en los hábitos de compra de los consumidores. Además, debido a la naturaleza de caja negra de los modelos de ML, es un desafío identificar y solucionar sus problemas.
UpTrain resuelve esto. Hacemos que sea fácil para los científicos de datos y los ingenieros de ML comprender dónde fallan sus modelos y ayudarlos a corregirlos antes de que otros se quejen 🗣️.
UpTrain se puede utilizar para una amplia variedad de modelos de aprendizaje automático, como LLM, modelos de recomendación, modelos de predicción, modelos de visión artificial, etc.
Trabajamos constantemente para mejorar UpTrain. ¿Quieres una nueva función o necesitas alguna integración? No dude en crear un problema o contribuir directamente al repositorio.
Este repositorio se publica bajo licencia Apache 2.0. Actualmente estamos enfocados en desarrollar ofertas no empresariales que deberían cubrir la mayoría de los casos de uso al agregar más funciones y ampliar a más modelos. También estamos trabajando para agregar una oferta alojada: Contáctenos si estás interesado.
Estamos continuamente agregando toneladas de funciones y casos de uso. ¡Apóyanos dándole una estrella al proyecto ⭐!
Estamos construyendo UpTrain en público. Ayúdanos a mejorar dando tu opinión aquí.
Damos la bienvenida a las contribuciones a UpTrain. Por favor vea nuestro guía de contribución para detalles.