Skip to content

Latest commit

 

History

History
177 lines (131 loc) · 11.3 KB

README.es.md

File metadata and controls

177 lines (131 loc) · 11.3 KB

Un marco de código abierto para observar aplicaciones ML, creado para ingenieros

Documentos - Pruébalo - Comunidad de apoyoy - Informe de error - Solicitud de función

Performance

Lea esto en otros idiomas: English language German language Chinese language Hindi language Spanish language French language Japanese language Russian language

UpTrain es una herramienta segura de datos de código abierto para que los profesionales de ML observen y perfeccionen sus modelos de ML al monitorear su rendimiento, verificar los cambios de distribución (de datos) y recopilar casos extremos para volver a capacitarlos. Se integra a la perfección con sus canales de producción existentes y solo toma unos minutos para comenzar ⚡.

  • Comprobaciones de deriva de datos - Identifique los cambios de distribución en las entradas de su modelo.
  • Supervisión del rendimiento - Realice un seguimiento del rendimiento de sus modelos en tiempo real y reciba alertas de degradación.
  • Soporte de incrustaciones - Tableros especializados para comprender las incrustaciones deducidas del modelo.
  • Señales de caso de borde - Señales definidas por el usuario y técnicas estadísticas para detectar puntos de datos fuera de distribución.
  • Comprobaciones de integridad de datos - Comprobaciones de datos faltantes o incoherentes, registros duplicados, calidad de los datos, etc.
  • Métricas personalizables - Defina métricas personalizadas que tengan sentido para su caso de uso.
  • Reciclaje automatizado - Automatice el reentrenamiento de modelos adjuntando sus canalizaciones de entrenamiento e inferencia.
  • Sesgo del modelo - Realice un seguimiento del sesgo en las predicciones de su modelo ML.
  • Explicabilidad de la AI - Comprender la importancia relativa de múltiples características en las predicciones.
  • Seguridad de datos - Sus datos nunca salen de su máquina.
  • Integración de Slack - Recibe alertas en Slack.
  • Tableros en tiempo real - Para visualizar la salud de tu modelo en vivo.

🚨Próximamente🚨

  • Cambio de etiqueta - Identificar desviaciones en sus predicciones. Especialmente útil en los casos en que la realidad del terreno no está disponible.
  • Intervalo de confianza del modelo - Intervalos de confianza para las predicciones del modelo
  • Técnicas avanzadas de detección de deriva - Métodos de detección de deriva basados ​​en valores atípicos
  • Rebanado de características avanzadas - Capacidad para dividir propiedades estadísticas
  • Prueba de Kolmogorov-Smirnov - Para la detección de turnos de distribución
  • Estabilidad de predicción - Filtrar los casos en los que la predicción del modelo no es estable.
  • Cheques contradictorios - Combatir los ataques adversarios

Y más.

Empieza 🙌

Puede comenzar rápidamente con Google Colab aquí.

Para ejecutarlo en su máquina, siga los pasos a continuación:

Instale el paquete a través de pip:

pip install uptrain

Ejecuta tu primer ejemplo:

git clone [email protected]:uptrain-ai/uptrain.git
cd uptrain/examples
pip install jupyterlab
jupyter lab

Para obtener una descripción general rápida de cómo funciona UpTrain, consulte nuestro tutorial de inicio rápido.

UpTrain en acción🎬

Uno de los casos de uso más comunes de ML en la actualidad son los modelos de lenguaje, ya sea resumen de texto, NER, chatbots, traducción de idiomas, etc. UpTrain proporciona formas de visualizar las diferencias en la capacitación y los datos del mundo real a través de la agrupación UMAP de incrustaciones de texto (inferidos de BERT). Las siguientes son algunas repeticiones del tablero de UpTrain.

AI Explicabilidad lista para usar

umap_gif

Supervisión del rendimiento del modelo en vivo y comprobaciones de integridad de datos

perf_gif perf_gif

Reducción y Visualización de Dimensionalidad UMAP

umap_gif

Colección Edge-case para ajustar el modelo más tarde

perf_gif

¿Por qué UpTrain 🤔?

Los modelos de aprendizaje automático (ML) se utilizan ampliamente para tomar decisiones comerciales críticas. Aún así, ningún modelo de ML es 100 % preciso y, además, su precisión se deteriora con el tiempo 😣. Por ejemplo, la predicción de ventas se vuelve imprecisa con el tiempo debido a un cambio en los hábitos de compra de los consumidores. Además, debido a la naturaleza de caja negra de los modelos de ML, es un desafío identificar y solucionar sus problemas.

UpTrain resuelve esto. Hacemos que sea fácil para los científicos de datos y los ingenieros de ML comprender dónde fallan sus modelos y ayudarlos a corregirlos antes de que otros se quejen 🗣️.

UpTrain se puede utilizar para una amplia variedad de modelos de aprendizaje automático, como LLM, modelos de recomendación, modelos de predicción, modelos de visión artificial, etc.

Trabajamos constantemente para mejorar UpTrain. ¿Quieres una nueva función o necesitas alguna integración? No dude en crear un problema o contribuir directamente al repositorio.

Meme

Licencia 💻

Este repositorio se publica bajo licencia Apache 2.0. Actualmente estamos enfocados en desarrollar ofertas no empresariales que deberían cubrir la mayoría de los casos de uso al agregar más funciones y ampliar a más modelos. También estamos trabajando para agregar una oferta alojada: Contáctenos si estás interesado.

Mantente actualizado ☎️

Estamos continuamente agregando toneladas de funciones y casos de uso. ¡Apóyanos dándole una estrella al proyecto ⭐!

Proporcione comentarios (cuanto más duro, mejor 😉)

Estamos construyendo UpTrain en público. Ayúdanos a mejorar dando tu opinión aquí.

Colaboradores 🖥️

Damos la bienvenida a las contribuciones a UpTrain. Por favor vea nuestro guía de contribución para detalles.