Documents - Essaye le - Communauté de soutien - Rapport d'erreur - Demande de fonctionnalité
Lire ceci dans d'autres langues:
UpTrain est un outil open source sécurisé pour les données permettant aux praticiens du ML d'observer et d'affiner leurs modèles de ML en surveillant leurs performances, en vérifiant les changements de distribution (de données) et en collectant des cas extrêmes pour les recycler. Il s'intègre parfaitement à vos pipelines de production existants et ne prend que quelques minutes pour démarrer ⚡.
- Contrôles de dérive des données - Identifiez les changements de distribution dans les entrées de votre modèle.
- Suivi de la performance - Suivez les performances de vos modèles en temps réel et recevez des alertes de dégradation.
- Prise en charge des incorporations - Tableaux de bord spécialisés pour comprendre les intégrations induites par le modèle.
- Signaux de cas extrêmes - Signaux définis par l'utilisateur et techniques statistiques pour détecter les points de données hors distribution.
- Vérifications de l'intégrité des données - Vérifie les données manquantes ou incohérentes, les enregistrements en double, la qualité des données, etc.
- Métriques personnalisables - Définissez des métriques personnalisées adaptées à votre cas d'utilisation.
- Recyclage automatisé - Automatisez le recyclage des modèles en associant vos pipelines de formation et d'inférence.
- Biais du modèle - Suivez les biais dans les prédictions de votre modèle ML.
- Explicabilité de AI - Comprendre l'importance relative de plusieurs fonctionnalités sur les prédictions.
- Sécurité des données - Vos données ne sortent jamais de votre machine.
- Intégration Slack - Recevez des alertes sur Slack.
- Tableaux de bord en temps réel - Pour visualiser la santé de votre modèle en direct.
- Décalage d'étiquette - Identifiez les dérives dans vos prédictions. Particulièrement utile dans les cas où la vérité terrain n'est pas disponible.
- Intervalle de confiance du modèle - Intervalles de confiance pour les prédictions du modèle
- Techniques avancées de détection de dérive - Méthodes de détection de dérive basées sur les valeurs aberrantes
- Découpage des fonctionnalités avancées - Capacité à trancher les propriétés statistiques
- Test de Kolmogorov-Smirnov - Pour détecter les décalages de distribution
- Stabilité des prévisions - Filtrer les cas où la prédiction du modèle n'est pas stable.
- Contrôles contradictoires - Combattre les attaques adverses
Et plus.
Vous pouvez rapidement démarrer avec Colab Google ici.
Pour l'exécuter sur votre machine, suivez les étapes ci-dessous :
pip install uptrain
git clone [email protected]:uptrain-ai/uptrain.git
cd uptrain/examples
pip install jupyterlab
jupyter lab
Pour une présentation rapide du fonctionnement d'UpTrain, consultez notre tutoriel de démarrage rapide.
UpTrain en action🎬
L'un des cas d'utilisation les plus courants de ML aujourd'hui est les modèles de langage, qu'il s'agisse de résumé de texte, de NER, de chatbots, de traduction de langage, etc. UpTrain fournit des moyens de visualiser les différences dans la formation et les données du monde réel via le regroupement UMAP des incorporations de texte (inféré de BERT). Voici quelques rediffusions du tableau de bord UpTrain.
Les modèles d'apprentissage automatique (ML) sont largement utilisés pour prendre des décisions commerciales critiques. Pourtant, aucun modèle ML n'est précis à 100 % et, de plus, leur précision se détériore avec le temps 😣. Par exemple, la prévision des ventes devient imprécise au fil du temps en raison d'un changement dans les habitudes d'achat des consommateurs. De plus, en raison de la nature de la boîte noire des modèles ML, il est difficile d'identifier et de résoudre leurs problèmes.
UpTrain résout ce problème. Nous permettons aux scientifiques des données et aux ingénieurs ML de comprendre facilement où leurs modèles vont mal et les aidons à les corriger avant que d'autres ne se plaignent 🗣️.
UpTrain peut être utilisé pour une grande variété de modèles d'apprentissage automatique tels que les LLM, les modèles de recommandation, les modèles de prédiction, les modèles de vision par ordinateur, etc.
Nous travaillons constamment pour améliorer UpTrain. Vous voulez une nouvelle fonctionnalité ou avez besoin d'intégrations ? Ne hésitez pas à créer un problème ou contribuer directement au référentiel.
Ce référentiel est publié sous licence Apache 2.0. Nous nous concentrons actuellement sur le développement d'offres non professionnelles qui devraient couvrir la plupart des cas d'utilisation en ajoutant plus de fonctionnalités et en s'étendant à plus de modèles. Nous travaillons également à l'ajout d'une offre hébergée - Contactez-nous Si tu es intéressé.
Nous ajoutons continuellement des tonnes de fonctionnalités et de cas d'utilisation. Merci de nous soutenir en donnant au projet une étoile ⭐ !
Nous construisons UpTrain en public. Aidez-nous à nous améliorer en donnant votre avis ici.
Nous accueillons les contributions à UpTrain. Veuillez consulter notre guide des cotisations pour plus de détails.