33 subscribers
Player FM ऐप के साथ ऑफ़लाइन जाएं!
Scikit-Learn : Titan du Machine Learning, Champion de l’open source - Gaël Varoquaux (Co Founder @SickitLearn & Probabl) #70
Manage episode 446106438 series 3426234
Gaël Varoquaux, cofondateur de Sickit Learn et Probabl et directeur de recherche à l’INRIA est l’invité de l’épisode 70 du podcast Data Driven 101.
Comment Scikit-learn est-il devenu un outil incontournable pour les data scientists, et comment est-il né ?
Gaël Varoquaux nous révèle les origines de cette librairie open source incontournable pour l'apprentissage statistique en Python, l'organisation et les défis de ce projet open source qui a révolutionné le monde de la data science.
Un épisode riche en enseignements sur l'apprentissage statistique, la gouvernance des projets open source et les défis de la collaboration dans le monde de la data science.
🔑 MOTS CLÉS
Open source : Un logiciel open source est un logiciel dont le code source est accessible au public et peut être librement utilisé, modifié et distribué.
Apprentissage supervisé : L'apprentissage supervisé est une technique d'apprentissage automatique où un modèle est entraîné sur un ensemble de données étiquetées, c'est-à-dire des données pour lesquelles la sortie souhaitée est connue.
Apprentissage non supervisé : L'apprentissage non supervisé est une technique d'apprentissage automatique où un modèle est entraîné sur un ensemble de données non étiquetées, c'est-à-dire des données pour lesquelles la sortie souhaitée n'est pas connue.
Réduction de dimensions : La réduction de dimensionnalité est une technique qui vise à réduire le nombre de variables (ou dimensions) d'un jeu de données tout en conservant autant d'informations que possible.
Clustering : Le clustering (ou regroupement) est une technique d'apprentissage non supervisé qui vise à regrouper des données similaires en groupes (ou clusters).
GitHub: GitHub est une plateforme de développement collaboratif qui permet aux développeurs de stocker, partager et gérer leur code source.
🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode #52 Météo, océan et climat : prédire et modéliser grâce à l’intelligence artificielle - Louis Thiry (chercheur @ INRIA)
Épisode #35 Nataniel Ruiz (Research Scientist @ Google Search) : Dreambooth, faire apprendre de nouveaux objets à une IA générative
Épisode #51 Qualité de l’IA, qualité de la data - Jean-Marie John Matthew (Cofondateur @ Giskard)
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
91 एपिसोडस
Scikit-Learn : Titan du Machine Learning, Champion de l’open source - Gaël Varoquaux (Co Founder @SickitLearn & Probabl) #70
Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français
Manage episode 446106438 series 3426234
Gaël Varoquaux, cofondateur de Sickit Learn et Probabl et directeur de recherche à l’INRIA est l’invité de l’épisode 70 du podcast Data Driven 101.
Comment Scikit-learn est-il devenu un outil incontournable pour les data scientists, et comment est-il né ?
Gaël Varoquaux nous révèle les origines de cette librairie open source incontournable pour l'apprentissage statistique en Python, l'organisation et les défis de ce projet open source qui a révolutionné le monde de la data science.
Un épisode riche en enseignements sur l'apprentissage statistique, la gouvernance des projets open source et les défis de la collaboration dans le monde de la data science.
🔑 MOTS CLÉS
Open source : Un logiciel open source est un logiciel dont le code source est accessible au public et peut être librement utilisé, modifié et distribué.
Apprentissage supervisé : L'apprentissage supervisé est une technique d'apprentissage automatique où un modèle est entraîné sur un ensemble de données étiquetées, c'est-à-dire des données pour lesquelles la sortie souhaitée est connue.
Apprentissage non supervisé : L'apprentissage non supervisé est une technique d'apprentissage automatique où un modèle est entraîné sur un ensemble de données non étiquetées, c'est-à-dire des données pour lesquelles la sortie souhaitée n'est pas connue.
Réduction de dimensions : La réduction de dimensionnalité est une technique qui vise à réduire le nombre de variables (ou dimensions) d'un jeu de données tout en conservant autant d'informations que possible.
Clustering : Le clustering (ou regroupement) est une technique d'apprentissage non supervisé qui vise à regrouper des données similaires en groupes (ou clusters).
GitHub: GitHub est une plateforme de développement collaboratif qui permet aux développeurs de stocker, partager et gérer leur code source.
🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast : ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode #52 Météo, océan et climat : prédire et modéliser grâce à l’intelligence artificielle - Louis Thiry (chercheur @ INRIA)
Épisode #35 Nataniel Ruiz (Research Scientist @ Google Search) : Dreambooth, faire apprendre de nouveaux objets à une IA générative
Épisode #51 Qualité de l’IA, qualité de la data - Jean-Marie John Matthew (Cofondateur @ Giskard)
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
91 एपिसोडस
सभी एपिसोड
×
1 L’éthique face à l’IA : Comment rester humain à l’ère du numérique ? - Mathieu Guillermin enseignant-chercheur @UCL #85 47:03

1 Comment La Centrale transforme la data en moteur de croissance ? - Thomas Berger CTO @LaCentrale) #84 46:16

1 Quand la data sauve des vies : le rôle de Klineo dans l’accès aux essais cliniques - Nicolas Drizard CoFounder & CTO @ Klineo #83 45:55

1 IA & gestion financière : Menace ou Opportunité pour les métiers comptables ? Nicolas Mellin Directeur Innovation @Sage #82 40:38

1 Du fantasme dystopique à l’outil d’aide à la création : quelle place a l’IA dans la création littéraire ? Betrand Misonne #81 46:41

1 Optimiser le management et la performance RH grâce à l'IA - Romain Galabert (CEO @Candiquest) #80 31:09

1 L'IA et le cloud : Comment AWS révolutionne l'innovation en entreprise ( Stephan Hadinger directeur des technologies @AWS) #79 38:44

1 Révolutionner le sport en entreprise avec l'intelligence artificielle - Grégoire Véron (directeur AI @eGym, co-founder @GymLib) #78 56:06

1 L’IA au service de la transformation numérique - Michaël Deheneffe (VP Data AI @OrangeBusiness) #77 39:59

1 Agents conversationnels IA au service des ventes complexes - Louis Poirier (Cofounder & CTO @ Autodm AI) #76 1:02:12

1 Innovation & Mobilité : L’IA au service du train - Johan Maussion (Directeur Performance Business & Webanalytics @SNCF Connect&Tech) #75 41:06

1 IA et Éducation : Comment Nolej Révolutionne les Contenus Pédagogique - Nejma Belkhdim (CEO @Nolej) #74 44:26

1 Finance et Durabilité : Explorer l’Impact des Données ESG - Grégoire Hug ( CEO @ Weefin) # 73 48:22

1 Business Process Automation : Transformer les Processus Métiers - Emmanuelle Ertel (DG Innovation & Trust @Tessi) #72 43:31

1 Marketing Digital & IA : L'IA au service de la photographie produit - Gaëtan Rougevin-Baville CEO @Meero #71 51:27
प्लेयर एफएम में आपका स्वागत है!
प्लेयर एफएम वेब को स्कैन कर रहा है उच्च गुणवत्ता वाले पॉडकास्ट आप के आनंद लेंने के लिए अभी। यह सबसे अच्छा पॉडकास्ट एप्प है और यह Android, iPhone और वेब पर काम करता है। उपकरणों में सदस्यता को सिंक करने के लिए साइनअप करें।