Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Statisticien vs Data Scientist : quelle est la différence ?



Les statisticiens et les data scientists travaillent tous deux beaucoup avec des données, mais il existe quelques différences clés entre les deux professions :

Différence n°1 (types de données) – Les data scientists ont tendance à passer plus de temps à collecter et à nettoyer des données imparfaites, tandis que les statisticiens disposent généralement de données ordonnées.

Différence n°2 (objectifs finaux) – Les data scientists ont tendance à se concentrer sur la création de modèles qui prédisent les résultats, tandis que les statisticiens ont tendance à se concentrer sur la création de modèles qui décrivent avec précision la relation entre les variables.

Différence n°3 (Production) – Les data scientists ont tendance à construire des modèles qui sont mis en production dans les entreprises, tandis que les statisticiens ont tendance à construire des modèles qui peuvent fournir des informations ou des explications sur le phénomène.

Continuez à lire pour une explication détaillée de ces différences.

Différence n°1 : types de données

En général, les data scientists travaillent souvent avec des données plus compliquées, plus difficiles à extraire et beaucoup plus volumineuses que le type de données utilisé par les statisticiens.

Par exemple, un data scientist travaillant dans une société immobilière devra peut-être extraire des ensembles de données contenant des millions de lignes à partir de plusieurs serveurs externes différents, tous dans des formats différents.

Elle aurait besoin d’une connaissance approfondie de SQL et d’au moins un langage de programmation (comme R ou Python ) afin d’extraire les données et de les regrouper dans un format adapté à la modélisation.

En revanche, les statisticiens ont tendance à travailler avec des ensembles de données plus petits, déjà présentés dans un format soigné.

Par exemple, un statisticien qui travaille pour une entreprise biomédicale peut recevoir un fichier Excel de 50 lignes contenant des informations sur la tension artérielle, la fréquence cardiaque et les taux de cholestérol de 50 patients différents.

Plutôt que de passer leur temps à extraire et à nettoyer les données, ils passeraient probablement plus de temps à décider d’un test d’hypothèse ou d’un modèle approprié à adapter aux données et à vérifier que les hypothèses du test ou du modèle statistique choisi sont respectées.

Différence n°2 : les objectifs finaux

Dans de nombreux cas, l’objectif final d’un data scientist est de créer un type de modèle capable de prédire avec précision certains résultats.

Par exemple, un data scientist qui travaille pour une société financière pourrait tenter de créer un modèle de régression logistique capable de prédire avec précision si certaines personnes ne parviendront pas à rembourser un prêt.

Ils adapteront une variété de modèles en utilisant différentes combinaisons de variables prédictives et tenteront de trouver le modèle qui produit les prédictions les plus précises.

Leur objectif final est de créer un modèle précis plutôt que de quantifier exactement la manière dont chaque variable prédictive est liée à la variable de réponse .

En revanche, les statisticiens ont tendance à se concentrer davantage sur la création de modèles capables de décrire avec précision la relation entre les variables prédictives et une variable de réponse.

Par exemple, un statisticien travaillant dans une université pourrait recruter 30 étudiants pour participer à une étude qui quantifie exactement l’impact des différentes habitudes d’étude sur les résultats aux examens.

Dans ce scénario, le statisticien serait davantage soucieux d’interpréter les coefficients du modèle de régression et d’analyser leurs valeurs p correspondantes pour comprendre si elles ont une relation statistiquement significative avec la variable de réponse.

Différence n°3 : Production

En général, les data scientists ont tendance à créer des modèles statistiques qui sont mis en production dans les entreprises bien plus souvent que les statisticiens.

Par exemple, un data scientist travaillant dans une grande chaîne d’épicerie pourrait créer un modèle capable de prévoir avec précision les ventes de divers produits.

Son objectif final serait de travailler avec des développeurs de l’entreprise qui peuvent l’aider à placer son modèle dans un serveur fonctionnant tous les soirs et capable de prévoir les ventes de produits pour chaque nouveau jour.

En revanche, les statisticiens créent rarement des modèles qui sont intégrés à un type de production.

Par exemple, un statisticien travaillant dans une entreprise de soins de santé peut construire un modèle décrivant la relation entre divers facteurs liés au mode de vie (tabagisme, exercice, régime alimentaire, etc.), mais son objectif final est simplement de quantifier la relation entre ces facteurs et une variable de réponse. comme la durée de vie.

Leur objectif final est de créer un modèle qui leur fournit des informations plutôt qu’un modèle placé dans un environnement de production.

Conclusion

Les statisticiens et les data scientists travaillent tous deux avec des données dans leur rôle quotidien, mais ils le font de différentes manières.

Les data scientists ont tendance à travailler avec une plus grande variété de données qui sont souvent désordonnées et doivent être traitées, tandis que les statisticiens travaillent souvent avec des ensembles de données plus petits et plus ordonnés.

Les data scientists ont également tendance à se concentrer davantage sur la création de modèles capables de prédire avec précision les résultats, tandis que les statisticiens ont tendance à construire des modèles capables d’expliquer avec précision la relation entre les variables.

Enfin, les data scientists ont tendance à mettre des modèles en production dans les entreprises, tandis que les statisticiens résument et rapportent souvent leurs résultats pour donner un aperçu des phénomènes du monde réel.

Ressources additionnelles

Les articles suivants expliquent l’importance des statistiques dans divers domaines :

Pourquoi les statistiques sont-elles importantes ? (10 raisons pour lesquelles les statistiques sont importantes !)
L’importance des statistiques dans les entreprises
L’importance des statistiques dans l’éducation
L’importance des statistiques dans les soins de santé
L’importance des statistiques en finance

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *