Lissage des données Définition & Exemple | - 2024

LISSAGE BRESILIENNE RETOQUE DE RACINE DONNA LISS

Table des matières:

Description:
Comment ça marche (Exemple):
Pourquoi ça compte:

Description:

Le lissage des données est une technique statistique qui consiste à supprimer des valeurs aberrantes dans un ensemble de données un modèle plus visible.

Comment ça marche (Exemple):

Par exemple, disons qu'une université analyse ses données sur la criminalité au cours des 10 dernières années. Le nombre de crimes violents ressemble à ceci:

Comme vous pouvez le voir, la plupart du temps, l'université subit moins de 15 crimes par an. Cependant, en 2006 et en 2007, il en a connu 44 en raison d'une exigence de déclaration expérimentale par l'équipe de sécurité publique de l'université. L'expérience de reportage a changé la définition du crime violent pour inclure les vols de toutes sortes durant ces années, ce qui a créé un grand bond dans le nombre de crimes «violents» sur le campus. Si nous incluons ces années dans la moyenne - c'est-à-dire, si nous faisons un certain lissage des données - l'université a connu en moyenne 19 crimes violents par année. Mais si nous laissons ces années, nous pouvons voir qu'une moyenne plus réaliste est de 13 crimes violents par an - une différence de 32%.

Pourquoi ça compte:

Il y a plusieurs façons de lisser les données, y compris moyennes et algorithmes. L'idée est que le lissage des données rend les modèles plus visibles et aide ainsi à prévoir les changements dans les cours des actions, les tendances des clients ou toute autre information commerciale. Cependant, le lissage des données peut ignorer les informations clés ou rendre les faits importants moins visibles; En d'autres termes, "arrondir les bords" des données peut surestimer certaines données et ignorer d'autres données.