mardi 30 octobre 2012

Algorithmes d'exploration de données


Algorithmes d'exploration de données sont des outils qui aident à dénicher des relations utiles et des modèles de toute masse énorme de données. Dans cet article, j'ai l'intention de vous fournir une vue de base de ce data mining est et comment il contribue à l'analyse des données et extraction de connaissances à partir de celui-ci.

Qu'est-ce que Data Mining?

L'extraction des données terme a été inventé beaucoup de sagesse et le nom lui-même est auto-explicatif du concept, si vous regardez plus loin dans l'analogie minière. L'exploitation minière monde réel est de creuser à travers des tonnes de terre et de gravats, de trouver des minéraux utiles de la terre. De même, le data mining est de creuser ou d'extraire des informations utiles et des modèles prédictifs à partir d'un flot de données. Qu'il s'agisse d'une entreprise ou d'activité humaine, afin de planifier une stratégie gagnante, il faut analyser les données brutes disponibles. La plupart des entreprises face à d'énormes quantités de données d'enquête des clients ou des données liées aux performances de l'entreprise. Pour survivre dans le monde concurrentiel d'aujourd'hui, il faut des connaissances spécialisées qui peuvent vous aider à venir avec les stratégies commerciales appropriées adaptées aux besoins des clients. Les logiciels basés sur des algorithmes de data mining pouvez identifier les tendances au sein de clusters de données énormes et extraire les interrelations entre les différentes catégories de données. Cela peut aider à prédire les tendances futures de l'évolution du marché et de donner à une entreprise un avantage sur ses concurrents. Données boursières est exploitée pour les modèles prédictifs qui peuvent vous aider dans les prévisions futures. Le moteur de recherche Google utilise un type de données intelligentes algorithmes d'exploration pour sélectionner les pages web les plus pertinents sur les millions disponibles sur Internet.

Quand il s'agit de projets de recherche scientifique, l'analyse des données expérimentales est important de valider des hypothèses scientifiques, pour lesquelles les expériences ont été conçues. Un exemple d'une démarche scientifique qui est en train d'utiliser des algorithmes de data mining est largement machine du CERN Large Hadron Collider, qui a généré des gigaoctets de données tous les jours. Analyser ces données est automatisée par ingénieusement conçus algorithmes de data mining. Les applications des algorithmes de data mining sont universels, car les données abondent partout.

Types d'algorithmes d'exploration de données

Tout comme pour les minéraux des mines, il faut utiliser les bons outils qui peuvent pénétrer la terre et l'accès aux minéraux, il faut un algorithme d'exploration de données intelligemment conçu qui est adapté au type de données, on a affaire. Les données peuvent être de différents types, comme numérique, alphabétique, fait fonction et une fusion complexe de tous ces éléments. Il existe une variété de logiciels basée sur différentes techniques de data mining, que l'on peut choisir. Il existe différentes approches de tri des données et l'exploitation minière pour l'extraction de relations. Voici les deux principaux types d'algorithmes de data mining.

Classiques algorithmes de data mining

La première classe d'algorithmes de data mining sont ceux qui utilisent des techniques statistiques et simple bon sens pour analyser les données. Une première méthode est la régression. Dans cette méthode, les données fournies sont tracées et une courbe mathématique qui correspond à cette donnée n'est trouvée. Par conséquent, l'équation de la courbe est utilisée pour prédire évolution future de flux de données. La régression est la modélisation des données grâce à l'utilisation d'une des équations mathématiques et il ya différents types de techniques de régression utilisés dans l'exploration de données.

Autre que la régression, deux des plus anciens algorithmes classiques de fouille de données sont «clustering» et «plus proche voisin». Ils sont tout à fait semblable dans son principe. Algorithmes d'exploration de données basé sur le regroupement d'utiliser le principe de tallage comme des choses ensemble en groupes de données uniformes. C'est comme un système de taxonomie, en principe. L'algorithme du «plus proche voisin» ne peut prédire l'avenir bien sûr des données en les comparant avec les anciennes données qui lui ressemble le plus. Prédiction est réalisée sur la base de l'idée que, ce qui se passe avec le plus proche voisin d'un flux de données, pourrait se reproduire avec le nouveau flux de données.

Modernes Algorithmes d'exploration de données

Modernes algorithmes de data mining sont principalement basées sur le concept des arbres de décision. Autrement dit, les données sont triées sur la base de questions qu'il tamisent dans un cadre logique. Les algorithmes sont basés sur l'idée de capturer la plupart des types de données à l'aide d'un cadre décisionnel complexe arbre. C'est un filet de logique qui enregistre chaque petit morceau de données. Il permet de prévoir le flux de données de cadre donné. Il existe de nombreux types d'algorithmes d'exploration de données qui sont une variante de cette idée centrale.

Espérons que cet article vous a donné une idée approximative de ce que les algorithmes de data mining peut faire pour vous. Bien, je ne donne pas une exploitation complète des données algorithmes de liste, les types mentionnés ici sont représentatifs de la plupart. Sélectionnez un logiciel basé sur un algorithme qui convient le mieux à votre secteur d'activité, selon le type de données dont vous avez besoin pour gérer. De nombreux programmes commerciaux de logiciels de bases de données sont livrés avec encastrables outils de data mining, que vous pouvez utiliser pour la connaissance des mines sur des données!...

Aucun commentaire:

Enregistrer un commentaire