Back to Search

Algorithme K-Means parallèle basé sur Hadoop-MapReduce pour l'exploration de données

AUTHOR Lopes Veloso, Lays Helena; Senger, Luciano Jos
PUBLISHER Editions Notre Savoir (10/17/2025)
PRODUCT TYPE Paperback (Paperback)

Description
Ce travail avait pour objectif d'étudier l'utilisation d'un algorithme de regroupement K-Means parallèle, basé sur le modèle de programmation MapReduce, afin d'améliorer le temps de réponse de l'exploration de données. Les performances de l'algorithme ont été évaluées en termes de SpeedUp et ScaleUp. Pour cela, des expériences ont été menées sur un cluster Hadoop composé de six ordinateurs à matériel standard. Les données regroupées sont des mesures de flux provenant de tours situées dans des régions agricoles et appartiennent à Ameriflux. Les expériences ont été menées à l'aide de 3, 4 et 6 machines, respectivement. Les résultats ont montré qu'avec l'augmentation du nombre de machines, les performances ont été améliorées, le meilleur temps ayant été obtenu avec six machines, atteignant un SpeedUp de 3,25. Il a été constaté que l'application s'adapte bien à l'augmentation équivalente de la taille des données et du nombre de machines dans le cluster, atteignant des performances similaires lors des tests.
Show More
Product Format
Product Details
ISBN-13: 9786209137112
ISBN-10: 6209137113
Binding: Paperback or Softback (Trade Paperback (Us))
Content Language: French
More Product Details
Page Count: 60
Carton Quantity: 118
Product Dimensions: 6.00 x 0.14 x 9.00 inches
Weight: 0.21 pound(s)
Country of Origin: US
Subject Information
BISAC Categories
Unassigned | General
Descriptions, Reviews, Etc.
publisher marketing
Ce travail avait pour objectif d'étudier l'utilisation d'un algorithme de regroupement K-Means parallèle, basé sur le modèle de programmation MapReduce, afin d'améliorer le temps de réponse de l'exploration de données. Les performances de l'algorithme ont été évaluées en termes de SpeedUp et ScaleUp. Pour cela, des expériences ont été menées sur un cluster Hadoop composé de six ordinateurs à matériel standard. Les données regroupées sont des mesures de flux provenant de tours situées dans des régions agricoles et appartiennent à Ameriflux. Les expériences ont été menées à l'aide de 3, 4 et 6 machines, respectivement. Les résultats ont montré qu'avec l'augmentation du nombre de machines, les performances ont été améliorées, le meilleur temps ayant été obtenu avec six machines, atteignant un SpeedUp de 3,25. Il a été constaté que l'application s'adapte bien à l'augmentation équivalente de la taille des données et du nombre de machines dans le cluster, atteignant des performances similaires lors des tests.
Show More
List Price $46.00
Your Price  $45.54
Paperback