GitHub - ebiznext/Initiation-Apache-Spark

Branches Tags

Name		Name	Last commit message	Last commit date
Latest commit History 246 Commits
README.md		README.md
SUMMARY.md		SUMMARY.md
aspects_avances_de_spark.md		aspects_avances_de_spark.md
chargement_et_stockage_des_donnees.md		chargement_et_stockage_des_donnees.md
introduction.md		introduction.md
mise_en_oeuvre_des_rdds.md		mise_en_oeuvre_des_rdds.md
partie_0__mise_en_place_de_lenvironement.md		partie_0__mise_en_place_de_lenvironement.md
partie_1__familiarisation_avec_les_concepts_de_spark.md		partie_1__familiarisation_avec_les_concepts_de_spark.md
partie_5__sparksql.md		partie_5__sparksql.md
rd3.png		rd3.png
rdd1.jpg		rdd1.jpg
rdd2.png		rdd2.png
rdd4.png		rdd4.png
rdd5.png		rdd5.png
rdd6.png		rdd6.png
rdd7.png		rdd7.png
spark_streaming.md		spark_streaming.md

Repository files navigation

#A propos

Apache Spark se présente comme la nouvelle génération de moteur de calcul distribué qui remplace progressivement Hadoop/MapReduce.

L'objet de ce Hands-on Labs est de vous familiariser par la pratique au traitement massif et distribué dans le domaine du data crunching et du machine learning. A l'issue de cette session, vous serez familiers avec :

Les Resilient Data Sets (RDD) qui désignent l’abstraction essentielle pour la manipulation distribuée des données.
les patterns de transformations et d'actions offerts par l'API
les API de chargement et de stockage de données - filesystem / hdfs / NoSQL(Elasticsearch et Cassandra)
Les bonnes pratiques de programmation distribuée avec la mise en oeuvre du partitionnement sélectif et l'usage de variables partagées (accumulators et broadcast variables)
l'analyse et le reporting via Spark SQL
l'analytique temps-réel avec Spark Streaming

Les prérequis à installer :

JDK 8 Distribution Spark et contenu du Hands-on Lab

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

ebiznext/Initiation-Apache-Spark

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages