Developpez.com - Rubrique Big Data

Le Club des Développeurs et IT Pro

Apprendre à faire du Machine Learning sur Spark : MLib, théorie et concepts,

Un tutoriel de Yoann Benoit et Alban Pehlip

Le 2016-07-02 11:24:52, par Mickael Baron, Rédacteur
Bonjour,

La société Xebia qui est un cabinet de conseil Parisien spécialisé dans les technologies Big Data, Cloud, Web, les architectures Java et mobilité dans les environnements agiles vous propose un tutoriel pour apprendre à faire du Machine Learning sur Apache Spark.

Voici l'adresse du tutoriel : http://xebia.developpez.com/tutoriel...earning-spark/

N'hésitez pas à laisser des commentaires

Retrouver les meilleurs cours et tutoriels pour apprendre autour du Big Data

Mickael
  Discussion forum
2 commentaires
  • chaya
    Membre habitué
    Génial, c'est un tutoriel que j'attendais avec beaucoup d'impatience.

    Vivement la suite avec des exemples pratiques!
  • dev_ggy
    Membre éprouvé
    Bonjour à tous,

    Petite question sur l'intérêt de Spark. Il est enseigné pour la modélisation qu'il est toujours préférable de constituer un petit Dataset bien ventilé et de construire un modèle dessus. Avoir de très grosse volumétrie de données ne permet pas d'avoir de meilleure convergence. Les algorithmes ont un seuil de précision par rapport au nombre de données qui fait plafonner la précision. Ajouté toujours plus de données n'ayant pas d'intérêt, dans quel cadre Spark est-il vraiment utile pour le machine learning ?

    Au plaisir de vous lire.