17/08/2018

Apprendre la data science et le machine learning

Bonjour et bienvenue!

Si j'ai décidé de parler de data science c'est parce que j'aime la science des données et tous ce qui tourne autour du big data. J'aimerais ainsi partager avec vous mes aventures et mes connaissances dans ces domaines et peut-être je pourrais augmenter mes connaissances par ce biais.

J'ai une formation de bio-informatique et biostatistique: bien sûr cette formation n'est pas complète, je n'ai eu qu'un niveau BAC+2 à l'université de Douala.

Je suis très intéressé par les biosciences notamment à tous ce qui touche à l'agro-alimentaire, la santé et l'environnement.

Je vais ici vous présenter la méthode que j'applique pour mon apprentissage et si tout se passe bien, d'ici l'année prochaine j'aurais acquis des connaissances assez solides.

Quel est ce programme?

Je participe au #100DaysOfML dont le principe est de consacrer une heure de son temps tous les jours pour apprendre le machine learning. J'ai débuté ce challenge le 6 juillet 2018.

Pour ne pas être trop long...

Voici un ensemble de ressources que j'utilise pour apprendre le machine learning et le data science.

Prérequis

  1. Apprendre Python
  2. Apprendre Pandas
  3. Apprendre à visualiser les données

Les cours proprement dits: à suivre dans l'ordre

  1. Intro to Statistics
  2. Intro to Data Analysis
  3. Intro to Data Science
  4. Intro to R
  5. Data Analysis with R
  6. Initiation au machine learning
  7. Machine learning 1
  8. Machine Learning 2
  9. SQL for Data Science
  10. Intro to Hadoop and MapReduce
  11. Deep Learning 1
  12. Deep Learning 2

Pratiquer, pratiquer et lire

La seule manière d'assimiler ce que j'ai appris est de pratiquer. C'est pour çà que je fais des challenges sur Kaggle et suis les experts de l'IA sur les réseaux sociaux notemment sur twitter.

Sur ce, voici quelques liens utiles

Blogs

  1. Siraj Raval
  2. Analytics Vidhya
  3. Towards Data Science
  4. Statistiques et logiciel R
  5. Machine Learning Mastery

Livres et publications

  1. Statistiques pour statophobes
  2. Statistique Bayésienne
  3. utilisation d'une fonction de perte quadratique pondérée
  4. Python Data Science Handbook
  5. Neural Networks and Deep Learning
  6. R for data science

Commentaires