06 septembre 2018

Les 5 livres que tout data scientist doit lire

Les 5 livres que tout data scientist doit lire

S'initier au monde du Machine Learning et du Big Data est assurément un défi passionnant, et pour faciliter et accélérer ce processus, voici 5 livres absolument incontournables !

1. Apprentissage automatique avec Python. Création d'algorithmes pour générer des connaissances

Le traitement de la masse de données disponibles aujourd'hui représente un défi fascinant et essentiel pour le monde contemporain où la connaissance et l'information sont la valeur primordiale.
Ce livre vous plonge dans le monde de l'apprentissage automatique et vous montre comment Python est le langage de programmation idéal pour construire des algorithmes sophistiqués capables d'interroger les données de manière optimale et d'en extraire des informations précieuses.
Ce volume explique l'utilisation de bibliothèques Python dédiées – notamment scikit-learn, Theano et Keras – appliquées à des domaines tels que la sélection et la compression de données, l'analyse du langage naturel , le traitement prédictif et la reconnaissance d'images. L'approche pédagogique est pragmatique : tous les concepts sont illustrés par des exemples de code concrets.

Ce livre est recommandé à ceux qui possèdent quelques connaissances théoriques en apprentissage automatique et une bonne compréhension de la programmation Python.

2. Analyse du Big Data : Le manuel du data scientist

Ce livre se veut un guide complet pour celles et ceux qui souhaitent intégrer ce secteur émergent, ainsi que pour les professionnels expérimentés désireux d'approfondir certains sujets. L'auteur y présente les concepts clés de la gestion et de l'analyse avancée des données ; il décrit le Big Data et les outils et architectures permettant sa gestion ( Hadoop en particulier) ; et il introduit l'ingestion et le traitement des données à l'aide de plusieurs outils d'analyse ( Hive, Pig, Spark et R ), dont le fonctionnement est illustré par des exemples commentés. Une section est consacrée à l'analyse prédictive et présente les techniques de création de modèles prédictifs , de la préparation des données au choix de l'algorithme le plus adapté, en passant par l'évaluation des performances. Cet ouvrage constitue un outil précieux pour la compréhension des concepts liés à l'analyse des données (Big Data ou données traditionnelles), notamment pour les dirigeants d'entreprise , qui peuvent ainsi exploiter les informations issues de l'analyse avancée pour prendre des décisions, évaluer les risques et concevoir des stratégies.

3. Science des données : Guide des principes et techniques fondamentaux de la science des données

Ce livre s'adresse aux programmeurs souhaitant se lancer dans la science des données en découvrant comment combiner des compétences allant des mathématiques à l'analyse commerciale grâce, bien sûr, à la programmation. L'objectif est d'enseigner comment aborder des données hétérogènes et les transformer en idées et en connaissances . Au fil des chapitres, les éléments essentiels à la maîtrise d'un data scientist sont présentés : définition du domaine d'analyse, extraction et nettoyage des données brutes, calcul des probabilités, modélisation statistique et application d'algorithmes d'apprentissage automatique. L'ouvrage fournit également de nombreux conseils sur la normalisation et la préparation des données avant analyse, ainsi que sur la présentation et la communication efficaces des résultats. Chaque étape clé est illustrée par des exemples de pseudocode, tandis que les exemples de code utilisent principalement le langage Python.

4. Les data scientists : entre compétitivité et innovation

Face à l'essor de l' économie algorithmique et du Big Data, les organisations recherchent de plus en plus un profil capable de communiquer et de collaborer avec les cobots et les machines intelligentes : le data scientist. Répondant à ce besoin, cet ouvrage propose des conseils pratiques aussi bien aux personnes souhaitant se lancer dans une carrière de data scientist et l'atteindre au plus haut niveau qu'aux entreprises désirant recruter ce profil pour améliorer leur prise de décision et leur compétitivité. Le texte est également enrichi par les contributions de personnalités de premier plan du monde de l'innovation , qui offrent une perspective alternative et ouverte, ainsi que par des témoignages et des études de cas qui contribuent à éclairer les propos.

5. Intelligence artificielle, protection des données personnelles et réglementation

Ce volume représente avant tout un défi. Alors que le nouveau Règlement général européen sur la protection des données (RGPD) entre en vigueur, visant à renforcer la protection et la confiance dans la circulation des données et l'économie numérique, des efforts sont déjà déployés pour aller plus loin. Le RGPD constitue un effort considérable pour passer d'une conception statique des données comme propriété personnelle à une conception dynamique qui considère les données, y compris les données personnelles, comme le moteur de la quatrième révolution industrielle. Nous sommes désormais à l'ère de l'intelligence artificielle, des machines intelligentes et de l'Internet des objets. Le RGPD peut-il réellement renforcer la confiance des citoyens en protégeant leurs données, même dans ce nouveau monde de l'IA ?

Source : Amazon.it