06 de septiembre de 2018
Los 5 libros que todo científico de datos debe leer

Abordar el mundo del Machine Learning y el Big Data es sin duda un reto interesante, y para hacer el proceso más fácil y rápido, ¡aquí te dejamos 5 libros que son absolutamente imprescindibles de leer!
1. Aprendizaje automático con Python. Desarrollo de algoritmos para generar conocimiento.
Procesar el magma de datos disponibles hoy en día es un desafío fascinante y esencial para el mundo contemporáneo donde el conocimiento y la información son el valor primordial.
Este libro lo lleva al mundo del aprendizaje automático y muestra cómo Python es el lenguaje de programación ideal para crear algoritmos sofisticados que pueden consultar datos de manera óptima y recuperar información valiosa.
Este volumen explica el uso de bibliotecas dedicadas de Python, como scikit-learn, Theano y Keras , aplicadas a áreas como la selección y compresión de datos, el análisis del lenguaje natural , el procesamiento de predicciones y el reconocimiento de imágenes. El enfoque didáctico es pragmático: todos los conceptos se acompañan de ejemplos prácticos de código.
Este libro se recomienda para aquellos que tienen algunos conocimientos teóricos de aprendizaje automático y una buena comprensión de la programación en Python.
2. Big Data Analytics: Manual del científico de datos
Este libro pretende ser una guía completa para aquellos que deseen ingresar a esta profesión emergente, así como para aquellos ya experimentados que deseen profundizar en temas específicos. El autor ilustra los conceptos clave relacionados con la gestión de datos y el análisis avanzado de datos; describe big data y las herramientas y arquitecturas que permiten su gestión ( Hadoop en particular); e introduce la ingesta y el procesamiento de datos con varias herramientas de análisis ( Hive, Pig, Spark y R ), cuya funcionalidad también se ilustra mediante ejemplos comentados. Una sección está dedicada a la analítica predictiva y demuestra técnicas para crear modelos predictivos , desde la preparación de los datos hasta la elección del algoritmo más adecuado para la evaluación del rendimiento. El texto es una herramienta valiosa para comprender los conceptos relacionados con el análisis de datos (big data o datos tradicionales), incluso para la gestión de la empresa , que puede extraer información útil de la analítica avanzada para tomar decisiones, evaluar riesgos y diseñar estrategias.
3. Ciencia de datos: una guía sobre los principios y técnicas básicos de la ciencia de datos
Este libro está dirigido a programadores que desean ingresar al mundo de la ciencia de datos al descubrir cómo combinar habilidades que van desde las matemáticas hasta el análisis de negocios a través de, naturalmente, la programación. El objetivo es enseñar cómo abordar datos heterogéneos y transformarlos en ideas y perspectivas . A lo largo de los diversos capítulos, se presentan los elementos que un científico de datos debe dominar: definir el dominio de análisis, recuperar y limpiar datos sin procesar, calcular probabilidades, modelos estadísticos e incluso aplicar algoritmos de aprendizaje automático. También hay mucha información sobre cómo normalizar y preparar datos antes del análisis, así como consejos sobre cómo presentar y comunicar resultados de manera efectiva. Todos los pasos clave están acompañados de ejemplos de pseudocódigo para ilustrar mejor los algoritmos en uso, mientras que los ejemplos de código utilizan principalmente el lenguaje Python.
4. Científicos de datos: entre la competitividad y la innovación
Ante el auge de la Economía de Algoritmos y el Big Data, las organizaciones requieren cada vez más una figura profesional capaz de comunicarse y colaborar con COBOTS y máquinas inteligentes: el Científico de Datos. En respuesta a esta necesidad, este volumen ofrece una guía práctica tanto para quienes desean emprender y desarrollar una carrera como Científico de Datos al máximo nivel como para las empresas que buscan emplear esta figura para mejorar su capacidad de toma de decisiones y su competitividad. El texto también se enriquece con las contribuciones de figuras destacadas del mundo de la innovación , que ofrecen una perspectiva alternativa y abierta, y con testimonios y casos prácticos que ayudan a clarificar el contenido presentado.
5. Inteligencia artificial, protección de datos personales y regulación
Este volumen es, ante todo, un reto. Con la entrada en vigor del nuevo Reglamento General de Protección de Datos (RGPD) europeo, cuyo objetivo es mejorar la protección y aumentar la confianza en la circulación de datos y la economía digital, ya se están realizando esfuerzos para ir más allá. El RGPD representa un gran esfuerzo para pasar del concepto estático de los datos como propiedad personal a uno dinámico que considera los datos, incluidos los personales, como el elemento vital de la cuarta revolución industrial. Nos encontramos en la era de la inteligencia artificial, las máquinas inteligentes y el Internet de las Cosas. ¿Es posible que el RGPD pueda fortalecer la confianza de las personas protegiendo sus datos, incluso en el nuevo mundo de la IA?
Fuente: Amazon.it
