By Diana Cortés Pérez on Martes, 14 Diciembre 2021
Category: TECNOLOGÍA

¿Qué es el Data Science?

El Data Science o la ciencia de los datos es una rama de la informática que se ocupa de los datos: recopilarlos, procesarlos, analizarlos y encontrar soluciones eficaces en base a ellos. Los especialistas en este campo se llaman científicos de datos e intervienen en la ciencia y la empresa.

Los científicos de datos recogen datos no estructurados, los analizan con modelos matemáticos y sacan conclusiones. Los objetivos de la ciencia de los datos son: confirmar hipótesis, predecir, encontrar patrones, proponer cambios en los procesos empresariales.

La ciencia de los datos es un campo interdisciplinar: los científicos de datos deben saber matemáticas y estadística, programar y trabajar con bases de datos y comprender la estructura de las empresas.

En qué consiste el Data Science en términos sencillos: Un banco tiene millones de usuarios que hacen compras cada día pagando con el smartphone o con la tarjeta. Los datos de compra pueden ser recogidos y analizados. Los resultados del análisis mejorarán el rendimiento del banco, aumentarán sus ingresos y ofrecerán a los clientes útiles recomendaciones personalizadas. Por ejemplo, los descuentos para socios que compran con frecuencia artículos deportivos o los seguros de viaje para los que compran con frecuencia en el extranjero.

Hitos del Data Science

La ciencia de los datos es un campo joven. El término apareció por primera vez en el mundo académico en 2001 y se extendió en 2008 gracias a los mejores científicos de datos de Facebook y LinkedIn. Para entonces, los gigantes de la informática habían atraído a cientos de millones de usuarios a sus productos y se dieron cuenta de que los grandes datos sobre su comportamiento podían beneficiar a las empresas y a la industria de Internet en su conjunto.

Prácticamente de forma inmediata, la ciencia de los datos se convirtió en el campo más prometedor de la informática. Ya en 2009, el economista de Google Hal Varian afirmaba que las habilidades relacionadas con los datos se convertirían para las próximas décadas en una destreza extremadamente importante.

En efecto, el mercado mundial de las empresas de ciencia de datos crece a un ritmo medio del 12% anual. Solo en 2020, la demanda de científicos de datos aumentó un 50%.

El funcionamiento del Data Science

La forma en que el Data Science trabaja con los datos puede describirse como un ciclo de cinco pasos:

  1. Recolección. En cada etapa, determine el alcance y la estructura de los datos y recójalos de forma procesable. Decida el objetivo del análisis de datos y seleccione los métodos adecuados para las siguientes etapas.
  2. Preparación. Esto incluye la creación de la arquitectura de la base de datos y su sistema de almacenamiento, la comprobación y la limpieza de valores irrelevantes (validación).
  3. Procesamiento. Esta fase implica la agrupación y clasificación (división en muestras y grupos), modelos matemáticos y técnicas de software, por ejemplo, el aprendizaje automático.
  4. Análisis. El científico de datos examina los resultados de la simulación y busca respuestas a las hipótesis iniciales, realiza análisis cualitativos y cuantitativos. Por ejemplo, encuentra errores en los procesos empresariales o predice el comportamiento futuro de los datos.
  5. Comunicación. Contempla la visualización de los datos, la creación de informes analíticos y las sugerencias, es decir, las decisiones que pueden tomarse a partir de los datos para que la empresa funcione de forma más eficiente.

Profesiones relacionadas con Data Science

Además de los científicos de datos, hay otras profesiones relacionadas con el big data.

El ingeniero de datos, por su parte, es un profesional que recopila datos de diferentes fuentes, los limpia y los entrega de forma adecuada a los analistas y científicos de datos.

ML Engineer, un ingeniero de aprendizaje automático (machine learning) es un experto en inteligencia artificial. Se encarga de "empaquetar" el modelo en un producto acabado.

Los propios científicos de datos tienen especializaciones como la minería de datos (data mining), la visión por computadora, la síntesis y el reconocimiento del habla, los sistemas de recomendación, etc.

Leave Comments