▷Big Data◁ es todo intercambio de información en las redes sociales implica inevitablemente su posterior procesamiento, análisis y uso activo por parte de las empresas. Se generan estadísticas. Cualquier dispositivo conectado envía material a los servidores centrales. Si los grandes datos son una tecnología, quienes lo emplean son sus recursos.
Principales características:
- Método de almacenamiento descentralizado
- Formato de estructuración de datos no convencional
- Datos semiestructurados
- Datos no estructurados
- Modelo horizontal de almacenamiento y procesamiento de datos
- Débil interconexión de elementos
Los beneficios de la tecnología de Big Data:
- El uso más racional de los recursos
- Estudio fundamental del perfil de la base de clientes
- Prevención del fraude y de los ataques de los hackers
Big Data se utiliza para la interacción en profundidad con el público objetivo. Así que la tecnología optimiza las operaciones y evita la amenaza de la piratería informática. En los últimos años, Google, Uber y Amazon han abierto cientos de puestos de trabajo para los científicos de datos.
Datos no estructurados
▷Big data◁ es una variedad de herramientas, enfoques y métodos para procesar datos estructurados y no estructurados con el fin de abordar metas y objetivos específicos.
Los datos no estructurados son los que residen en el depósito de una organización sin ninguna intención de organizarlos, estructurarlos o categorizarlos. Normalmente, el análisis de los datos no estructurados supone el análisis de cada uno de los objetos. Esto incluye documentos, archivos de medios e imágenes. El análisis de los datos no estructurados suele realizarse para buscar información, tendencias ocultas y relaciones dentro de los elementos del flujo de información.
componentes de Big Data
Aunque el término Big Data es relativamente nuevo, el proceso mismo de reunir y almacenar grandes volúmenes de información para su análisis posterior cobró impulso a principios del año 2000, cuando el analista de la industria Doug Laney formuló una definición básica de los componentes de Big Data:
- Volumen. Las organizaciones reúnen datos de diversas fuentes, entre ellas las transacciones comerciales y los medios de comunicación social. En el pasado, el almacenamiento habría sido un problema, pero las nuevas tecnologías (como el Hadoop) lo han facilitado.
Hadoop es un conjunto de utilidades, bibliotecas y con un marco de trabajo para desarrollar y ejecutar programas de computación distribuidos.
En la siguiente conferencia uno de nuestros expertos explica el siguiente tema: Hadoop el motor core de la evolución al big data
- Velocidad. Los datos llegan a una velocidad sin precedentes y deben ser procesados a tiempo. Las etiquetas RFID, los sensores y las mediciones inteligentes impulsan la necesidad de procesar los flujos de datos en tiempo real.
- Variedad. Los datos se presentan en todo tipo de formatos, desde datos numéricos estructurados en bases de datos tradicionales hasta documentos de texto no estructurados, correo electrónico, vídeo, audio, datos bursátiles y transacciones financieras.
Nuevas dimensiones
Se considera dos dimensiones adicionales de la información de Big data:
- Variabilidad. Además de aumentar la velocidad y la diversidad de los datos, las corrientes de datos pueden estar muy desincronizadas con los picos regulares. Los picos de datos diarios, estacionales y basados en eventos pueden ser difíciles de manejar. Especialmente si se trata de datos no estructurados.
- Complejidad. Los datos actuales provienen de múltiples fuentes. Esto dificulta la vinculación y transformación de los mismos a través de los sistemas.
¿Quiere saber más sobre Big Data? Revise nuestro Máster Big Data Analytics