Saltar al contenido

¿Qué son los GRANDES DETALLES? Introducción, tipos, características, ejemplo

Antes de presentar Big Data, primero debe saber

¿Qué son los datos?

Las cantidades, caracteres o símbolos en los que una computadora realiza operaciones, que pueden almacenarse y transmitirse en forma de señales eléctricas y registrarse en soportes de grabación magnéticos, ópticos o mecánicos.

Ahora, aprendamos la introducción de Big Data

¿Qué es Big Data?

Big Data Es una recopilación de datos de gran tamaño, pero que crece exponencialmente con el tiempo. Son datos de tal tamaño y complejidad que ninguna de las herramientas tradicionales de administración de datos puede almacenarlos o procesarlos de manera eficiente. Big data también son datos pero con una gran cantidad.

En este tutorial, aprenderá,

Ejemplos de datos grandes

Los siguientes son algunos ejemplos de Big Data:

El es Bolsa de Nueva York genera aprox. un terabyte nuevos datos comerciales por día.

Medios de comunicación social

Esa estadística muestra 500+ terabytes ingerir nuevos datos en las bases de datos de sitios de redes sociales Facebook, cada día. Estos datos se generan principalmente en términos de carga de fotos y videos, intercambio de mensajes, envío de comentarios, etc.

Un solo Motor a reacción puede generar 10+ terabytes detalles i 30 minutos del tiempo de vuelo. Con muchos miles de vuelos por día, la generación de datos llega a muchos Petabytes.

Tipos de Big Data

Los tipos de Big Data son los siguientes:

  1. Estructurado
  2. No estructurado
  3. Semiestructurada

Estructurado

Cualquier dato que se pueda almacenar, acceder y procesar en un formato fijo se denomina datos «estructurados». Con el tiempo, el talento de las ciencias de la computación se ha vuelto más exitoso en el desarrollo de técnicas para trabajar y extraer valor de dichos datos (donde el formato es bien conocido de antemano). Hoy, sin embargo, esperamos problemas en los que cuando la cantidad de dichos datos crece exponencialmente, los volúmenes típicos aumentan entre varios zettabytes.

¿Lo sabías? 1021 medidas igual a 1 zettabyte o mil millones de terabytes formas un zettabyte.

Al observar estas cifras, es fácil comprender por qué se llama Big Data e imaginar los desafíos de su almacenamiento y procesamiento.

¿Lo sabías? Un ejemplo de esto son los datos almacenados en un sistema de gestión de bases de datos relacionales. ‘estructurado’ detalles.

Ejemplos de datos estructurados

Un ejemplo de datos estructurados es una tabla ‘Empleado’ en una base de datos

ID de empleado Nombre de empleado Inscne Departamento Salary_In_lacs
2365Rajesh KulkarniMasculinoFinanzas650000
3398Pratibha JoshiMujeresAdministración650000
7465Shushil RoyMasculinoAdministración500000
7500Das ShubhojitMasculinoFinanzas500000
7699Priya SaneMujeresFinanzas550000

No estructurado

Cualquier dato que no sea anónimo o la estructura se clasifica como datos no estructurados. Además de tener un tamaño enorme, los datos no estructurados plantean varios desafíos en términos de su procesamiento para extraer valor. Un ejemplo típico de datos no estructurados es una fuente de datos heterogénea que consiste en una combinación de archivos de texto simples, imágenes, videos, etc. Las organizaciones de día ahora tienen una gran cantidad de datos disponibles, pero desafortunadamente no saben cómo valorarlos, ya que estos datos están en formato sin procesar o no estructurado.

Ejemplos de datos no estructurados

Salida devuelta por «Búsqueda de Google»

Semiestructurada

Los datos semiestructurados pueden ser ambas formas de datos. Podemos ver los datos semiestructurados como una forma estructurada, pero en realidad no están definidos, por ejemplo, por una definición de tabla relativa. DBMS. Un ejemplo de datos semiestructurados son los datos que se muestran en un archivo XML.

Ejemplos de datos semiestructurados

Datos personales almacenados en un archivo XML

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Crecimiento de datos a lo largo de los años

Tenga en cuenta que Aplicación web datos, que no están estructurados, que consisten en archivos de registro, archivos de historial de transacciones, etc. Los sistemas OLTP están diseñados para trabajar con datos estructurados en los que los datos se almacenan en relaciones (tablas).

Características de Big Data

Los macrodatos se pueden describir de acuerdo con las siguientes características:

(i) Volumen – El nombre de Big Data en sí está asociado con una gran cantidad. El tamaño de los datos juega un papel muy importante en la determinación del valor de los datos. También depende de si determinados datos se pueden considerar como Big Data o no, en función del tamaño de los datos. Por eso, ‘Volumen’ Una característica que debe tenerse en cuenta cuando se trata de Big Data.

(ii) Diversidad – La siguiente característica de Big Data es una diversidad.

La variedad se refiere a fuentes heterogéneas y la naturaleza de los datos, tanto estructurados como no estructurados. En días anteriores, las hojas de cálculo y las bases de datos eran las únicas fuentes de datos consideradas por la mayoría de las aplicaciones. Hoy en día, los datos en forma de correos electrónicos, fotos, videos, dispositivos de monitoreo, PDF, audio, etc. se están considerando en las aplicaciones de análisis. Esta diversidad de datos no estructurados crea problemas particulares en el almacenamiento, la minería y el análisis de datos.

(iii) Velocidad – El termino ‘velocidad’ se refiere a la velocidad de generación de datos. Determina qué tan rápido se generan y procesan los datos para satisfacer las demandas, potencial real en los datos.

Big Data Velocity se ocupa de la velocidad a la que fluyen los datos de fuentes como procesos comerciales, registros de aplicaciones, redes y sitios de redes sociales, sensores, Móvil dispositivos, etc. El flujo de datos es enorme y continuo.

(iv) Variabilidad – Esto se refiere a la inconsistencia que a veces pueden mostrar los datos, lo que interrumpe el proceso de poder manejar y administrar los datos de manera efectiva.

Beneficios del procesamiento de Big Data

La capacidad de procesar Big Data tiene numerosos beneficios, como:

El acceso a los datos sociales de los motores de búsqueda y de sitios como Facebook, Twitter permite a las organizaciones perfeccionar sus estrategias comerciales.

Los nuevos sistemas diseñados con tecnologías de Big Data están reemplazando los sistemas tradicionales de retroalimentación de los clientes. En estos nuevos sistemas, se están utilizando tecnologías de procesamiento de Big Data y lenguaje natural para leer y evaluar las respuestas de los consumidores.

Las tecnologías de Big Data se pueden utilizar para crear un área de escenario o una zona de aterrizaje para nuevos datos antes de identificar los datos que deben transferirse al almacén de datos. Además, dicha integración de Big Data y tecnologías de almacenamiento de datos ayuda a una organización a descargar datos a los que no se accede con frecuencia.

Resumen

  • Definición de Big Data: Big Data se define como datos de gran tamaño. Bigdata es un término que se utiliza para describir una colección de datos que tiene un tamaño enorme pero que sigue creciendo exponencialmente con el tiempo.
  • Los ejemplos de análisis de Big Data incluyen bolsas de valores, sitios de redes sociales, motores a reacción, etc.
  • Big Data podría ser 1) estructurado, 2) no estructurado, 3) semiestructurado
  • El volumen, la variedad, la velocidad y la variabilidad son algunas características de Big Data
  • Bigdata tiene pocos beneficios de un mejor servicio al cliente, una mejor eficiencia operativa, una mejor toma de decisiones

Entradas relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *