¿Qué es la indexación?
Indexación Es una técnica de estructura de datos que le permite recuperar rápidamente registros de un archivo de base de datos. El índice es una tabla pequeña con solo dos columnas. La primera columna contiene una copia de una clave principal o clave candidata de tabla. La segunda columna contiene un conjunto de consejos para mantener la dirección del bloque de disco donde se almacena ese valor específico especificado.
Índice –
- Toma una clave de búsqueda como entrada
- Devuelve efectivamente una colección de registros coincidentes.
En este tutorial de indexación de DBMS, aprenderá:
Tipos indexados
La indexación se define en la base de datos en función de sus atributos de indexación. Hay dos tipos principales de métodos de indexación:
- Indexación primaria
- Indexación secundaria
Índice primario
El índice primario es un archivo de comando de tamaño fijo con dos campos. El primer campo contiene la misma clave primaria y el segundo, ese bloque de datos específico está archivado. En el índice principal, las entradas de la tabla de índice siempre tienen una relación de uno a uno.
La indexación principal en DBMS también se divide en dos tipos.
Índice de densidad
En un índice compacto, se crea un registro para cada clave de búsqueda valorada en la base de datos. Esto le ayuda a buscar más rápido, pero requiere más espacio para almacenar registros de índice. En esta indexación, los registros de método contienen el valor de la clave de búsqueda y los puntos con el registro real en el disco.
Índice delgado
Es un registro de índice que solo muestra algunos de los valores del archivo. Thin Index le ayuda a resolver problemas densos de indexación en DBMS. En este método de técnica de indexación, un rango de columnas de índice almacena la misma dirección de bloque de datos, y cuando es necesario recuperar datos, se obtiene la dirección de bloque.
Sin embargo, Thin Index almacena registros de índice solo para varios valores de clave de búsqueda. Requiere menos espacio, menos gastos de mantenimiento para instalar y elimina, pero es más lento en comparación con el índice compacto para encontrar registros.
A continuación se muestra un índice de base de datos de muestra del Thin Index
Índice secundario
El índice secundario en un DBMS se puede generar con un campo que tiene un valor único para cada registro y debe ser una clave candidata. También se denomina índice no agrupado.
Esta técnica de indexación de base de datos de dos niveles se utiliza para reducir la cantidad de mapeo de primer nivel. Para el primer nivel, se elige una amplia gama de números debido a esto; la cantidad de mapeo siempre es pequeña.
Ejemplo de indexación secundaria
Entendemos la indexación secundaria con un ejemplo de índice de base de datos:
En una base de datos de cuentas bancarias, acc_no almacena datos secuencialmente; es posible que desee obtener cada cuenta en una sucursal separada del banco ABC.
Aquí, puede tener un índice secundario en DBMS para cada clave de búsqueda. Un registro de índice es un punto de registro para un depósito que contiene pistas para todos los registros que tienen su valor de clave de búsqueda específico.
Índice de agrupamiento
En un índice agrupado, los propios registros se almacenan en el índice y no en pistas. A veces, el índice se crea en columnas de clave no principal que no serían únicas para cada registro. En tal caso, puede agrupar dos o más columnas para obtener los valores únicos y crear un índice llamado Índice agrupado. Esto le ayuda a identificar el registro más rápidamente.
Ejemplo:
Suponemos que una empresa ha contratado a muchos empleados en varios departamentos. En este caso, se debe crear una indexación agrupada en DBMS para todos los empleados que pertenecen al mismo departamento.
Se considera en un solo grupo y los puntos de índice se centran en el grupo como un todo. Aquí, Department _no es una clave no única.
¿Qué es un índice multinivel?
La indexación multinivel se crea en la base de datos cuando un índice base no coincide con la memoria. En este tipo de método de indexación, puede reducir la cantidad de acceso al disco para acortar cualquier registro y mantenerlo en el disco como un archivo secuencial y crear una base delgada en ese archivo.
Índice de árbol B
El índice de árbol B es la estructura de datos más utilizada para la indexación basada en árboles en DBMS. La indexación basada en árboles es un formato multiformato en la técnica DBMS con árboles de búsqueda binarios equilibrados. Cada nodo de la hoja del árbol B muestra pistas de datos reales.
Además, todos los nodos de hoja están entrelazados con una lista de enlaces, lo que permite que el árbol B admita acceso aleatorio y secuencial.
- Los nodos principales deben tener entre 2 y 4 valores.
- Casi todos los caminos desde la raíz hasta la hoja tienen la misma longitud.
- Los nodos no hoja distintos del nodo raíz tienen entre 3 y 5 nodos secundarios.
- Cada nodo que no es una raíz o una hoja tiene entre n / 2]yn hijos.
Ventajas de la indexación
Los importantes beneficios / ventajas de la indexación son:
- Le ayuda a reducir el número total de operaciones de E / S necesarias para recuperar esos datos, por lo que no necesita acceder a una cadena en la base de datos desde una estructura de índice.
- Ofrece una búsqueda y recuperación de datos más rápida para los usuarios.
- La indexación le ayuda a reducir el espacio de la tabla porque no es necesario que se vinculen juntos en una tabla, ya que no es necesario almacenar el ROWID en el índice. Así podrás reducir el espacio de la mesa.
- No puede ordenar los datos en los nodos principales, ya que están clasificados por el valor de la clave principal.
Desventajas de la indexación
Las desventajas / desventajas importantes de la indexación son:
- Para indexar el sistema de administración de la base de datos, necesita una clave principal en la tabla con un valor único.
- No puede realizar ningún otro índice en la base de datos sobre los datos indexados.
- No se le permite particionar una tabla de índice.
- Indexación SQL Reduce el rendimiento en INSERT, DELETE y UPDATE.
Resumen:
- La indexación es una pequeña tabla que consta de dos columnas.
- Los dos tipos principales de métodos de indexación son 1) Indexación primaria 2) Indexación secundaria.
- El índice primario es un archivo de comando de tamaño fijo con dos campos.
- La indexación primaria se divide a su vez en dos tipos 1) Índice de densidad 2) Índice delgado.
- En un índice compacto, se crea un registro para cada clave de búsqueda valorada en la base de datos.
- El método de indexación fina le ayuda a resolver problemas densos de indexación.
- El índice secundario es un método de indexación en un DBMS que especifica su clave de búsqueda de comando que es diferente del orden secuencial del archivo.
- Un índice agrupado se define como un archivo de datos de línea de comandos.
- La indexación multinivel se crea cuando un índice principal no coincide con la memoria.
- La mayor ventaja de la indexación es que le ayuda a reducir la cantidad total de operaciones de E / S necesarias para recuperar esos datos.
- La principal desventaja del funcionamiento del sistema de gestión de bases de datos indexadas es que necesita una clave principal en la mesa con un valor único.