Saltar al contenido

Tutorial de SSIS para principiantes: qué, arquitectura, paquetes

¿Qué es SSIS?

Servicio de integración de SQL Server (SSIS) es un componente del software de base de datos de Microsoft SQL Server que se puede utilizar para realizar una amplia gama de tareas de migración de datos. SSIS es una herramienta de almacenamiento de datos rápida y flexible que se utiliza para la extracción, carga y transformación de datos, como limpieza, agregación, fusión de datos, etc.

Facilita la transferencia de datos de una base de datos a otra. SSIS puede extraer datos de una amplia gama de fuentes, como bases de datos de SQL Server, archivos de Excel, bases de datos de Oracle y DB2, etc.

SSIS también incluye herramientas gráficas y de asistente para realizar funciones de flujo de trabajo como enviar mensajes de correo electrónico, operaciones FTP, fuentes de datos y destinos.

En este tutorial para principiantes de SSIS, aprenderá:

¿Por qué usamos SSIS?

Estas son algunas de las principales razones para usar la herramienta SSIS:

Historia del SIS

Anteriormente, se usaba SSIS, SQL Server, Data Transformation Services (DTS), que formaba parte de SQL Server 7 y 2000

VersiónEspecificar
SQL Server 2005El equipo de Microsoft decidió renovar DTS. Sin embargo, en lugar de actualizar las STD, decidieron nombrar los Servicios de integración de productos (SSIS).
Versión del servidor SQL 2008Se han realizado muchas mejoras de rendimiento en SSIS. También se introdujeron nuevas fuentes.
SQL Server 2012Fue el lanzamiento más grande de SSIS. Esta versión introdujo el concepto de modelo de implementación de proyectos. Permite proyectos completos y sus paquetes se implementan en un servidor, en lugar de paquetes separados.
SQL Server 2014En esta versión, no se realizan muchos cambios en SSIS. Pero se agregaron nuevas fuentes o transformaciones que se realizaron a través de descargas separadas a través de CodePlex o mediante SQL Server Feature Pack.
En SQL Server 2016La versión le permite implementar proyectos completos, en cambio, paquetes individuales. Hay fuentes adicionales, especialmente en la nube, y grandes fuentes de datos y se han realizado pocos cambios en el catálogo.

Características notables de SSIS

A continuación, se muestran algunas características básicas básicas de SSIS:

Arquitectura SSIS

Arquitectura SSIS

Los siguientes son componentes de la arquitectura SSIS:

Entendemos cada componente en detalle:

1. Flujo controlado

El flujo controlado es el cerebro de un paquete SSIS. Le ayuda a organizar el orden de ejecución de todos sus componentes. Los componentes administrados con restricciones de prioridad contienen contenedores y tareas.

2. Limitaciones precedentes

Las restricciones de prioridad son un componente del paquete que dirige las tareas a realizar en un orden predefinido. También define el flujo de trabajo de todo el paquete SSIS. Controla la ejecución de las dos tareas vinculadas realizando las tareas de destino según el resultado de las reglas de asignación de negocios anteriores definidas mediante el uso de expresiones especiales.

3. Tarea

Una ‘Tarea’ es una sola unidad de trabajo. Es un método / función que se utiliza en un lenguaje de programación. En SSIS, sin embargo, no utiliza métodos de codificación. En su lugar, utilizará una técnica de arrastrar y soltar para diseñar y configurar superficies.

4. Contenedores

Los contenedores son unidades para agrupar tareas en unidades de trabajo. En lugar de ofrecer consistencia visual, le permite determinar variables y manejadores de salida que deberían estar dentro del alcance de ese contenedor específico.

Los siguientes son cuatro tipos de contenedores en SSIS:

Contenedor de secuencia: le permite organizar subtareas agrupándolas y le permite ejecutar transacciones o asignar un registro al contenedor.

Para contenedor de bucle:Proporciona la misma funcionalidad que el contenedor de secuencias, excepto que le permite ejecutar las tareas una y otra vez. Sin embargo, se basa en una condición de evaluación, como un bucle de 1 a 100.

Para cada contenedor de bucle: También permite doblar. Pero la diferencia es que los archivos en una carpeta en lugar de usar la expresión de condición, se repiten en el bucle sobre una serie de cosas.

5. Flujo de datos

El uso principal de la herramienta SSIS es extraer datos de la memoria del servidor, modificarlos y escribirlos en otro destino. Si Control Flow es el cerebro, Data Flow es el núcleo de SSIS

6. Paquetes SSIS

Otra característica clave de SSIS es el concepto de paquete. Es una colección de tareas realizadas de manera ordenada. Aquí, las restricciones de un presidente ayudan a administrar el orden en el que realiza la tarea.

Un paquete puede ayudarlo a guardar archivos en SQL Server, en la base de datos msdb o en el catálogo de paquetes. Se puede guardar como un archivo .dtsx, que es un archivo estructurado que es muy similar a los archivos .rdl con Reporting Services.

7. Parámetros

Los parámetros variables se comportan con solo unas pocas excepciones clave. Se puede arreglar fácilmente fuera del paquete. Se puede nombrar como valores que se deben ingresar para que se inicie el paquete.

Tipos de tareas de SSIS

En la herramienta SSIS, puede agregar tareas para controlar el flujo. Hay diferentes tipos de tareas que realizan diferentes tipos de trabajo.

Algunas tareas importantes de SSIS se describen a continuación:

Nombre de la tareaSuelte
Ejecutar tarea SQLComo su nombre lo indica, ejecutará una declaración SQL contra una base de datos relacional.
Tarea de flujo de datosEsta tarea puede leer datos de una o más fuentes. Transforme los datos cuando estén en la memoria y escríbalos en uno o más destinos.
Tarea de procesamiento de servicios analíticosUtilice esta tarea para procesar objetos de un modelo de tabla o como un cubo SSAS.
Ejecutar tarea de paqueteEl uso de esta tarea SSIS se puede utilizar para ejecutar otros paquetes dentro del mismo proyecto.
Tarea de ejecución de procesosCon la ayuda de esta tarea, puede especificar los parámetros de la línea de comandos.
Tarea del sistema de archivosRealiza manipulaciones en el sistema de archivos. Como mover, renombrar, borrar archivos y crear directorios.
Tareas FTPLe permite realizar funcionalidades básicas de FTP.
Script de tareasEsta es una tarea en blanco. Puede escribir código .NET que complete cualquier tarea; quieres hacer.
Enviar tarea de correo electrónicoPuede enviar un correo electrónico para informar a los usuarios que su paquete está completo o que se produce algún error.
Tarea de inserción masivaEl uso puede cargar datos en una tabla mediante el comando enter grande.
Script de tareasEjecuta un conjunto de codificación VB.NET o C # dentro de un entorno de Visual Studio.
Tarea de servicio webEjecuta un método en un servicio web.
Tarea de supervisión de eventos de WMIEsta tarea permite que el paquete SSIS espere y responda a ciertos eventos WMI.
Tarea XMLEsta tarea le ayuda a fusionar, dividir o reformular cualquier archivo XML.

Otras herramientas ETL importantes

Ventajas y desventajas de usar SSIS

La herramienta SSIS ofrece los siguientes beneficios:

Desventajas de SSIS

El uso de herramientas SIS tiene algunas desventajas:

Ejemplo de buenas prácticas de SSIS

Resumen