¿Qué es SSIS?
Servicio de integración de SQL Server (SSIS) es un componente del software de base de datos de Microsoft SQL Server que se puede utilizar para realizar una amplia gama de tareas de migración de datos. SSIS es una herramienta de almacenamiento de datos rápida y flexible que se utiliza para la extracción, carga y transformación de datos, como limpieza, agregación, fusión de datos, etc.
Facilita la transferencia de datos de una base de datos a otra. SSIS puede extraer datos de una amplia gama de fuentes, como bases de datos de SQL Server, archivos de Excel, bases de datos de Oracle y DB2, etc.
SSIS también incluye herramientas gráficas y de asistente para realizar funciones de flujo de trabajo como enviar mensajes de correo electrónico, operaciones FTP, fuentes de datos y destinos.
En este tutorial para principiantes de SSIS, aprenderá:
¿Por qué usamos SSIS?
Estas son algunas de las principales razones para usar la herramienta SSIS:
- La herramienta SSIS le ayuda a fusionar datos de diferentes almacenes de datos
- Automatice las funciones administrativas y la carga de datos
- Mercados de datos y almacenes de datos
- Te ayuda a limpiar y estandarizar datos
- Ingrese BI en un proceso de transformación de datos
- Automatice las funciones administrativas y la carga de datos
- SIS tiene una GUI que ayuda a los usuarios a convertir datos fácilmente en lugar de escribir programas grandes
- Puede cargar millones de capas de una fuente de datos a otra en cuestión de minutos.
- Identificar, capturar y procesar cambios en los datos.
- Coordinar el mantenimiento, procesamiento o análisis de datos
- SSIS elimina la necesidad de programadores duros
- SSIS proporciona un manejo robusto de errores y salidas
Historia del SIS
Anteriormente, se usaba SSIS, SQL Server, Data Transformation Services (DTS), que formaba parte de SQL Server 7 y 2000
Versión | Especificar |
SQL Server 2005 | El equipo de Microsoft decidió renovar DTS. Sin embargo, en lugar de actualizar las STD, decidieron nombrar los Servicios de integración de productos (SSIS). |
Versión del servidor SQL 2008 | Se han realizado muchas mejoras de rendimiento en SSIS. También se introdujeron nuevas fuentes. |
SQL Server 2012 | Fue el lanzamiento más grande de SSIS. Esta versión introdujo el concepto de modelo de implementación de proyectos. Permite proyectos completos y sus paquetes se implementan en un servidor, en lugar de paquetes separados. |
SQL Server 2014 | En esta versión, no se realizan muchos cambios en SSIS. Pero se agregaron nuevas fuentes o transformaciones que se realizaron a través de descargas separadas a través de CodePlex o mediante SQL Server Feature Pack. |
En SQL Server 2016 | La versión le permite implementar proyectos completos, en cambio, paquetes individuales. Hay fuentes adicionales, especialmente en la nube, y grandes fuentes de datos y se han realizado pocos cambios en el catálogo. |
Características notables de SSIS
A continuación, se muestran algunas características básicas básicas de SSIS:
- Entornos de estudio
- Funciones de integración de datos relevantes
- Velocidad de operación eficiente
- Estrecha integración con otra familia de Microsoft SQL
- Transformación de consultas de minería de datos
- Transformaciones de agrupación y búsqueda aproximada
- Extracción de términos y búsqueda de términos
- Componentes de conectividad de datos de mayor velocidad, como conectividad con SAP u Oracle
Arquitectura SSIS
Los siguientes son componentes de la arquitectura SSIS:
- Control de flujo (contenedores y tareas de almacenamiento)
- Flujo de datos (origen, destino, transformación)
- Controlador de eventos (envío de mensajes, correos electrónicos)
- Explorador de paquetes (ofrece una vista para todos en el paquete)
- Parámetros (interacción del usuario)
Entendemos cada componente en detalle:
1. Flujo controlado
El flujo controlado es el cerebro de un paquete SSIS. Le ayuda a organizar el orden de ejecución de todos sus componentes. Los componentes administrados con restricciones de prioridad contienen contenedores y tareas.
2. Limitaciones precedentes
Las restricciones de prioridad son un componente del paquete que dirige las tareas a realizar en un orden predefinido. También define el flujo de trabajo de todo el paquete SSIS. Controla la ejecución de las dos tareas vinculadas realizando las tareas de destino según el resultado de las reglas de asignación de negocios anteriores definidas mediante el uso de expresiones especiales.
3. Tarea
Una ‘Tarea’ es una sola unidad de trabajo. Es un método / función que se utiliza en un lenguaje de programación. En SSIS, sin embargo, no utiliza métodos de codificación. En su lugar, utilizará una técnica de arrastrar y soltar para diseñar y configurar superficies.
4. Contenedores
Los contenedores son unidades para agrupar tareas en unidades de trabajo. En lugar de ofrecer consistencia visual, le permite determinar variables y manejadores de salida que deberían estar dentro del alcance de ese contenedor específico.
Los siguientes son cuatro tipos de contenedores en SSIS:
- Contenedor de secuencia
- A Your Loop Container
- Contenedor de bucle Foreach
Contenedor de secuencia: le permite organizar subtareas agrupándolas y le permite ejecutar transacciones o asignar un registro al contenedor.
Para contenedor de bucle:Proporciona la misma funcionalidad que el contenedor de secuencias, excepto que le permite ejecutar las tareas una y otra vez. Sin embargo, se basa en una condición de evaluación, como un bucle de 1 a 100.
Para cada contenedor de bucle: También permite doblar. Pero la diferencia es que los archivos en una carpeta en lugar de usar la expresión de condición, se repiten en el bucle sobre una serie de cosas.
5. Flujo de datos
El uso principal de la herramienta SSIS es extraer datos de la memoria del servidor, modificarlos y escribirlos en otro destino. Si Control Flow es el cerebro, Data Flow es el núcleo de SSIS
6. Paquetes SSIS
Otra característica clave de SSIS es el concepto de paquete. Es una colección de tareas realizadas de manera ordenada. Aquí, las restricciones de un presidente ayudan a administrar el orden en el que realiza la tarea.
Un paquete puede ayudarlo a guardar archivos en SQL Server, en la base de datos msdb o en el catálogo de paquetes. Se puede guardar como un archivo .dtsx, que es un archivo estructurado que es muy similar a los archivos .rdl con Reporting Services.
7. Parámetros
Los parámetros variables se comportan con solo unas pocas excepciones clave. Se puede arreglar fácilmente fuera del paquete. Se puede nombrar como valores que se deben ingresar para que se inicie el paquete.
Tipos de tareas de SSIS
En la herramienta SSIS, puede agregar tareas para controlar el flujo. Hay diferentes tipos de tareas que realizan diferentes tipos de trabajo.
Algunas tareas importantes de SSIS se describen a continuación:
Nombre de la tarea | Suelte |
Ejecutar tarea SQL | Como su nombre lo indica, ejecutará una declaración SQL contra una base de datos relacional. |
Tarea de flujo de datos | Esta tarea puede leer datos de una o más fuentes. Transforme los datos cuando estén en la memoria y escríbalos en uno o más destinos. |
Tarea de procesamiento de servicios analíticos | Utilice esta tarea para procesar objetos de un modelo de tabla o como un cubo SSAS. |
Ejecutar tarea de paquete | El uso de esta tarea SSIS se puede utilizar para ejecutar otros paquetes dentro del mismo proyecto. |
Tarea de ejecución de procesos | Con la ayuda de esta tarea, puede especificar los parámetros de la línea de comandos. |
Tarea del sistema de archivos | Realiza manipulaciones en el sistema de archivos. Como mover, renombrar, borrar archivos y crear directorios. |
Tareas FTP | Le permite realizar funcionalidades básicas de FTP. |
Script de tareas | Esta es una tarea en blanco. Puede escribir código .NET que complete cualquier tarea; quieres hacer. |
Enviar tarea de correo electrónico | Puede enviar un correo electrónico para informar a los usuarios que su paquete está completo o que se produce algún error. |
Tarea de inserción masiva | El uso puede cargar datos en una tabla mediante el comando enter grande. |
Script de tareas | Ejecuta un conjunto de codificación VB.NET o C # dentro de un entorno de Visual Studio. |
Tarea de servicio web | Ejecuta un método en un servicio web. |
Tarea de supervisión de eventos de WMI | Esta tarea permite que el paquete SSIS espere y responda a ciertos eventos WMI. |
Tarea XML | Esta tarea le ayuda a fusionar, dividir o reformular cualquier archivo XML. |
Otras herramientas ETL importantes
- Servicios de datos de SAP
- Gestión de datos SAS
- Generador de almacenes de Oracle (OWB)
- PowerCenter Informatica
- Servidor de información de IBM Infosphere
- Repertorio Elixir para detalles ETL
- Flujo de datos Sargent
Ventajas y desventajas de usar SSIS
La herramienta SSIS ofrece los siguientes beneficios:
- Amplia documentación y soporte
- Fácil y rápida implementación
- Estrecha integración con SQL Server y Visual Studio
- Integración de datos estandarizados
- Ofrece capacidades basadas en mensajes en tiempo real
- Soporte para el modelo de distribución
- Le ayuda a eliminar la red como un cuello de botella para ingresar datos en SSIS en SQL
- SISS le permite utilizar Destination SQL Server en lugar de OLE DB para una carga de datos más rápida
Desventajas de SSIS
El uso de herramientas SIS tiene algunas desventajas:
- A veces crean problemas en entornos que no son de Windows
- Visión y estrategia poco claras
- SSIS no admite estilos de integración de datos alternativos
- Integración de problemas con otros productos
Ejemplo de buenas prácticas de SSIS
- SSIS es una canalización en la memoria. Por eso es importante asegurarse de que todas las transformaciones ocurran en la memoria.
- Intente minimizar las operaciones registradas
- Planifique un recurso entendiendo el uso de los recursos
- Optimice la transformación de la búsqueda, el origen de datos y el destino de SQL
- Programarlo y distribuirlo adecuadamente
Resumen
- La forma completa de SSIS es SQL Server Integration Services
- La herramienta SSIS le ayuda a fusionar datos de diferentes almacenes de datos
- Las versiones importantes del servicio de integración de SQL Server son 2005, 2008, 2012, 2014 y 216
- Los entornos de estudio, las funciones de integración de datos relevantes y la velocidad de ejecución eficiente son características importantes de SSIS
- El flujo de control, el flujo de datos, el controlador de eventos, el paquete del explorador y los parámetros son componentes esenciales de la arquitectura SSIS
- Contiene ejecución de tareas SQL, tarea de flujo de datos, tarea de procesamiento de Analysis Services, ejecución de tareas de paquete, tarea de proceso de proceso, tarea de sistemas de archivos, tareas de FTP, tarea de envío de correo electrónico, tarea de servicio web
- Amplia documentación y soporte
- La principal desventaja de SSIS es que no hay soporte para estilos alternativos de integración de datos.
- Servicios de datos SAP, gestión de datos SAS, Oracle Warehouse Builder (OWB), PowerCenter Informatica, IBM Infosphere Information Server
- SSIS es una canalización en la memoria. Por lo tanto, es necesario asegurarse de que todas las transformaciones ocurran en la memoria.