Saltar al contenido

Utilice el aprendizaje automático para enriquecer los datos de los empleados con la interfaz de usuario Swagger

También puede utilizar Document Information Extract para enriquecer la información extraída de los documentos con sus propios registros de datos maestros. Puede, por ejemplo, hacer coincidir entidades de datos enriquecidas, como ID de empleados, con el documento. Campos de encabezado de extracto, como contactos del receptor.

Al enriquecer los datos con la extracción de información de documentos, utiliza 2 tipos de entidades que encuentra en los documentos comerciales. El es business entity representa diferentes tipos de organizaciones con las que trata como empresa. Puede representar, por ejemplo, proveedores y clientes. El es employee entity representa a un empleado en la empresa.

Al completar este tutorial, habrá explorado toda la funcionalidad de la API de datos para crear, actualizar, enumerar y eliminar datos enriquecidos utilizando el employee entity mas o menos. Mira Documentación de la API de enriquecimiento de documentos.


Paso 1: crea un cliente

Después de completar el paso 1 del tutorial Aprenda a usar una máquina para extraer información de documentos con la interfaz de usuario de Swagger para acceder y autorizar la extracción de información de documentos de la interfaz de usuario de Swagger, debe crear un cliente. Este cliente se utiliza en la mayoría de los puntos finales para diferenciar y separar datos.

Puede crear un cliente único o varios en el pagar la carga el campo POST / cliente punto final. El es clientId los valores creados aquí se utilizarán en otros puntos finales de servicio.

  1. Ampliar la POST / cliente punto final.

  2. Hacer clic Pregunta a E.

  3. Entra tu clientId y clientName valores en el carga salarial campo en el formato que ves en Ejemplos de parámetro de carga útil (c_27 y client 27, por ejemplo).

  4. Hacer clic Ejecución.

Debería recibir una respuesta de la siguiente manera:

DOX

CAMBIO:

Tenga en cuenta las limitaciones de la siguiente cuenta de prueba de extracción de información de documentos:

  • Máximo de 40 páginas de documentos cargados por semana (los documentos pueden tener más de 1 página)

  • Máximo 1 creado clientId

  • Enriquecimiento 10 máximo probado dataIds

Hecho

Inicie sesión para responder la pregunta

Paso 2: crear datos enriquecidos

Utilizar el POST / detalles / trabajos endpoint para agregar sus propios registros de datos maestros a la base de datos para enriquecer la información extraída de los documentos.

  1. Ampliar la POST / detalles / trabajos punto final.

  2. Hacer clic Pregunta a E.

  3. Defina los datos en el payload campo, para que el sistema sepa qué campo de extracción (utilizando, por ejemplo, el ID de empleado de los datos maestros) debe enriquecerse.

    {
       "value":[
          {
             "id":"E0001",
             "email":"",
             "firstName":"Linda",
             "middleName":"",
             "lastName":"Owens"
          },
          {
             "id":"E0002",
             "email":"",
             "firstName":"Lin",
             "middleName":"",
             "lastName":"Owens"
          }
       ]
    }
    
  4. Seleccione los datos enriquecidos type employee.

  5. Entra tu clientId (creado en el paso anterior).

  6. Hacer clic Ejecución.

DOX

¿Que pasó exactamente?

En este ejemplo, en payload campo, algunos registros de datos maestros (nombre completo e ID, por ejemplo) se proporcionan de 2 empleados (Linda Owens y Lin Owens), de modo que esta información adicional se puede agregar al documento que los campos se eliminan cuando la información coincide.

Debería recibir una respuesta de la siguiente manera con el estado MIRANDO:

DOX

Copia el id desde el Cuerpo de respuesta para ver el resultado del estado de enriquecimiento de datos en el siguiente paso.

Paso 3: ver el estado de creación de datos enriquecidos

Utilizar el GET / data / Jobs / {id} endpoint para ver el estado de los datos de enriquecimiento cargados.

  1. Ampliar la GET / data / Jobs / {id} punto final.

  2. Hacer clic Pregunta a E.

  3. Introducir el id encontrado en el POST / detalles / trabajos punto final como el id.

  4. Hacer clic Ejecución.

DOX

Debería recibir una respuesta con el estado de ÉXITO de la siguiente manera:

DOX

¿Que pasó exactamente?

El es refreshedAt un parámetro indica cuándo se renovaron por última vez los datos enriquecidos del trabajo. Cuando la respuesta nulo, significa que los datos enriquecidos aún no se han actualizado.
Los datos enriquecidos se actualizan automáticamente cada 4 horas. Pueden pasar hasta 4 horas hasta que la predicción de datos enriquecidos esté disponible en la respuesta.

Hecho

Inicie sesión para responder la pregunta

Paso 4: crea una configuración

Configure la activación de datos en manual, en lugar de la actualización automática predeterminada de los datos enriquecidos que ocurre cada 4 horas.

  1. Ampliar la POST / configuración punto final.

  2. Hacer clic Pregunta a E.

  3. Ingrese lo siguiente en el payload Gort:

    {
      "value": {
        "manualDataActivation":"true"
      }
    }  
    
  4. Hacer clic Ejecución.

DOX

Debería recibir una respuesta de la siguiente manera:

DOX

Hecho

Inicie sesión para responder la pregunta

Paso 5: crear la activación de datos

Cree un registro de trabajo de activación de datos para ver datos enriquecidos nuevos o actualizados en los resultados extraídos. Solo los datos de enriquecimiento activados se agregarán a los resultados extraídos.

  1. Ampliar la POST / datos / activación punto final.

  2. Hacer clic Pregunta a E.

  3. Hacer clic Ejecución.

DOX

Debería recibir una respuesta de la siguiente manera:

DOX

Si ya ha utilizado este punto final recientemente, debería recibir una respuesta de la siguiente manera:

DOX

Espere a que sea posible la siguiente activación de datos para repetir este paso antes de continuar con el paso 6.

Hecho

Inicie sesión para responder la pregunta

Paso 6: cargue un documento para obtener una predicción con datos enriquecidos

La extracción de información de documentos utiliza un modelo de aprendizaje automático preentrenado en todo el mundo que actualmente obtiene mejores resultados de precisión con facturas y consejos de pago en los idiomas enumerados en Idiomas y países admitidos. El equipo está trabajando para admitir tipos de documentos e idiomas adicionales en un futuro próximo.

Cuando se cargan datos enriquecidos y coinciden con ciertas predicciones, se agregan a los resultados de GET / document / posts / {id} punto final. Para que los datos se enriquezcan en el pronóstico, debe tener lo siguiente en la consulta del POST / documento / publicaciones punto final (normalmente ya existente de forma predeterminada):

"enrichment": {
    "sender": {
      "top": 5,
      "type": "businessEntity",
      "subtype": "supplier"
    },
    "employee": {
      "type": "employee"
    }
}

Haz lo siguiente:

  1. Ampliar la POST / documento / publicaciones punto final.

  2. Hacer clic Pregunta a E.

  3. Botón derecho del ratón Factura de muestra 2, luego haga clic en Guardar enlace como para descargar el archivo de documento para esta muestra de enriquecimiento de datos de empleados localmente.

    También puede cargar al servicio y enriquecer cualquier archivo de documento en formato PDF o PNG y JPEG de una sola página que contenga contenido en encabezados y tablas, como una factura. En este caso, asegúrese de que los datos que defina estén en el payload El campo, en el paso 2, coincide con los campos de su documento.

  4. Cargue el archivo del documento que desea enriquecer.

  5. I opciones, ingrese la lista de campos que se eliminarán del archivo cargado (documentNumber, taxId, purchaseOrderNumber, shippingAmount, netAmount, senderAddress, senderName, grossAmount, por ejemplo), el ID de cliente que creó en el paso 1 (c_27, por ejemplo), el tipo de documento (invoice, por ejemplo), receivedDate (2020-02-17, por ejemplo) y el tipo de datos enriquecidos employee.

    {
       "extraction":{
          "headerFields":[
             "barcode",
             "documentNumber",
             "taxId",
             "taxName",
             "purchaseOrderNumber",
             "shippingAmount",
             "netAmount",
             "grossAmount",
             "currencyCode",
             "receiverContact",
             "documentDate",
             "taxAmount",
             "taxRate",
             "receiverName",
             "receiverAddress",
             "receiverTaxId",
             "deliveryDate",
             "paymentTerms",
             "deliveryNoteNumber",
             "senderBankAccount",
             "senderAddress",
             "senderName",
             "dueDate",
             "discount"
          ],
          "lineItemFields":[
             "description",
             "netAmount",
             "quantity",
             "unitPrice",
             "materialNumber",
             "unitOfMeasure"
          ]
       },
       "clientId":"c_27",
       "documentType":"invoice",
       "receivedDate":"2020-02-17",
       "enrichment":{
          "employee":{
             "type":"employee"
          }
       }
    }
    
  6. Hacer clic Ejecución.

La aplicación debe leer:

DOX

Y así es como se ve la respuesta:

DOX

Copia el id desde el Cuerpo de respuesta para obtener predicciones de datos enriquecidos en el siguiente paso.

Hecho

Inicie sesión para responder la pregunta

Paso 7: obtenga una predicción de datos enriquecida

Cuando se cargan datos enriquecidos y coinciden con ciertas predicciones, se agregan a los resultados de GET / document / posts / {id} punto final.

Los datos enriquecidos se actualizan automáticamente cada 4 horas. Pueden pasar hasta 4 horas hasta que la predicción de datos enriquecidos esté disponible en la respuesta. Si la predicción de datos de enriquecimiento no está disponible en la respuesta en su primer intento, repita los pasos 4 y 5. (varias horas después). No realice los pasos 7 y 8 hasta que vea la predicción de enriquecimiento de datos en la respuesta del paso 5.

  1. Ampliar la GET / document / posts / {id} punto final.

  2. Hacer clic Pregunta a E.

  3. Colocar returnNullValues y extractedValues a true.

  4. Introducir el id encontrado en el POST / documento / publicaciones punto final como el id.

  5. Hacer clic Ejecución.

DOX

Debería recibir una respuesta de la siguiente manera:

DOX

¿Que pasó exactamente?

En este ejemplo, en la respuesta, una de las áreas de extracción es el contacto del receptor con Linda Owens. Esta información se enriquece con los datos de enriquecimiento de ID de empleado creados en el paso 2. La predicción sugiere que la ID de empleado de Linda Owens (E0001) tiene una probabilidad del 100%. El modelo de sesgo de la máquina ni siquiera considera la identificación de empleado de Lin Owens (E0002).

Ahora ha utilizado con éxito la entidad de empleado para obtener predicciones de datos enriquecidos para el documento que cargó en Extracción de información de documentos.

Hecho

Inicie sesión para responder la pregunta

Paso 8: Ver todas las entradas de datos enriquecidas

Para ver una lista de las entradas de datos enriquecidas que ha creado:

  1. Ampliar la Obtener datos punto final.

  2. Hacer clic Pregunta a E.

  3. Seleccione los datos enriquecidos type employee e ingresa tu clientId.

  4. Hacer clic Ejecución.

DOX

Debería recibir una respuesta de la siguiente manera:

DOX

Hecho

Inicie sesión para responder la pregunta

Paso 9: eliminar datos enriquecidos

Para eliminar datos de enriquecimiento cargados anteriormente:

  1. Ampliar la Borrar datos punto final.

  2. Hacer clic Pregunta a E.

  3. Defina los datos en el payload campo, para que el sistema sepa qué entrada de datos (utilizando, por ejemplo, el ID de entrada de datos) debe eliminarse.

    {
       "value":[
          {
             "id":"E0001"
          },
          {
             "id":"E0002"
          }
       ]
    }
    
  4. Seleccione los datos enriquecidos type employee e ingresa tu clientId.

  5. Hacer clic Ejecución.

DOX

Debería recibir una respuesta de la siguiente manera:

DOX

Hecho

Inicie sesión para responder la pregunta

Paso 10: eliminar el cliente

Si desea eliminar un cliente que creó en el Paso 1, use el BORRAR / clientes punto final.

  1. Ampliar la BORRAR / clientes punto final.

  2. Hacer clic Pregunta a E.

  3. Introducir el pagar la carga campo de identificación de cliente o múltiples identificaciones de cliente (c_27, por ejemplo) que desea eliminar.

  4. Hacer clic Ejecución.

DOX

Debería recibir una respuesta de la siguiente manera:

DOX

Felicitaciones, ha completado este tutorial.

Hecho

Inicie sesión para responder la pregunta