Saltar al contenido

Crear datos de entrenamiento de conjuntos de datos y subirlos

La funcionalidad principal de Business Entity Recognition es detectar y resaltar automáticamente cualquier tipo particular de entidad nombrada en texto no estructurado y clasificarlo por categorías predefinidas.

En este tutorial, aprenderá a usar las API de servicio para crear un conjunto de datos, cargar datos de entrenamiento y enviar una publicación de entrenamiento para eventualmente crear su propio modelo de aprendizaje automático personalizado para clasificar cualquier tipo particular de entidad con nombre, como el número de teléfono móvil, nombre, apellido y dirección, en los textos que envía al servicio en el siguiente tutorial: Modelo de implementación y Obtener resultados predictivos.


Paso 1: Autorización de la interfaz de usuario de Swagger

Utilizará la interfaz de usuario de Swagger, a través de cualquier navegador web, para llamar a las API de ID de entidad comercial. La interfaz de usuario de Swagger permite a los desarrolladores interactuar sin problemas y probar cada operación que revela una API para un consumo fácil. Para más información, ver IU Swagger.

En la clave de servicio que creó para el ID de entidad comercial en el tutorial anterior: Cree un Centro de servicios de identificación de entidad comercial, debe obtener (fuera del uaa parte de la clave de servicio) entrada llamada url (como se resalta en la imagen a continuación).

  1. Para acceder a la interfaz de ID de entidad comercial Swagger, agregue /api/v1 hacia url valor, péguelo en cualquier navegador web y presione Ingresar.

  2. Para poder utilizar los puntos finales de la interfaz de usuario de Swagger, debe autorizarse. En la esquina superior derecha, haga clic en Autorización.

    BER

  3. Encuentra el access_token valor creado en el tutorial anterior: Obtenga la demostración de acceso de OAuth para la identificación de entidades comerciales con cualquier navegador web, luego agregue transportador delante de él, y entrar en el Valor Gort.

    bearer <access_token>
    

    BER

  4. Hacer clic Autorización y luego haga clic en Cerrar.

    BER

Hecho

Inicie sesión para responder la pregunta

Paso 2: crea un conjunto de datos

Utilizar el POST / conjunto de datos endpoint para crear un conjunto de datos que se usará para entrenar un modelo personalizado para extraer entidades de texto no estructurado.

  1. Haga clic en el nombre del final para expandirlo.

  2. Hacer clic Pregunta a E.

    BER

  3. I carga salarial, inserte un description para su conjunto de datos, "Tutorial dataset", por ejemplo.

  4. Hacer clic Ejecución.

    BER

  5. Copia el datasetId desde el Cuerpo de respuesta.

    BER

Hecho

Inicie sesión para responder la pregunta

Paso 3: ver los detalles del conjunto de datos

Para ver los detalles de su conjunto de datos recién creado, use el GET / dataset / {datasetId} punto final.

  1. Haga clic en el nombre del final para expandirlo.

  2. Hacer clic Pregunta a E.

  3. Introducir el datasetId encontrado en el paso anterior y haga clic en Ejecución.

    BER

Obtienes una respuesta de la siguiente manera. Entre el datasetId y el description, ves el número de documentos. Estos documentos contienen los detalles de su capacitación y puede cargar algunos de ellos en el siguiente paso.

BER

Hecho

Inicie sesión para responder la pregunta

Paso 4: sube los datos de entrenamiento

Para cargar documentos de entrenamiento en su conjunto de datos, use el POST / dataset / {datasetId} / documentos. Puede repetir este paso para cargar varios documentos.

Recuerde que la identificación de entidad comercial requiere que sus datos estén en un formato específico para entrenar un modelo. Ver requisitos previos de formato de datos i Formato de datos de entrenamiento.

Como alternativa a cargar su propio archivo JSON al servicio, puede usar los siguientes archivos de muestra (haga clic con el botón derecho en el enlace y luego haga clic en Guardar enlace como para descargar los archivos localmente):

Repita este paso dos veces y cargue un documento cada vez. Cuantos más datos estén disponibles, mejor será la predicción del modelo.

Para cargar documentos, haga lo siguiente:

  1. Clickea en el POST / dataset / {datasetId} / documentos nombre del punto final para extenderlo.

  2. Hacer clic Pregunta a E.

  3. Introducir el datasetId obtenido en el paso 2 y seleccione un documento de formación para la carga.

  4. Hacer clic Ejecución.

    BER

  5. Copia el documentId desde el Cuerpo de respuesta.

    BER

Hecho

Inicie sesión para responder la pregunta

Paso 5: ver los detalles del documento

Utilizando la datasetId obtenido en el paso anterior, puede obtener detalles de sus documentos de capacitación utilizando el GET / dataset / {datasetId} / documentos / {documentId} punto final.

  1. Haga clic en el nombre del final para expandirlo.

  2. Hacer clic Pregunta a E.

  3. Introducir el datasetId obtenido en la fase 2.

  4. Introducir el documentId obtenido en el paso 4.

  5. Hacer clic Ejecución.

    BER

Debería recibir una respuesta, junto con los detalles del documento, como se muestra a continuación. Esto le muestra el tamaño del documento en bytes.

BER

Hecho

Inicie sesión para responder la pregunta

Paso 6: Solicite un trabajo de formación

Una vez que se cargan los documentos de capacitación, puede enviar una publicación de capacitación. Esto fomenta el entrenamiento en un modelo de aprendizaje automático basado en sus datos cargados. Para ello, utilice el POST / formación / trabajos punto final.

  1. Haga clic en el nombre del final para expandirlo.

  2. Hacer clic Pregunta a E.

  3. I carga salarial, inserte un modelName tu modelo personalizado, "Tutorial_custom_model", por ejemplo, y el datasetId obtenido en la fase 2.

    CAMBIO:

    Tenga en cuenta lo siguiente modelName pautas:

    • No puede usar el mismo nombre con un modelo de reconocimiento de entidades comerciales previamente capacitado (sap_email_business_entity y sap_invoice_header)

    • No puedes usarlo "sap_" como prefijo

    • Comience con un carácter alfanumérico

    • Puedes incluir los caracteres especiales "-" y "_"

    • Puede utilizar un máximo de 64 caracteres

  4. Hacer clic Ejecución.

    BER

  5. Copia el jobId desde el Cuerpo de respuesta. Esto le permite comprobar el estado de la formación.

    BER

Esto sugiere que su puesto de formación se ha enviado con éxito.

Paso 7: ver el estado del trabajo de capacitación

Para comprobar si su formación ya ha tenido éxito, puede GET / training / jobs / {jobId} endpoint para ver el estado actual del trabajo.

CAMBIO:

En la versión de prueba del servicio, solo hay una publicación de capacitación con SUCCEEDED estado permitido. Mira Límites de entrada de la cuenta de prueba. Utilice el punto final BORRAR / formación / trabajos / {jobId} eliminar una publicación de formación antes de que su estado cambie a SUCCEEDED.

  1. Haga clic en el nombre del final para expandirlo.

  2. Hacer clic Pregunta a E.

  3. Introducir el jobId obtenido en el paso 6.

  4. Hacer clic Ejecución.

    BER

Debería obtener una respuesta como esta. El estado RUNNING muestra que la formación aún está en curso. Donde esta el estado PENDING, entonces la formación aún no ha comenzado.

BER

Puede comprobar el estado de vez en cuando. Tenga en cuenta que la formación durará hasta 5 horas. Después de eso, el estado de entrenamiento cambia a SUCCEEDED. Además, obtienes todas las capacidades del modelo, estas son las entidades que el modelo puede identificar.

BER

Hecho

Inicie sesión para responder la pregunta