Saltar al contenido

Utilice la sugerencia de atributos de datos con su propia base de datos

Para utilizar su propio conjunto de datos, debe definir un esquema de conjunto de datos que se ajuste a su conjunto de datos.

En su conjunto de datos, debe decidir qué columnas estarán allí features, como las entradas al modelo de aprendizaje automático y cuáles serán las columnas labels, como las áreas predichas por el modelo de aprendizaje automático. Para obtener más definiciones de términos específicos, consulte Conceptos.

Después de definir las características y las etiquetas, deberá anotar el esquema de su conjunto de datos. Pegue el siguiente ejemplo en un archivo de texto y adáptelo a sus necesidades.

Muestra un. Todas las columnas de su conjunto de datos label (no una etiqueta en el sentido del aprendizaje automático, sino un nombre de campo) y un type. Los tipos están disponibles category, text y number. Dale a cada una de tus características y etiquetas el tipo correcto. Encuentre más descripciones de cada tipo en el CC sobre What kinds of training data can be processed by Data Attribute Recommendation?

Tenga en cuenta que yo labels una sección category Se permiten variedades.

Ahora que ha creado su esquema de conjunto de datos, asegúrese de guardar el archivo.

{
  "features": [
      {
          "label": "description",
          "type": "text"
      },
      {
          "label": "manufacturer",
          "type": "category"
      },
      {
          "label": "price",
          "type": "number"
      }
  ],
  "labels": [
      {
          "label": "level1_category",
          "type": "category"
      },
      {
          "label": "level2_category",
          "type": "category"
      },
      {
          "label": "level3_category",
          "type": "category"
      }
  ],
  "name": "my-dataset-schema"
}

Por último, pero no menos importante, debe asegurarse de que su conjunto de datos cumpla con prerrequisitos. El conjunto de datos debe:

  • estar en formato CSV

  • use una coma «,» como delimitador

  • utilizar codificación UTF-8

  • incluir todas las características y etiquetas que ha definido en el esquema de su conjunto de datos como columnas de datos

  • no incluya ningún campo no utilizado en su esquema de conjunto de datos

Puedes usar esto conjunto de datos como una referencia.