Herramientas de usuario

Herramientas del sitio


informatica:machine_learning

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
informatica:machine_learning [2021/11/08 16:25] – [Terminología] tempwininformatica:machine_learning [2021/11/08 16:36] (actual) – [Evaluación] tempwin
Línea 19: Línea 19:
  
 A partir de un conjunto de datos sin clasificar/etiquetar, el algoritmo encuentra la estructura escondida en los datos. A partir de un conjunto de datos sin clasificar/etiquetar, el algoritmo encuentra la estructura escondida en los datos.
- 
 ===== Terminología ===== ===== Terminología =====
  
   * **Sample** (muestra): representación del objeto a tratar (email, transacción, conductores...)   * **Sample** (muestra): representación del objeto a tratar (email, transacción, conductores...)
   * **Feature**: características de la muestra (edad, sexo del conductor...)   * **Feature**: características de la muestra (edad, sexo del conductor...)
-  * **Label** / **target**: resultado deseado asociado con la muestra de entrada (spam o no spam, sobrevivió o no sobrevivió)+  * **Label** / **target**: resultado deseado (//ground truth//asociado con la muestra de entrada (spam o no spam, sobrevivió o no sobrevivió)
   * **Training data**: conjunto de pares (muestra, etiqueta) utilizados para entrenar el modelo.   * **Training data**: conjunto de pares (muestra, etiqueta) utilizados para entrenar el modelo.
   * **Test data**: conjunto de muestras usado para realizar predicciones.   * **Test data**: conjunto de muestras usado para realizar predicciones.
 +
 +===== Evaluación =====
 +
 +Matriz de confusión.
 +
 +Métricas:
 +
 +  * Acierto: (#TP + #TN) / total
 +  * Precisión: #TP / (#TP + #FP)
 +  * Recall: #TP / (#TP + #FN)
 +
 +La **precisión** nos indica cuánto de lo que hemos predicho es correcto y **recall** cuánto de lo que es correcto, lo ha predicho el algoritmo.
 +
 +En Python el módulo ''scikit-learn'' es muy usado para trabajar con aprendizaje supervisado. Ejemplo: https://github.com/bonzanini/VideoCourse-DataAnalysisPython/blob/master/notebooks/Video%204.3%20-%20Supervised%20Learning%20with%20scikit-learn.ipynb
informatica/machine_learning.1636385131.txt.gz · Última modificación: por tempwin