informatica:machine_learning
Diferencias
Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
| informatica:machine_learning [2021/11/08 16:25] – [Terminología] tempwin | informatica:machine_learning [2021/11/08 16:36] (actual) – [Evaluación] tempwin | ||
|---|---|---|---|
| Línea 19: | Línea 19: | ||
| A partir de un conjunto de datos sin clasificar/ | A partir de un conjunto de datos sin clasificar/ | ||
| - | |||
| ===== Terminología ===== | ===== Terminología ===== | ||
| * **Sample** (muestra): representación del objeto a tratar (email, transacción, | * **Sample** (muestra): representación del objeto a tratar (email, transacción, | ||
| * **Feature**: | * **Feature**: | ||
| - | * **Label** / **target**: resultado deseado asociado con la muestra de entrada (spam o no spam, sobrevivió o no sobrevivió) | + | * **Label** / **target**: resultado deseado |
| * **Training data**: conjunto de pares (muestra, etiqueta) utilizados para entrenar el modelo. | * **Training data**: conjunto de pares (muestra, etiqueta) utilizados para entrenar el modelo. | ||
| * **Test data**: conjunto de muestras usado para realizar predicciones. | * **Test data**: conjunto de muestras usado para realizar predicciones. | ||
| + | |||
| + | ===== Evaluación ===== | ||
| + | |||
| + | Matriz de confusión. | ||
| + | |||
| + | Métricas: | ||
| + | |||
| + | * Acierto: (#TP + #TN) / total | ||
| + | * Precisión: #TP / (#TP + #FP) | ||
| + | * Recall: #TP / (#TP + #FN) | ||
| + | |||
| + | La **precisión** nos indica cuánto de lo que hemos predicho es correcto y **recall** cuánto de lo que es correcto, lo ha predicho el algoritmo. | ||
| + | |||
| + | En Python el módulo '' | ||
informatica/machine_learning.1636385131.txt.gz · Última modificación: por tempwin
