Herramientas de usuario

Herramientas del sitio


informatica:machine_learning

¡Esta es una revisión vieja del documento!


Machine Learning

También conocido como aprendizaje automático, es una disciplina que estudia y desarrolla algoritmos para aprender de la información o hacer predicciones sobre la información.

Ejemplos de posibles aplicaciones:

  • Decidir si un e-mail entrante es spam o no.
  • Analizar transacciones bancarias para identificar intentos de fraude.

Tipos de aprendizaje

Aprendizaje supervisado

A partir de un conjunto de datos ya etiquetados, el algoritmos predice la etiqueta que le corresponderá a la nueva información que no es conocida previamente.

Por ejemplo, en la detección de spam, se podría entrenar un algoritmo con mails etiquetados como spam o no spam y que sea capaz de identificar si los nuevos e-mails corresponderá a spam o no spam.

Aprendizaje no supervisado

A partir de un conjunto de datos sin clasificar/etiquetar, el algoritmo encuentra la estructura escondida en los datos.

Terminología

  • Sample (muestra): representación del objeto a tratar (email, transacción, conductores…)
  • Feature: características de la muestra (edad, sexo del conductor…)
  • Label / target: resultado deseado (ground truth) asociado con la muestra de entrada (spam o no spam, sobrevivió o no sobrevivió)
  • Training data: conjunto de pares (muestra, etiqueta) utilizados para entrenar el modelo.
  • Test data: conjunto de muestras usado para realizar predicciones.
informatica/machine_learning.1636385411.txt.gz · Última modificación: por tempwin