Aprendizaje Automático
Marzo de 2022
El Machine Learning o aprendizaje automático, dota a los ordenadores de la capacidad de identificar patrones en datos masivos y elaborar
predicciones (análisis predictivo). Este aprendizaje permite a los computadores realizar tareas específicas de forma
autónoma, es decir, sin necesidad de ser programados.
¿Qué es el aprendizaje automático?
El aprendizaje automático (Machine Learning) es una rama de la inteligencia artificial (IA) y la informática que se centra en el uso de
datos y algoritmos para imitar la forma en que los humanos aprenden, mejorando gradualmente su precisión.
El aprendizaje automático es un componente importante del creciente campo de la ciencia de datos. Mediante el uso de métodos estadísticos, los algoritmos se entrenan para hacer clasificaciones o predicciones, descubriendo información clave dentro de los proyectos de minería de datos. Estos conocimientos posteriormente impulsan la toma de decisiones dentro de las aplicaciones y los negocios, lo que idealmente impacta en las métricas de crecimiento clave. A medida que el big data continúe expandiéndose y creciendo, aumentará la demanda del mercado de científicos de datos, lo que requerirá que ayuden a identificar las preguntas comerciales más relevantes y, posteriormente, los datos para responderlas.
El aprendizaje automático es un componente importante del creciente campo de la ciencia de datos. Mediante el uso de métodos estadísticos, los algoritmos se entrenan para hacer clasificaciones o predicciones, descubriendo información clave dentro de los proyectos de minería de datos. Estos conocimientos posteriormente impulsan la toma de decisiones dentro de las aplicaciones y los negocios, lo que idealmente impacta en las métricas de crecimiento clave. A medida que el big data continúe expandiéndose y creciendo, aumentará la demanda del mercado de científicos de datos, lo que requerirá que ayuden a identificar las preguntas comerciales más relevantes y, posteriormente, los datos para responderlas.
Cómo funciona el aprendizaje automático
UC Berkeley divide el sistema de aprendizaje de un algoritmo de aprendizaje automático
en tres partes principales:
• Un proceso de decisión: En general, los algoritmos de aprendizaje automático se utilizan para hacer una predicción o clasificación. En función de algunos datos de entrada, que se pueden etiquetar o no, su algoritmo producirá una estimación sobre un patrón en los datos.
• Una función de error: Una función de error sirve para evaluar la predicción del modelo. Si hay ejemplos conocidos, una función de error puede hacer una comparación para evaluar la precisión del modelo.
• Un proceso de optimización del modelo: Si el modelo puede ajustarse mejor a los puntos de datos en el conjunto de entrenamiento, entonces los pesos se ajustan para reducir la discrepancia entre el ejemplo conocido y la estimación del modelo. El algoritmo repetirá este proceso de evaluación y optimización, actualizando los pesos de forma autónoma hasta alcanzar un umbral de precisión.
• Un proceso de decisión: En general, los algoritmos de aprendizaje automático se utilizan para hacer una predicción o clasificación. En función de algunos datos de entrada, que se pueden etiquetar o no, su algoritmo producirá una estimación sobre un patrón en los datos.
• Una función de error: Una función de error sirve para evaluar la predicción del modelo. Si hay ejemplos conocidos, una función de error puede hacer una comparación para evaluar la precisión del modelo.
• Un proceso de optimización del modelo: Si el modelo puede ajustarse mejor a los puntos de datos en el conjunto de entrenamiento, entonces los pesos se ajustan para reducir la discrepancia entre el ejemplo conocido y la estimación del modelo. El algoritmo repetirá este proceso de evaluación y optimización, actualizando los pesos de forma autónoma hasta alcanzar un umbral de precisión.
Métodos de aprendizaje automático
Los clasificadores de aprendizaje automático se dividen en tres categorías principales:
• Aprendizaje automático supervisado: El aprendizaje supervisado , también conocido como aprendizaje automático supervisado, se define por el uso de conjuntos de datos etiquetados para entrenar algoritmos que clasifican datos o predicen resultados con precisión. A medida que los datos de entrada se introducen en el modelo, este ajusta sus pesos hasta que el modelo se haya ajustado correctamente. Esto ocurre como parte del proceso de validación cruzada para garantizar que el modelo evite el sobreajuste o el ajuste insuficiente . El aprendizaje supervisado ayuda a las organizaciones a resolver una variedad de problemas del mundo real a escala, como clasificar el correo no deseado en una carpeta separada de su bandeja de entrada. Algunos métodos utilizados en el aprendizaje supervisado incluyen redes neuronales, bayes ingenuos, regresión lineal, regresión logística, bosque aleatorio, máquina de vectores de soporte (SVM) y más.
• Aprendizaje automático no supervisado: El aprendizaje no supervisado , también conocido como aprendizaje automático no supervisado, utiliza algoritmos de aprendizaje automático para analizar y agrupar conjuntos de datos no etiquetados. Estos algoritmos descubren patrones ocultos o agrupaciones de datos sin necesidad de intervención humana. Su capacidad para descubrir similitudes y diferencias en la información lo convierte en la solución ideal para el análisis exploratorio de datos, estrategias de venta cruzada, segmentación de clientes, reconocimiento de imágenes y patrones. También se usa para reducir la cantidad de funciones en un modelo a través del proceso de reducción de dimensionalidad; El análisis de componentes principales (PCA) y la descomposición de valores singulares (SVD) son dos enfoques comunes para esto. Otros algoritmos utilizados en el aprendizaje no supervisado incluyen redes neuronales, agrupamiento de k-means, métodos de agrupamiento probabilístico y más.
• Aprendizaje semisupervisado: El aprendizaje semisupervisado ofrece un término medio entre el aprendizaje supervisado y el no supervisado. Durante el entrenamiento, utiliza un conjunto de datos etiquetados más pequeño para guiar la clasificación y la extracción de características de un conjunto de datos más grande sin etiquetar. El aprendizaje semisupervisado puede resolver el problema de no tener suficientes datos etiquetados (o no poder permitirse el lujo de etiquetar suficientes datos) para entrenar un algoritmo de aprendizaje supervisado.
• Aprendizaje automático supervisado: El aprendizaje supervisado , también conocido como aprendizaje automático supervisado, se define por el uso de conjuntos de datos etiquetados para entrenar algoritmos que clasifican datos o predicen resultados con precisión. A medida que los datos de entrada se introducen en el modelo, este ajusta sus pesos hasta que el modelo se haya ajustado correctamente. Esto ocurre como parte del proceso de validación cruzada para garantizar que el modelo evite el sobreajuste o el ajuste insuficiente . El aprendizaje supervisado ayuda a las organizaciones a resolver una variedad de problemas del mundo real a escala, como clasificar el correo no deseado en una carpeta separada de su bandeja de entrada. Algunos métodos utilizados en el aprendizaje supervisado incluyen redes neuronales, bayes ingenuos, regresión lineal, regresión logística, bosque aleatorio, máquina de vectores de soporte (SVM) y más.
• Aprendizaje automático no supervisado: El aprendizaje no supervisado , también conocido como aprendizaje automático no supervisado, utiliza algoritmos de aprendizaje automático para analizar y agrupar conjuntos de datos no etiquetados. Estos algoritmos descubren patrones ocultos o agrupaciones de datos sin necesidad de intervención humana. Su capacidad para descubrir similitudes y diferencias en la información lo convierte en la solución ideal para el análisis exploratorio de datos, estrategias de venta cruzada, segmentación de clientes, reconocimiento de imágenes y patrones. También se usa para reducir la cantidad de funciones en un modelo a través del proceso de reducción de dimensionalidad; El análisis de componentes principales (PCA) y la descomposición de valores singulares (SVD) son dos enfoques comunes para esto. Otros algoritmos utilizados en el aprendizaje no supervisado incluyen redes neuronales, agrupamiento de k-means, métodos de agrupamiento probabilístico y más.
• Aprendizaje semisupervisado: El aprendizaje semisupervisado ofrece un término medio entre el aprendizaje supervisado y el no supervisado. Durante el entrenamiento, utiliza un conjunto de datos etiquetados más pequeño para guiar la clasificación y la extracción de características de un conjunto de datos más grande sin etiquetar. El aprendizaje semisupervisado puede resolver el problema de no tener suficientes datos etiquetados (o no poder permitirse el lujo de etiquetar suficientes datos) para entrenar un algoritmo de aprendizaje supervisado.
Aprendizaje automático de refuerzo
El aprendizaje automático de refuerzo es un modelo de aprendizaje automático de comportamiento que es similar al
aprendizaje supervisado, pero el algoritmo no se entrena con datos de muestra. Este modelo aprende a medida que avanza
mediante prueba y error. Se reforzará una secuencia de resultados exitosos para desarrollar la mejor recomendación o
política para un problema dado.
Su objetivo es que un algoritmo aprenda a partir de la propia experiencia. Esto es, que sea capaz de tomar la mejor decisión ante diferentes situaciones de acuerdo a un proceso de prueba y error en el que se recompensan las decisiones correctas. En la actualidad se está utilizando para posibilitar el reconocimiento facial, hacer diagnósticos médicos o clasificar secuencias de ADN.
Su objetivo es que un algoritmo aprenda a partir de la propia experiencia. Esto es, que sea capaz de tomar la mejor decisión ante diferentes situaciones de acuerdo a un proceso de prueba y error en el que se recompensan las decisiones correctas. En la actualidad se está utilizando para posibilitar el reconocimiento facial, hacer diagnósticos médicos o clasificar secuencias de ADN.
Casos de uso de aprendizaje automático en el mundo real
Estos son solo algunos ejemplos de aprendizaje automático que puede encontrar todos los días:
• Reconocimiento de voz: También se conoce como reconocimiento automático de voz (ASR), reconocimiento de voz por computadora o conversión de voz a texto, y es una capacidad que utiliza el procesamiento de lenguaje natural (NLP) para procesar el habla humana en un formato escrito. Muchos dispositivos móviles incorporan el reconocimiento de voz en sus sistemas para realizar búsquedas por voz, o proporcionar más accesibilidad a los mensajes de texto.
• Servicio al cliente: Los chatbots en línea están reemplazando a los agentes humanos a lo largo del viaje del cliente. Responden preguntas frecuentes (FAQ) sobre temas, como el envío, o brindan asesoramiento personalizado, productos de venta cruzada o sugerencias de tamaños para los usuarios, cambiando la forma en que pensamos sobre la participación del cliente en los sitios web y las plataformas de redes sociales. Los ejemplos incluyen bots de mensajería en sitios de comercio electrónico con agentes virtuales , aplicaciones de mensajería y tareas que generalmente realizan asistentes virtuales y asistentes de voz.
• Visión por computadora: Esta tecnología de inteligencia artificial permite que las computadoras y los sistemas obtengan información significativa de imágenes digitales, videos y otras entradas visuales, y en función de esas entradas, puede tomar medidas. Esta capacidad de proporcionar recomendaciones lo distingue de las tareas de reconocimiento de imágenes. Impulsada por redes neuronales convolucionales, la visión por computadora tiene aplicaciones dentro del etiquetado de fotos en las redes sociales, imágenes de radiología en el cuidado de la salud y automóviles autónomos dentro de la industria automotriz.
• Motores de recomendación: Utilizando datos de comportamiento de consumo pasados, los algoritmos de IA pueden ayudar a descubrir tendencias de datos que se pueden usar para desarrollar estrategias de venta cruzada más efectivas. Esto se utiliza para hacer recomendaciones de complementos relevantes a los clientes durante el proceso de pago para los minoristas en línea.
• Negociación de acciones automatizada: Diseñadas para optimizar las carteras de acciones, las plataformas de negociación de alta frecuencia impulsadas por IA realizan miles o incluso millones de transacciones por día sin intervención humana.
• Reconocimiento de voz: También se conoce como reconocimiento automático de voz (ASR), reconocimiento de voz por computadora o conversión de voz a texto, y es una capacidad que utiliza el procesamiento de lenguaje natural (NLP) para procesar el habla humana en un formato escrito. Muchos dispositivos móviles incorporan el reconocimiento de voz en sus sistemas para realizar búsquedas por voz, o proporcionar más accesibilidad a los mensajes de texto.
• Servicio al cliente: Los chatbots en línea están reemplazando a los agentes humanos a lo largo del viaje del cliente. Responden preguntas frecuentes (FAQ) sobre temas, como el envío, o brindan asesoramiento personalizado, productos de venta cruzada o sugerencias de tamaños para los usuarios, cambiando la forma en que pensamos sobre la participación del cliente en los sitios web y las plataformas de redes sociales. Los ejemplos incluyen bots de mensajería en sitios de comercio electrónico con agentes virtuales , aplicaciones de mensajería y tareas que generalmente realizan asistentes virtuales y asistentes de voz.
• Visión por computadora: Esta tecnología de inteligencia artificial permite que las computadoras y los sistemas obtengan información significativa de imágenes digitales, videos y otras entradas visuales, y en función de esas entradas, puede tomar medidas. Esta capacidad de proporcionar recomendaciones lo distingue de las tareas de reconocimiento de imágenes. Impulsada por redes neuronales convolucionales, la visión por computadora tiene aplicaciones dentro del etiquetado de fotos en las redes sociales, imágenes de radiología en el cuidado de la salud y automóviles autónomos dentro de la industria automotriz.
• Motores de recomendación: Utilizando datos de comportamiento de consumo pasados, los algoritmos de IA pueden ayudar a descubrir tendencias de datos que se pueden usar para desarrollar estrategias de venta cruzada más efectivas. Esto se utiliza para hacer recomendaciones de complementos relevantes a los clientes durante el proceso de pago para los minoristas en línea.
• Negociación de acciones automatizada: Diseñadas para optimizar las carteras de acciones, las plataformas de negociación de alta frecuencia impulsadas por IA realizan miles o incluso millones de transacciones por día sin intervención humana.