Red Neuronal
Marzo de 2022
El término red neuronal (Neural Network) se aplica a una familia de modelos relacionada de manera aproximada que se
caracteriza por un gran espacio de parámetro y una estructura flexible y que proviene de los estudios sobre el
funcionamiento del cerebro. Conforme fue creciendo la familia, se diseñó la mayoría de los nuevos modelos para
aplicaciones no biológicas, aunque gran parte de la terminología asociada refleja su origen.
¿Qué es una red neuronal?
Una red neuronal o Neural Network, es un procesador distribuido en paralelo de forma masiva con una propensión natural
a almacenar conocimiento experimental y convertirlo en disponible para su uso. Asemeja al cerebro en dos aspectos:
• El conocimiento se adquiere por la red mediante un proceso de aprendizaje.
• Las fuerzas de conexión interneuronal, conocidas como ponderaciones sinápticas, se utilizan para almacenar el conocimiento.
Las redes neuronales son la herramienta preferida para muchas aplicaciones de minería de datos predictiva por su potencia, flexibilidad y facilidad de uso. Las redes neuronales predictivas son especialmente útiles en las aplicaciones cuyo proceso subyacente sea complejo. Por ejemplo:
• Prever la demanda de los consumidores para racionalizar los costes de producción y entrega.
• Predecir la probabilidad de respuesta al marketing mediante correo directo para determinar a qué unidades familiares de una lista de correo debe enviarse una oferta.
• Puntuar a un solicitante para determinar el riesgo que supone concederle un crédito.
• Detectar transacciones fraudulentas en una base de datos de reclamaciones de seguros.
Las redes neuronales utilizadas en las aplicaciones predictivas, como las redes de perceptrones multicapa (MLP) y las de función de base radial (RBF), se supervisan en el sentido de que los resultados pronosticados por el modelo se pueden comparar con los valores conocidos de las variables de destino. La opción de redes neuronales le permite ajustar las redes MLP y RBF y guardar los modelos resultantes para la puntuación.
• El conocimiento se adquiere por la red mediante un proceso de aprendizaje.
• Las fuerzas de conexión interneuronal, conocidas como ponderaciones sinápticas, se utilizan para almacenar el conocimiento.
Las redes neuronales son la herramienta preferida para muchas aplicaciones de minería de datos predictiva por su potencia, flexibilidad y facilidad de uso. Las redes neuronales predictivas son especialmente útiles en las aplicaciones cuyo proceso subyacente sea complejo. Por ejemplo:
• Prever la demanda de los consumidores para racionalizar los costes de producción y entrega.
• Predecir la probabilidad de respuesta al marketing mediante correo directo para determinar a qué unidades familiares de una lista de correo debe enviarse una oferta.
• Puntuar a un solicitante para determinar el riesgo que supone concederle un crédito.
• Detectar transacciones fraudulentas en una base de datos de reclamaciones de seguros.
Las redes neuronales utilizadas en las aplicaciones predictivas, como las redes de perceptrones multicapa (MLP) y las de función de base radial (RBF), se supervisan en el sentido de que los resultados pronosticados por el modelo se pueden comparar con los valores conocidos de las variables de destino. La opción de redes neuronales le permite ajustar las redes MLP y RBF y guardar los modelos resultantes para la puntuación.
Estructura de red neuronal
Aunque las redes neuronales plantean exigencias mínimas sobre los supuestos y la estructura del modelo, resulta útil
comprender la arquitectura general de la red. La red de perceptrones multicapa (MLP) o de función de base radial (RBF)
es una función de predictores (denominados también entradas o variables independientes) que minimiza el error de
predicción de las variables de destino (también denominadas salidas).
Las redes neuronales, o redes neuronales artificiales (ANN), se componen de capas de nodos que contienen una capa de entrada, una o más capas ocultas y una capa de salida. Cada nodo, o neurona artificial, se conecta con otro y tiene asociado un peso y un umbral. Si la salida de cualquier nodo individual está por encima del valor de umbral especificado, ese nodo se activa y envía datos a la siguiente capa de la red. De lo contrario, no se pasan datos a la siguiente capa de la red. Lo "profundo" en el aprendizaje profundo solo se refiere a la profundidad de las capas en una red neuronal. Una red neuronal que consta de más de tres capas, que incluirían las entradas y la salida, puede considerarse un algoritmo de aprendizaje profundo o una red neuronal profunda. Una red neuronal que solo tiene dos o tres capas es solo una red neuronal básica.
Las redes neuronales, o redes neuronales artificiales (ANN), se componen de capas de nodos que contienen una capa de entrada, una o más capas ocultas y una capa de salida. Cada nodo, o neurona artificial, se conecta con otro y tiene asociado un peso y un umbral. Si la salida de cualquier nodo individual está por encima del valor de umbral especificado, ese nodo se activa y envía datos a la siguiente capa de la red. De lo contrario, no se pasan datos a la siguiente capa de la red. Lo "profundo" en el aprendizaje profundo solo se refiere a la profundidad de las capas en una red neuronal. Una red neuronal que consta de más de tres capas, que incluirían las entradas y la salida, puede considerarse un algoritmo de aprendizaje profundo o una red neuronal profunda. Una red neuronal que solo tiene dos o tres capas es solo una red neuronal básica.
Perceptrón multicapa
El procedimiento Perceptrón multicapa (MLP) genera un modelo predictivo para una o más variables dependientes
(de destino) basada en los valores de las variables predictoras.
• Variables dependientes: Las variables dependientes pueden ser:
-Nominal: Una variable puede tratarse como nominal cuando sus valores representan categorías sin clasificación intrínseca.
-Ordinal: Una variable puede ser tratada como ordinal cuando sus valores representan categorías con alguna clasificación intrínseca (por ejemplo, niveles de satisfacción de servicio de altamente insatisfecho a altamente satisfecho).
-Escala: Una variable puede tratarse como escala (continua) cuando sus valores representan categorías ordenadas con una métrica significativa, de modo que las comparaciones de distancia entre valores son apropiadas.
El procedimiento supone que se ha asignado el nivel de medición adecuado a todas las variables dependientes. No obstante, puede cambiar temporalmente el nivel de medición para una variable pulsando con el botón derecho en la variable en la lista de variables de origen y seleccionar un nivel de medición en el menú emergente. Para modificar permanentemente el nivel de medición de una variable, consulte Nivel de medición de variable.
• Variables predictoras: Los predictores se pueden especificar como factores (categóricos) o covariables (de escala).
• Codificación de la variable categórica: El procedimiento recodifica temporalmente predictores categóricos y variables dependientes utilizando la codificación "una de c" para todo el procedimiento. Si hay c categorías de una variable, la variable se almacena como vectores c, con la primera categoría denotada (1,0,...,0), la siguiente categoría (0,1,0,...,0), ..., y la última categoría (0,0,...,0,1).
• Cambio de escala: De forma predeterminada, se cambia la escala de las covariables y las variables dependientes de escala para mejorar el entrenamiento de la red. Todo cambio de escala se realiza en base a los datos de entrenamiento, incluso si se define una muestra reservada o de comprobación. Es decir, dependiendo del tipo de cambio de escala, la media, la desviación estándar, el valor mínimo o el valor máximo de una covariable o variable dependiente se calculan utilizando sólo los datos de entrenamiento. Si especifica una variable para definir particiones, es importante que estas covariables o variables dependientes tengan distribuciones similares en todas las muestras reservadas, de entrenamiento o comprobación.
• Ponderaciones de frecuencia: Este procedimiento ignora las ponderaciones de frecuencia.
• Replicación de los resultados: Si desea replicar exactamente los resultados, utilice el mismo valor de inicialización para el generador de números aleatorios, el mismo orden de datos y el mismo orden de variables, además de utilizar la misma configuración del procedimiento.
• Variables dependientes: Las variables dependientes pueden ser:
-Nominal: Una variable puede tratarse como nominal cuando sus valores representan categorías sin clasificación intrínseca.
-Ordinal: Una variable puede ser tratada como ordinal cuando sus valores representan categorías con alguna clasificación intrínseca (por ejemplo, niveles de satisfacción de servicio de altamente insatisfecho a altamente satisfecho).
-Escala: Una variable puede tratarse como escala (continua) cuando sus valores representan categorías ordenadas con una métrica significativa, de modo que las comparaciones de distancia entre valores son apropiadas.
El procedimiento supone que se ha asignado el nivel de medición adecuado a todas las variables dependientes. No obstante, puede cambiar temporalmente el nivel de medición para una variable pulsando con el botón derecho en la variable en la lista de variables de origen y seleccionar un nivel de medición en el menú emergente. Para modificar permanentemente el nivel de medición de una variable, consulte Nivel de medición de variable.
• Variables predictoras: Los predictores se pueden especificar como factores (categóricos) o covariables (de escala).
• Codificación de la variable categórica: El procedimiento recodifica temporalmente predictores categóricos y variables dependientes utilizando la codificación "una de c" para todo el procedimiento. Si hay c categorías de una variable, la variable se almacena como vectores c, con la primera categoría denotada (1,0,...,0), la siguiente categoría (0,1,0,...,0), ..., y la última categoría (0,0,...,0,1).
• Cambio de escala: De forma predeterminada, se cambia la escala de las covariables y las variables dependientes de escala para mejorar el entrenamiento de la red. Todo cambio de escala se realiza en base a los datos de entrenamiento, incluso si se define una muestra reservada o de comprobación. Es decir, dependiendo del tipo de cambio de escala, la media, la desviación estándar, el valor mínimo o el valor máximo de una covariable o variable dependiente se calculan utilizando sólo los datos de entrenamiento. Si especifica una variable para definir particiones, es importante que estas covariables o variables dependientes tengan distribuciones similares en todas las muestras reservadas, de entrenamiento o comprobación.
• Ponderaciones de frecuencia: Este procedimiento ignora las ponderaciones de frecuencia.
• Replicación de los resultados: Si desea replicar exactamente los resultados, utilice el mismo valor de inicialización para el generador de números aleatorios, el mismo orden de datos y el mismo orden de variables, además de utilizar la misma configuración del procedimiento.
Función de base radial
El procedimiento Función de base radial (RBF) genera un modelo predictivo para una o más variables dependientes
(de destino) basado en los valores de las variables predictoras.
El proceso es similar al procedimiento Perceptrón, con algunas variantes significativas.
El proceso es similar al procedimiento Perceptrón, con algunas variantes significativas.