INTRODUCCIÓN
En esta clase abarcamos todo el capítulo de
las redes neuronales artificiales las cuales son un paradigma de aprendizaje ya
que lo que intentan con esto es simular las neuronas y el cerebro humano para
que realice un trabajo perfecto.
Esta clase tiene como objetivo guiar al
estudiante en la introducción sobre las redes neuronales artificiales.
MARCO
TEÓRICO
HISTORIA
Los primeros modelos de redes neuronales datan
de 1943 por
los neurólogos McCulloch y Pitts. Años más tarde, en 1949, Donald Hebb
desarrolló sus ideas sobre el aprendizaje neuronal, quedando reflejado en la
"regla de Hebb". En 1958, Rosemblatt desarrolló el perceptrón simple, y en 1960, Widrow y Hoff desarrollaron
el ADALINE, que fue la primera
aplicación industrial real.
En los años siguientes, se redujo la
investigación, debido a la falta de modelos de aprendizaje y el estudio de
Minsky y Papert sobre las limitaciones del perceptrón. Sin embargo, en los años
80, volvieron a resurgir las RNA gracias al desarrollo de la red de Hopfield, y
en especial, al algoritmo de aprendizaje de retropropagación ideado por
Rumelhart y McLellan en 1986 que fue aplicado en el desarrollo de los
perceptrones multicapa.
PROPIEDADES
Una red neuronal se compone de unidades llamadas
neuronas. Cada neurona recibe una serie de entradas a través de interconexiones
y emite una salida. Esta salida viene dada por tres funciones:
Una función de propagación (también conocida
como función de excitación), que por lo general consiste en
el sumatorio de cada entrada multiplicada por el peso de su
interconexión (valor neto). Si el peso es positivo, la conexión se denominaexcitatoria;
si es negativo, se denomina inhibitoria.
Una función de activación, que modifica a la
anterior. Puede no existir, siendo en este caso la salida la misma función de
propagación.
Una función de transferencia, que se aplica al
valor devuelto por la función de activación. Se utiliza para acotar la salida
de la neurona y generalmente viene dada por la interpretación que queramos
darle a dichas salidas. Algunas de las más utilizadas son la función
sigmoidea (para obtener valores en el intervalo [0,1]) y la tangente
hiperbólica (para obtener valores en el intervalo [-1,1]).
Diseño y programación
de una RNA (red neuronal artificial)
Con un paradigma convencional de
programación en ingeniería del software, el objetivo del programador
es modelar matemáticamente (con distintos grados de formalismo) el problema en
cuestión y posteriormente formular una solución (programa) mediante un algoritmo codificado
que tenga una serie de propiedades que permitan resolver dicho
problema. En contraposición, la aproximación basada en las RNA parte de un
conjunto de datos de entrada suficientemente significativo y el objetivo es
conseguir que la redaprenda automáticamente las propiedades
deseadas. En este sentido, el diseño de la red tiene menos que ver con
cuestiones como los flujos de datos y la detección de condiciones, y más que
ver con cuestiones tales como la selección del modelo de red, la de las variables
a incorporar y el preprocesamiento de la información que formará elconjunto
de entrenamiento. Asimismo, el proceso por el que los parámetros de la red
se adecuan a la resolución de cada problema no se denomina genéricamente
programación sino que se suele denominar entrenamiento neuronal.
Por ejemplo en una red que se va a
aplicar al diagnóstico de imágenes médicas; durante la fase de entrenamiento el
sistema recibe imágenes de tejidos que se sabe son cancerígenos y tejidos que
se sabe son sanos, así como las respectivas clasificaciones de dichas imágenes.
Si el entrenamiento es el adecuado, una vez concluido, el sistema podrá recibir
imágenes de tejidos no clasificados y obtener su clasificación sano/no
sano con un buen grado de seguridad. Las variables de entrada pueden
ser desde los puntos individuales de cada imagen hasta un vector de
características de las mismas que se puedan incorporar al sistema (por ejemplo,
procedencia anatómica del tejido de la imagen o la edad del paciente al que se
le extrajo la muestra).
CARACTERÍSTICAS DE LAS REDES NEURONALES ARTIFICIALES
Las Redes Neuronales Artificiales, ANN
(Artificial Neural Networks) están inspiradas en las redes neuronales
biológicas del cerebro humano. Están constituidas por elementos que se comportan
de forma similar a la neurona biológica en sus funciones más comunes. Estos
elementos están organizados de una forma parecida a la que presenta el cerebro
humano.
Las ANN al margen de
"parecerse" al cerebro presentan una serie de características propias
del cerebro. Por ejemplo las ANN aprenden de la experiencia, generalizan de ejemplos
previos a ejemplos nuevos y abstraen las características principales de una serie
de datos.
Aprender: adquirir el conocimiento de
una cosa por medio del estudio, ejercicio o experiencia. Las ANN pueden cambiar
su comportamiento en función del entorno. Se les muestra un conjunto de
entradas y ellas mismas se ajustan para producir unas salidas consistentes.
Generalizar: extender o ampliar una
cosa. Las ANN generalizan automáticamente debido a su propia estructura y
naturaleza. Estas redes pueden ofrecer, dentro de un margen, respuestas
correctas a entradas que presentan pequeñas variaciones debido a los efectos de
ruido o distorsión.
Abstraer: aislar mentalmente o
considerar por separado las cualidades de un objeto. Algunas ANN son capaces de
abstraer la esencia de un conjunto de entradas que aparentemente no presentan
aspectos comunes o relativos.
CONCLUSIÓN
Esta clase concluye en que el objetivo de las
redes neuronales artificiales es simular una neurona biológica pero hasta el
momento no se ha podido concluir ya que es muy compleja a raíz de esto existen
muchos proyectos sobre este tema.
BIBLIOGRAFÍA
P Isasi y I Galvan. 2004, Redes Neuronales Artificiales, Un Enfoque Práctico. Editorial, Pearson Educación S.A., Madrid
Basoqain, X. 2010. Redes
neuronales artificiales y sus aplicaciones. (En línea). Formato PDF. Disponible
en: http://cvb.ehu.es/open_course_ware/castellano/tecnicas/redes_neuro/contenidos/pdf/libro-del-curso.pdf
No hay comentarios:
Publicar un comentario