Aprendizaje Reforzado


Como hemos venido comentando en publicaciones anteriores, la Inteligencia Artificial es un campo extremadamente diversificado, con varios subconjuntos bajo su sombrilla, incluyendo: Machine Learning, Deep Learning y Reinforcement Learning, por nombrar solo algunos. En los últimos años, muchos expertos han sugerido que el desarrollo del aprendizaje por refuerzo, aunque tiene un gran potencial, todavía está en pañales.


El Aprendizaje Reforzado (RL), es un subconjunto de Machine Learning (ML). Es una técnica utilizada para ayudar al desarrollo del 'aprendizaje' de un agente en un entorno o ambiente, a través del proceso de prueba y error. Esto a su vez, usa 'feedback' para corregirse a sí mismo, ya sea retroalimentación positiva o negativa.


En el caso del video que verán a más adelante, se utiliza un componente de RL llamado Curiosity-Learning. Ese se basa en construir una función de recompensa que sea intrínseca al agente (generada por el propio agente). También significa que el agente será un alumno autónomo, ya que será el estudiante pero también el maestro de la retroalimentación.

¿Por qué PacMan? Junhyuk Oh (Científico Investigador Senior en DeepMind) destaca la importancia de buenos puntos de referencia como lo es el Arcade Learning Environment (juegos de Atari) y su papel clave, ya que estos nos permiten comparar sistemáticamente diferentes algoritmos de aprendizaje. Junhyuk sugirió que los puntos de referencia más desafiantes e interesantes (por ejemplo: ambientes 3D, entornos basados en el idioma) empujarán los límites de este aprendizaje, demostrando que una vez más, los videojuegos son un elemento básico del desarrollo de IA. PacMan es un claro ejemplo de un entorno de aprendizaje que considera varias acciones.

Talvez este tema lo vemos como una simple solución para hackear juegos o facilitar ciertas tareas, pero con RL no solo podemos aprender habilidades simples de resolución de problemas, sino también podemos construir conocimiento que pueda aplicarse a tareas sociales más amplias.

¿Puede esto resolver todos tus problemas? bueno, eso depende de a quién le preguntes, pero no hay duda del enorme potencial que podría crear cambios a gran escala en los próximos años.

19 vistas

©2020 por Altur Solutions

  • Blanco Icono de YouTube