SoCreate convierte la tecnología de apoyo en una tradición en San Luis Obispo. ¡Una razón es que somos aprendices de por vida, y hay mucho que aprender unos de otros, y también queremos ver el crecimiento de la industria de la tecnología en SLO porque eso solo nos ayuda a desarrollar un equipo más talentoso! Así que, cuando dos expertos en su campo dieron un paso adelante para enseñar un taller de PyData SLO sobre el aprendizaje por refuerzo profundo, ¡nosotros dimos un paso adelante para proporcionar la pizza! También organizamos esta reunión de marzo aquí en nuestras oficinas de SoCreate. El ingeniero de software de SoCreate, John Jenson, asistió e informó al respecto.
Laura Graesser de Google Brain y Keng Wah Loon de Machine Zone visitaron SLO provenientes de Bay Area para dirigir el taller de aprendizaje por refuerzo profundo, que es un marco general que se puede aplicar para resolver problemas de optimización secuencial basados en la toma de decisiones (como en videojuegos como Go y Atari) a través de pruebas y errores. Puede que hayas visto el aprendizaje por refuerzo profundo en acción cuando apareció en los titulares en 2015 debido a AlphaGo, un programa de computadora que venció al mundialmente famoso jugador de 'Go' y campeón europeo, el Sr. Fan Hui. AlphaGo logró una victoria por 4-1 en Seúl, Corea del Sur, mientras 200 millones de personas lo observaban, aprendiendo de las ingeniosas jugadas ganadoras del programa de computación.
En el taller de PyData SLO, Laura y Keng cubrieron los fundamentos del aprendizaje por refuerzo, las definiciones de las funciones que componen un sistema de aprendizaje de este tipo y las diferentes categorías de algoritmos de aprendizaje por refuerzo profundo. "Cubrimos dos de los algoritmos más importantes en profundidad y vimos que estos algoritmos se aplicaban a un entorno de pruebas muy básico en el SLM-Lab", comentó John. SLM-Lab, escrito por Laura y Keng, es un marco de aprendizaje por refuerzo profundo modular en PyTorch. "Los presentadores dieron una explicación detallada de los algoritmos y funciones, a la vez que explicaron cómo trabajaban a un nivel más intuitivo."
John se mostró muy impresionado por la demostración de Laura y Keng de un algoritmo preaprendido (preaprendido porque puede llevar un día completo aprender a entrenar en una laptop) que había aprendido a jugar a Atari Breakout. "En un sistema de aprendizaje por refuerzo, un agente emprende acciones para afectar su entorno, un paso a la vez. Ciertas acciones recompensarán al agente", explicó John, añadiendo que enseñar al sistema a jugar juegos es una aplicación común del aprendizaje por refuerzo. El sistema no conoce las reglas del juego, todo lo que necesita es ver la pantalla, una lista de las acciones que puede realizar y una definición de la recompensa. "Simplemente jugando el juego una y otra vez, miles o millones de veces, el sistema aprende a maximizar su recompensa, volviéndose muy hábil."
PyData SLO es una organización educativa enfocada en la ciencia de datos con Python, que reúne a los usuarios de Python de la comunidad académica y la industria en SLO para presentar, compartir y dar talleres de ideas en áreas que incluyen pero no se limitan a: ciencia de datos, ciencias computacionales, aprendizaje automático y computación distribuida. ¡Estamos encantados de ver a PyData traer a expertos como Laura Graisser y Keng Wah Loon para talleres como este, aquí mismo en SoCreate!
¿Deseas conocer los temas y lugares de las próximas reuniones?