SoCreate a fait de l'assistance technique à San Luis Obispo une tradition. L'une des raisons pour cela, c'est que nous apprenons tout au long de notre vie, qu'il y a tant à apprendre des uns et des autres et que nous voulons aussi voir l'industrie de la technologie se développer chez SLO parce que cela nous aide seulement à former une équipe plus talentueuse ! Ainsi, lorsque deux experts dans leur domaine sont intervenus pour enseigner un atelier PyData SLO sur l'apprentissage du renforcement en profondeur, nous sommes intervenus pour fournir la pizza ! Nous avons également accueilli cette réunion de mars dans nos bureaux de SoCreate. John Jenson, ingénieur logiciel de SoCreate, a assisté à la réunion et en a rendu compte.
Laura Graesser de Google Brain et Keng Wah Loon de Machine Zone ont rendu visite à SLO de la Bay Area pour animer l'atelier sur Deep RL, qui est un cadre général pouvant être appliqué pour résoudre des problèmes d'optimisation séquentielle basée sur la décision (pensez aux jeux vidéo comme Go et Atari) par des tests et des erreurs. Vous avez peut-être vu Deep RL en action lorsqu'il a fait la une des journaux en 2015 pour AlphaGo, un programme informatique qui a battu le célèbre joueur de " Go " et champion d'Europe M. Fan Hui. AlphaGo s'est ensuite imposé 4:1 à Séoul, en Corée du Sud, tandis que 200 millions de personnes ont suivi le match, tirant les leçons des mouvements gagnants inventifs du programme informatique.
Dans l'atelier PyData SLO, Laura et Keng ont exposé les bases de RL, les définitions des fonctions qui composent un système de RL, et les différentes catégories d'algorithmes de Deep RL. "Nous avons traité en profondeur deux des algorithmes les plus importants et nous avons vu ces algorithmes appliqués à un environnement de test très basique dans SLM-Lab," dit John. SLM-Lab, écrit par Laura et Keng, est un cadre d'apprentissage modulaire d'apprentissage profond dans PyTorch. "Les intervenants ont donné une explication détaillée des algorithmes et des fonctions, tout en expliquant comment ils fonctionnaient à un niveau plus intuitif."
John s'est dit très impressionné par la démo de Laura et Keng d'un algorithme pré-entraîné (pré-entraîné parce que cela peut prendre une journée entière pour s'entraîner sur un ordinateur portable) qui a appris à jouer à Atari Breakout. "Dans un système d'apprentissage de renforcement, un agent prend des mesures pour affecter son environnement, une étape à la fois. Certaines actions récompenseront l'agent", explique John, ajoutant qu'enseigner au système à jouer à des jeux est une application courante de RL. Le système ne connaît pas les règles du jeu, tout ce dont il a besoin est de voir l'écran, une liste des actions qu'il peut entreprendre, et une définition de la récompense. "En jouant le jeu encore et encore, des milliers ou des millions de fois, le système apprend à maximiser sa récompense, en devenant très habile."
PyData SLO est une organisation éducative axée sur la science des données avec Python, réunissant des utilisateurs Python de la communauté académique et de l'industrie à SLO pour présenter, partager, et débattre des idées dans des domaines incluant par exemple : la science des données, les sciences informatiques, l'apprentissage machine, et le calcul distribué. Nous sommes ravis de voir PyData faire appel à des experts comme Laura Graisser et Keng Wah Loon pour des ateliers comme celui-ci, même ici chez SoCreate !
Vous voulez en savoir plus sur les sujets et les lieux des rencontres à venir ?