SoCreate सैन लुइस ओबिस्पो में तकनीक का समर्थन करने वाली परंपरा बना रहा है। इसका एक कारण यह है कि हम जीवन भर सीखने वाले लोग हैं, और एक-दूसरे से सीखने के लिए बहुत कुछ है, और हम एसएलओ में तकनीक उद्योग को बढ़ते हुए भी देखना चाहते हैं क्योंकि इससे हमें और भी ज्यादा प्रतिभाशाली टीम बनाने में मदद मिलती है! इसलिए, जब अपने क्षेत्र के दो विशेषज्ञों ने डीप रिइंफोर्समेंट लर्निंग पर PyData SLO कार्यशालों को पढ़ाने का जिम्मा उठाया, तब हमने भी पिज़्ज़ा बांटने की जिम्मेदारी अपने ऊपर ले ली! हमने इस मार्च बैठक को हमारे SoCreate कार्यालयों पर भी आयोजित किया। SoCreate के सॉफ्टवेयर इंजीनियर जॉन जेंसन इसमें शामिल हुए और इसकी जानकारी दी।
गूगल ब्रेन से लौरा ग्रेसर और मशीन ज़ोन से केंग वाह लून डीप रिइंफोर्समेंट लर्निंग पर कार्यशाला का नेतृत्व करने के लिए खाड़ी क्षेत्र से एसएलओ आये, जो एक सामान्य संरचना है जिसे परीक्षण और त्रुटी के माध्यम से अनुक्रमिक निर्णय-आधारित अनुकूलन समस्याओं (गो और अटारी जैसे विडियो गेम्स के बारे में सोचिये) का समाधान करने के लिए लागू किया जा सकता है। आपने डीप रिइंफोर्समेंट लर्निंग को काम करते हुए देखा होगा, जब यह 2015 में AlphaGo के लिए खबरों में आया था, जो एक कंप्यूटर प्रोग्राम है जिसने विश्व-प्रसिद्ध ‘Go’ प्लेयर और यूरोपियन चैंपियन मिस्टर फैन हूई को मात दी थी। दक्षिण कोरिया के सीओल में AlphaGo को 4-1 से जीत हासिल हुई थी, जबकि कंप्यूटर प्रोग्राम के कुशल विजयी चालों से सीखते हुए 200 मिलियन लोगों ने इसे देखा था।
PyData SLO कार्यशाला में, लौरा और केंग ने आरएल के मूलभूत सिद्धांतों, आरएल सिस्टम को बनाने वाले फंक्शन की परिभाषाओं, और डीप आरएल अल्गोरिथम की विभिन्न श्रेणियों को शामिल किया। "हमने दो सबसे महत्वपूर्ण अल्गोरिथम के बारे में गहराई से जाना और इन अल्गोरिथम को एसएलएम-लैब में एक बहुत ही साधारण परीक्षण परिवेश में लागू होते हुए देखा," जॉन ने कहा। लौरा और केंग द्वारा लिखित, एसएलएम-लैब PyTorch में एक मॉड्यूलर डीप रिइंफोर्समेंट लर्निंग फ्रेमवर्क है। "प्रस्तुतकर्ताओं ने अल्गोरिथम और फंक्शन का एक विस्तृत विवरण दिया, साथ ही यह भी बताया कि उन्होंने कैसे एक ज्यादा सहज स्तर पर काम किया।"
जॉन ने बताया कि वह लौरा और केंग के एक पूर्व-प्रशिक्षित अल्गोरिथम (पूर्व प्रशिक्षित क्योंकि इसे एक लैपटॉप पर प्रशिक्षित करने में पूरे दिन का समय लग सकता है) के डेमो से सबसे अधिक प्रभावित हुए जिसने अटारी ब्रेकआउट खेलना सीखा था। "रिइंफोर्समेंट लर्निंग सिस्टम में, अपने परिवेश को प्रभावित करने के लिए एक बार में एक चरण के साथ कोई एजेंट गतिविधि करता है। कुछ गतिविधियों से एजेंट को पुरस्कार मिलता है," जॉन ने समझाया, साथ ही उन्होंने बताया कि सिस्टम को गेम्स खेलना सिखाना आरएल का सामान्य प्रयोग है। सिस्टम को गेम के नियमों की जानकारी नहीं होती है, इसे केवल स्क्रीन देखने की, उन गतिविधियों की सूची देखने की जरुरत होती है जो यह कर सकता है, और साथ ही इनाम की परिभाषा देखने की जरुरत पड़ती है। "गेम को बार-बार, हज़ारों या लाखों बार खेलकर, सिस्टम अपना इनाम बढ़ाना सीखता है, और कुशल होता है।"
PyData SLO पाइथन के साथ डेटा साइंस पर केंद्रित शिक्षण संस्थान है, जो निम्नलिखित सहित कई क्षेत्रों में विचारों को प्रस्तुत करने के लिए, साझा करने के लिए और कार्यशाला प्रदान करने के लिए SLO में शैक्षिक समुदाय और उद्योग से पाइथन प्रयोगकर्ताओं को एक साथ लाता है: डेटा साइंस, कम्प्यूटेशन साइंस, मशीन लर्निंग और वितरित कंप्यूटिंग। SoCreate में, PyData द्वारा ऐसी कार्यशालाओं के लिए लौरा ग्रेसर और केंग वाह लून जैसे विशेषज्ञों को लाने के लिए हम बहुत रोमांचित हैं!
क्या आप आगामी बैठक के विषयों और स्थानों के बारे में जानना चाहते हैं?