Player FM ऐप के साथ ऑफ़लाइन जाएं!
Julekalender luke 3: AI for kontinuerlig læring
Manage episode 348729563 series 2497947
De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.
Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605
Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html
144 एपिसोडस
Manage episode 348729563 series 2497947
De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.
Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605
Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html
144 एपिसोडस
सभी एपिसोड
×प्लेयर एफएम में आपका स्वागत है!
प्लेयर एफएम वेब को स्कैन कर रहा है उच्च गुणवत्ता वाले पॉडकास्ट आप के आनंद लेंने के लिए अभी। यह सबसे अच्छा पॉडकास्ट एप्प है और यह Android, iPhone और वेब पर काम करता है। उपकरणों में सदस्यता को सिंक करने के लिए साइनअप करें।