
ML - EP 08 : पुनर्बलन अधिगम: करके सीखना और उसका भविष्य
カートのアイテムが多すぎます
カートに追加できませんでした。
ウィッシュリストに追加できませんでした。
ほしい物リストの削除に失敗しました。
ポッドキャストのフォローに失敗しました
ポッドキャストのフォロー解除に失敗しました
-
ナレーター:
-
著者:
このコンテンツについて
सुदृढीकरण अधिगम (Reinforcement Learning) नामक एक कृत्रिम बुद्धिमत्ता (artificial intelligence) अवधारणा का परिचय देते हैं, जो "करके सीखने" (learning by doing) पर केंद्रित है। यह मशीन लर्निंग (machine learning) का एक प्रकार है जहाँ एक एजेंट (agent) अपने पर्यावरण (environment) के साथ बातचीत करके निर्णय लेना सीखता है। इस प्रक्रिया (process) में परीक्षण और त्रुटि (trial and error) के माध्यम से इनाम (rewards) को अधिकतम करना शामिल है, जैसा कि रोबोटिक्स (robotics), गेमिंग (gaming), और स्वायत्त वाहनों (autonomous vehicles) जैसे क्षेत्रों में देखा जाता है। लेख इस प्रौद्योगिकी (technology) के मुख्य घटकों (components), अनुप्रयोगों (applications) और चुनौतियों (challenges) पर प्रकाश डालता है, जिसमें नमूना दक्षता (sample efficiency) और नैतिक विचार (ethical considerations) शामिल हैं।