پاورپوینت یادگیری تقویتی

  • Code: # 1445

  • تعداد صفحات: 23
  • فرمت فایل: پاورپوینت
  • سال: مشخص نشده
  • مقطع: دانشگاهی
  • دسته بندی: دانشگاهی
قیمت: ۶,۵۰۰ تومان
دانلود فایل
  • خلاصه
  • فهرست و منابع
  • خلاصه پاورپوینت یادگیری تقویتی

    ***2

    در یک مسئله یادگیری تقویتی با عاملی روبرو هستیم که از طریق سعی و خطا با محیط تعامل کرده و یاد میگیرد تا عملی بهینه را برای رسیدن به هدف انتخاب نماید.

     

    ***3

    یادگیری تقویتی از اینرو مورد توجه است که راهی برای آموزش عامل ها برای انجام یک عمل  از طریق دادن پاداش و تنبیه است بدون اینکه لازم باشد نحوه انجام عمل را برای عامل مشخص نمائیم.

    دو استراتژی اصلی برای اینکار وجود دارد:

    .1یکی استفاده از الگوریتم های ژنتیکی

    .2و دیگری استفاده از روشهای آماری و dynamic programming

    در RL  روش دوم مد نظر است.

     

    ***4

    محیط مجموعه ای از S حالت ممکن است.

    در هر لحظه t  عامل میتواند یکی از A  عمل ممکن را انجام دهد.

    عامل  ممکن است در مقابل عمل و یا مجموعه ای از اعمالی که انجام میدهد  پاداش   r را دریافت کند. این پاداش ممکن است مثبت  و یا منفی )تنبیه(باشد

     

    ***5

    عامل در محیط حرکت کرده و حالتها و پاداشهای مربوطه را به خاطر می سپارد.

    عامل سعی میکند طوری رفتار کند که تابع پاداش را ماکزیمم نماید.

     

    ***7

    فرض می کنیم  که اعمال عامل از قانونی مثل p تبعیت میکند که آنرا خط مشی و یا policy می نامیم.

    از آنجائیکه Rt یک متغیر تصادفی است لذا امید ریاضی آن تحت یک خط مشی خاص و برای یک حالت معین برابر خواهد بود با:

     

    (فرمول ها در فایل اصلی موجود است.)

  • فهرست و منابع پاورپوینت یادگیری تقویتی

    فهرست:

    ندارد
     

    منبع:

    ندارد

دانلود قالب آماده درسی دانشگاهی پاورپوینت یادگیری تقویتی
  • ثبت سفارش
    عنوان محصول
    قیمت