عبارت جستجو:

تعداد نتایج: 41

مرتب سازی بر اساس: به صورت:

یادگیری تقویتی عبارت است از قالب بندی یک مسئله به فرم یادگیری از طریق تعامل برای رسیدن به هدف. زمانی که فضای حالات و یا کنش‌ها پیوسته و یا خیلی بزرگ شود استفاده از عناصر حافظه برای نگه‌داری ارزش حالات بسیار زیاد خواهد شد. این مسئله در رابطه با زمانی که در طول یادگیری ارزش کنش‌ها به دست آورده می‌شود، بحرانی تر خواهد شد. علاوه بر حافظه مصرفی مسئله ، داده و زمان لازم برای پر کردن آنها نیز مهم است. بنابراین مسئله تعمیم پیش خواهد آمد.روش پیشنهاد شده برای مسائل یادگیری تقویتی با فض ...

یادگیری تقویتی، یکی از شاخه‌های مطرح یادگیری ماشین در هوش مصنوعی است که برای حل یک مسئله نیازی به شناخت کامل از محیط ندارد، زیرا مسئله را به صورت یک عامل خودمختار و هدفمند می‌شناسد که با یک محیط نامعین در ارتباط است و ادراکات عامل از محیط را به عنوان حالت واقعی محیط در نظر می‌گیرد. یکی از کاربردهای این نوع از یادگیری در مسیریابی می‌باشد. یافتن مسیر بهینه در محیط‌های بزرگ و پیچیده با این روش می‌تواند مشکل باشد. برای غلبه بر این ضعف، ترکیب یادگیری تقویتی با طرح ریزی که عمدتا ج ...

امروزه یکی از چالش های اصلی شبکه های ترافیکی، هدایت وسائل نقلیه برای رسیدن به مقصدشان تحت وضعیت پویای ترافیک با هدف اجتناب از تراکم، کاهش زمانهای سفر و استفاده موثرتر از ظرفیتهای موجود شبکه حمل ونقل شهری می باشد. در پاسخ به مسائل بیان شده، سیستم پویای هدایت(راهنمای) مسیر رویکردی موثر به نظر می رسد. این سیستم از جمله حوزه های مهم فعالیت سیستمهای هوشمند حمل ونقل(ITS) می باشد. هسته اصلی سیستم پویای هدایت مسیر، محاسبات کوتاهترین مسیر بر اساس شرایط جاری(اطلاعات در زمان واقعی) ا ...

سیستم های چندعامله اغلب برای انجام وظایفی که کامل کردن آن توسط یک ربات سخت است استفاده می شود. از آنجایی که پیش بینی همه وضعیت های ممکن برای عامل ها در یک سیستم چندعامله ی پویا و گسترده غیر ممکن است، روش های یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عامل ها ارائه می کنند. شبیه ساز فوتبال ربات ها به عنوان یک سیستم چندعامله پویا و متغیر، بستر مناسبی برای تست روش های یادگیری و الگوریتم های هوش مصنوعی می باشد. در این پایان نامه با استفاده از یادگیری تقویتی به بهبود عملکرد حمله ...

در این پایان‌نامه مسأله مسیریابی بهینه رباتها را در محیط‌هایی با چند هدف در تناقض باهم با استفاده از الگوریتم‌های یادگیری تقویتی چندهدفه مورد تحلیل و بررسی قرار می‌گیرد. اخیرا تحقیقات گسترده ای در زمینه بهینه سازی چندهدفه توسط محققین انجام شده است، نه تنها به علت ماهیت چندهدفه بودن اکثر مسائل دنیای واقعی، بلکه به علت اینکه هنوز بسیاری از سوال های بی جواب در این زمینه وجود دارد. به همین دلایل در زمینه چندهدفه کردن الگوریتم های یادگیری تقویتی نیز اخیرا تحقیقاتی صورت گرفته و ...

یکی از علاقه مندی های مهم در علم رباتیک، پیاده سازی رباتی دوپا و شبیه به انسان است که قادر باشد همانند انسان رفتار نماید. از میان همه رفتارهای مکانیکی بدن انسان، شاخص ترین آنها راه رفتن است. راه رفتن یک ربات انسان نما، موضوعی است که دامنه های مختلفی از علوم پایه و مهندسی را در بر می گیرد که از آن جمله می توان به زیست شناسی، فیزیولوژی، مهندسی مکانیک، مهندسی کنترل ، هوش مصنوعی و رباتیک اشاره نمود. از منظر هوش مصنوعی، یادگیری تقویتی در محیط پیوسته یک روش کنترلی مناسب برای یادگیر ...

یادگیری تقویتی با مسئله یادگیری عامل هوشمند برای انتخاب اعمال به منظور بیشینه کردن کارایی عامل سروکار دارد. استفاده از مهارت‌ها در یادگیری تقویتی، سبب سرعت بخشیدن به کارکرد عامل می‌شود. یافتن اهداف میانی و ایجاد مهارت برای دست‌یابی به آنها، مسئله‌ای کلیدی در کشف خودکار مهارت می‌باشد. با کشف اهداف میانی و تعیین تابع سیاست دست‌یابی به آنها، عامل قادر به اکتشاف موثرتر ویادگیری سریع‌تر در کارهای دیگر در محیط‌های یکسان یا مشابه است. در این پژوهش، از رویکرد مبتنی بر گراف برای کشف ا ...

یادگیری تقویتی همچون برنامه‌ریزی‌ پویا در حل مسائل با فضای حالت پیوسته با چالش نفرین ابعادروبروست. تعمیم ارزش یک حالت به سایر حالت‌های مجاوربا استفاده از تقریبگرهای عمومی یکی از راهکارهایی است که برای حل این مسئله پیشنهادشده‌است. در این روش‌ عامل مجموعه‌ای محدود از فضای حالت را تجربه می‌کند و از طریق تعمیم‌دهی تقریب خوبی از کل فضا را بدست می‌آورد. یکی از بهترین تقریبگرهای عمومیسیستم‌های فازی‌اند. در تحقیقات بسیاری نشان داده شده‌است که سیستم‌های فازی نوع-2 در مقابل عدم قطعیت و ...

آلودگی صوتی یکی از معضلات جدی جوامع صنعتی می باشد. هر چند روش‌های متکی بر جذب صوت کاربردهای فراوانی داشته اما در فرکانس‌های پایین کارایی لازم را ندارند. برای غلبه بر این مشکل رویه‌های فعال برای حذف نویز ارائه گردیده اند. در این تحقیق نیز به منظور کاهش نویز صوتی به صورت فعال، ایده هایی مبتنی بر یادگیری تقویتی ارائه گردید. در این مسیر ابتدا برای سیگنال های تناوبی یک روش پیشنهاد شد که در آن نیازی به دانستن اطلاعات دینامیک نبوده و بار محاسباتی اندکی داشت اما نیاز به حافظه زیاد در ...