گرید محاسباتی یک سیستم موازی و توزیع شده می‌باشد که هماهنگ سازی و اشتراک منابع را در مقیاس بزرگ امکان پذیر می‌سازد. مالکان منابع با انگیزه‌های مالی، منابع خود را در اختیار دیگران قرار می‌دهند. مشتریان گرید نیز با پرداخت هزینه‌ی درخواست خود، می‌توانند از این منابع استفاده کنند. برای مدیریت چنین سیستم‌های پیچیده‌ای، نمی‌توان از رویکردهای متداول مدیریت منابع، که سعی می‌کنند کارایی را در کل سیستم بهینه کنند، استفاده کرد. یک روش زمان‌بندی با هدف بهینه سازی هزینه، باید با توجه به قیمت و توانمندی منابع گرید، عمل تخصیص آن‌ها به کارهای همگون و ناهمگون کاربر را طوری انجام دهد که اجرای کارها با حداقل هزینه و قبل از مهلت تعیین شده، پایان یابد. با توجه به اهمیت این موضوع، در این پایان نامه روشی مبتنی بر Q-Learning برای این منظور پیشنهاد شده است. در این روش سیستم جهت پاسخگویی به درخواست‌ها از تجربیات قبلی که در حین تعامل با محیط بدست آورده استفاده می‌کند، تا هزینه را در کل سیستم بهینه کند. نتایج شبیه سازی نشان می‌دهد که روش پیشنهادی هنگامی که کارها همگون هستند در مقایسه با روش‌های ذکر شده از کارایی بالاتری برخوردار بوده و در خواست‌های کاربر را با هزینه کمتری انجام می‌دهد.
کد نوشتار : 237676