خرید کتاب از گوگل

چاپ کتاب PDF,

خرید کتاب از آمازون,

خرید کتاب زبان اصلی,

دانلود کتاب خارجی,

دانلود کتاب لاتین

برای ثبت درخواست به انتهای صفحه مراجعه کنید.

Rollout, Policy Iteration, and Distributed Reinforcement Learning

Description:...

The purpose of this book is to develop in greater depth some of the methods from the author's Reinforcement Learning and Optimal Control recently published textbook (Athena Scientific, 2019). In particular, we present new research, relating to systems involving multiple agents, partitioned architectures, and distributed asynchronous computation. We pay special attention to the contexts of dynamic programming/policy iteration and control theory/model predictive control. We also discuss in some detail the application of the methodology to challenging discrete/combinatorial optimization problems, such as routing, scheduling, assignment, and mixed integer programming, including the use of neural network approximations within these contexts.

The book focuses on the fundamental idea of policy iteration, i.e., start from some policy, and successively generate one or more improved policies. If just one improved policy is generated, this is called rollout, which, based on broad and consistent computational experience, appears to be one of the most versatile and reliable of all reinforcement learning methods. In this book, rollout algorithms are developed for both discrete deterministic and stochastic DP problems, and the development of distributed implementations in both multiagent and multiprocessor settings, aiming to take advantage of parallelism.

Approximate policy iteration is more ambitious than rollout, but it is a strictly off-line method, and it is generally far more computationally intensive. This motivates the use of parallel and distributed computation. One of the purposes of the monograph is to discuss distributed (possibly asynchronous) methods that relate to rollout and policy iteration, both in the context of an exact and an approximate implementation involving neural networks or other approximation architectures.

Much of the new research is inspired by the remarkable AlphaZero chess program, where policy iteration, value and policy networks, approximate lookahead minimization, and parallel computation all play an important role.

Show description

* ایمیل (آدرس Email را با دقت وارد کنید)
لینک پیگیری درخواست ایمیل می شود.
شماره تماس (ارسال لینک پیگیری از طریق SMS)
نمونه: 09123456789

در صورت نیاز توضیحات تکمیلی درخواست خود را وارد کنید

* تصویر امنیتی
 

به شما اطمینان می دهیم در کمتر از 8 ساعت به درخواست شما پاسخ خواهیم داد.

* نتیجه بررسی از طریق ایمیل ارسال خواهد شد

کتاب زبان اصلی J.R.R
خرید کتاب فیزیکی از آمازون-
خرید کتاب آمازون-
خرید کتاب کیندل-
مجله نیوانگلند-
آموزش پاورمیل زبان اصلی-
کتاب خارجی برای هدیه-
کتاب سالیدورک زبان اصلی-
خرید کیندل-
خرید pdf کتاب خارجی-
ست باکس کتاب اورجینال
ضمانت بازگشت وجه بدون شرط
اعتماد سازی
انتقال وجه کارت به کارت
X

پرداخت وجه کارت به کارت

شماره کارت : 6104337650971516
شماره حساب : 8228146163
شناسه شبا (انتقال پایا) : IR410120020000008228146163
بانک ملت به نام مهدی تاج دینی

پس از پرداخت به صورت کارت به کارت، 4 رقم آخر شماره کارت خود را برای ما ارسال کنید.
X