Дълбоки Q-мрежи

Автор: Laura McKinney
Дата На Създаване: 5 Април 2021
Дата На Актуализиране: 26 Юни 2024
Anonim
Engin Akyurek perdió la oportunidad #EnginAkyürek
Видео: Engin Akyurek perdió la oportunidad #EnginAkyürek

Съдържание

Определение - Какво означава Deep Q-Networks?

Deep Q Networks (DQN) са невронни мрежи (и / или свързани инструменти), които използват дълбоко Q обучение, за да осигурят модели като симулация на интелигентна игра на видеоигри. Вместо да бъде конкретно име за конкретна невронна мрежа, Deep Q Networks може да се състои от конволюционни невронни мрежи и други структури, които използват специфични методи за запознаване с различни процеси.


Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.

Техопедия обяснява Deep Q-Networks

Методът на задълбочено Q обучение обикновено използва нещо, наречено итерация на обща политика, описана като съвкупност от оценка на политиката и итерация на политики, за да се научат политики от сензорни данни с голям размер.

Например, често срещаният тип дълбока Q мрежа, обхваната в технически публикации като Medium, взема сензорни данни от видеоигрите Atari 2600 за моделиране на резултатите. Това се прави на много фундаментално ниво чрез събиране на проби, съхраняването им и използването им за преиграване на опит, за да се актуализира Q мрежата.

В общ смисъл, дълбоките Q мрежи тренират на входове, които представляват активни играчи в области или други опитни проби и се учат да съпоставят тези данни с желаните резултати. Това е мощен метод в развитието на изкуствен интелект, който може да играе игри като шах на високо ниво или да извършва други познавателни дейности на високо ниво - примерът за игра на Atari или шахматната видеоигра също е добър пример за това как AI използва видове интерфейси, които традиционно се използват от човешки агенти.


С други думи, с дълбокото Q обучение, AI играчът прилича повече на човек играч в обучението за постигане на желаните резултати.