Q-обучение

Автор: Roger Morrison
Дата На Създаване: 24 Септември 2021
Дата На Актуализиране: 11 Може 2024
Anonim
Q-learning
Видео: Q-learning

Съдържание

Определение - Какво означава Q-обучение?

Q-обучение е термин за структура на алгоритми, представляваща безпроблемно моделиране на обучение. Чрез оценка на политиката и използване на стохастично моделиране, Q-обучението намира най-добрия път напред в процеса на решение на Марков.


Въведение в Microsoft Azure и Microsoft Cloud | В това ръководство ще научите какво представлява компютърните изчисления и как Microsoft Azure може да ви помогне да мигрирате и стартирате бизнеса си от облака.

Техопедия обяснява Q-обучение

Техническият състав на алгоритъма на Q-обучение включва агент, набор от състояния и набор от действия на държава.

Функцията Q използва тежести за различни стъпки във връзка с коефициент на отстъпка, за да оцени наградите.

Въпреки че може да изглежда проста идея, Q-обучението е от първостепенно значение при много видове модели за укрепване на обучението и задълбоченото обучение. Един от най-добрите примери е, когато дълбокото Q-обучение се използва за подпомагане на програмите за машинно обучение за усвояване на стратегии за игра в различни видове видео игри, например в Atari игри от 80-те години. Тук една конволюционна невронна мрежа взема проби от игра, за да изработи стохастичен модел, който ще помогне на компютъра да знае как да играе по-добре във времето.


Q-обучението има богат потенциал за подпомагане на развитието на изкуствения интелект и машинното обучение.