Machine Learning - Modelo Reforço
UNINASSAU CARUARU Quizz de apresentação sobre o modelo de reforço em machine learning.
0
0
0
1
O que é aprendizado por reforço?
Um método onde um agente aprende através de interações e recompensas
Um tipo de aprendizado supervisionado
Uma técnica de agrupamento de dados
2
Qual é o objetivo principal de um agente em aprendizado por reforço?
Maximizar a função de recompensa cumulativa
Minimizar o tempo de treinamento
Reduzir o número de variáveis
3
O que é um "estado" em um ambiente de aprendizado por reforço?
A representação do ambiente atual em que o agente se encontra
A função de recompensa recebida
O número de ações possíveis
4
Qual é a principal diferença entre aprendizado por reforço e aprendizado supervisionado?
O aprendizado supervisionado não usa dados
O aprendizado por reforço é mais rápido
No aprendizado por reforço, o agente aprende por meio de interações e recompensas, enquanto no supervisionado, aprende a partir de exemplos rotulados
5
O que é uma "função de valor" em aprendizado por reforço?
Uma função que estima o valor esperado de um estado ou ação
Uma métrica para avaliar a qualidade do modelo
Uma técnica de otimização