Machine Learning - Modelo Reforço
-
UNINASSAU CARUARU
Quizz de apresentação sobre o modelo de reforço em machine learning. Publicidade
O que é aprendizado por reforço?
Um método onde um agente aprende através de interações e recompensas
Um tipo de aprendizado supervisionado
Uma técnica de agrupamento de dados
Publicidade
Qual é o objetivo principal de um agente em aprendizado por reforço?
Reduzir o número de variáveis
Minimizar o tempo de treinamento
Maximizar a função de recompensa cumulativa
O que é um "estado" em um ambiente de aprendizado por reforço?
A função de recompensa recebida
A representação do ambiente atual em que o agente se encontra
O número de ações possíveis
Publicidade
Qual é a principal diferença entre aprendizado por reforço e aprendizado supervisionado?
O aprendizado supervisionado não usa dados
No aprendizado por reforço, o agente aprende por meio de interações e recompensas, enquanto no supervisionado, aprende a partir de exemplos rotulados
O aprendizado por reforço é mais rápido
O que é uma "função de valor" em aprendizado por reforço?
Uma função que estima o valor esperado de um estado ou ação
Uma técnica de otimização
Uma métrica para avaliar a qualidade do modelo
Publicidade
Publicidade
Os comentários neste conteúdo foram limitados.
Você vai gostar também
Publicidade
Publicidade
Publicidade