ANÁLISE EXPERIMENTAL DE APRENDIZAGEM POR REFORÇO UTILIZANDO REDES NEURAIS CONVOLUCIONAIS

Autores

  • Anderson Oliveira Mesquita
  • CRETO AUGUSTO VIDAL
  • YURI LENON BARBOSA NOGUEIRA
  • PAULO BRUNO DE SOUSA SERAFIM
  • Joaquim Bento Cavalcante Neto

Resumo

Desenvolver agentes autônomos capazes de realizar tarefas utilizando visão como sensor é uma das tendências na pesquisa e desenvolvimento de programas que usam inteligência artificial. Exemplos do nosso dia a dia são a identificação biométrica, identificação de placas de carros em uma câmera, marcação de amigos em uma foto nas redes sociais, entre outras. Contudo, também se torna um desafio devido a fatores envolvendo eficiência computacional, o modo como o agente interage com o ambiente e como este retribui sinais de resposta, o tipo de aprendizagem envolvido, entre vários outros. O propósito desta pesquisa é programar um agente autônomo que use visão computacional, um ambiente virtual que será um labirinto e analisar por meio de experimentos o modo com que esse agente aprende a caminhar dentro desse labirinto tomando como guia sinais indicando determinada ação a ser tomada. O diferencial desse experimento em relação a aprendizagem por supervisão é que não é dada a informação do significado desses sinais mas sim apenas valores numéricos denominados recompensas. Essa abordagem se chama aprendizagem por reforço. Com base nisso o agente deve identificar sinais utilizando a visão e através disso deve maximizar o valor acumulado de recompensas que recebe durante seu treinamento. Será utilizado como modelo de aprendizagem uma rede neural convolucional e o algoritmo de aprendizagem será o SARSA (state-action-reward-state-action).

Publicado

2019-01-14

Edição

Seção

XXXVII Encontro de Iniciação Científica