ANÁLISE EXPERIMENTAL DE APRENDIZAGEM POR REFORÇO UTILIZANDO REDES NEURAIS CONVOLUCIONAIS
Resumo
Desenvolver agentes autônomos capazes de realizar tarefas utilizando visão como sensor é uma das tendências na pesquisa e desenvolvimento de programas que usam inteligência artificial. Exemplos do nosso dia a dia são a identificação biométrica, identificação de placas de carros em uma câmera, marcação de amigos em uma foto nas redes sociais, entre outras. Contudo, também se torna um desafio devido a fatores envolvendo eficiência computacional, o modo como o agente interage com o ambiente e como este retribui sinais de resposta, o tipo de aprendizagem envolvido, entre vários outros. O propósito desta pesquisa é programar um agente autônomo que use visão computacional, um ambiente virtual que será um labirinto e analisar por meio de experimentos o modo com que esse agente aprende a caminhar dentro desse labirinto tomando como guia sinais indicando determinada ação a ser tomada. O diferencial desse experimento em relação a aprendizagem por supervisão é que não é dada a informação do significado desses sinais mas sim apenas valores numéricos denominados recompensas. Essa abordagem se chama aprendizagem por reforço. Com base nisso o agente deve identificar sinais utilizando a visão e através disso deve maximizar o valor acumulado de recompensas que recebe durante seu treinamento. Será utilizado como modelo de aprendizagem uma rede neural convolucional e o algoritmo de aprendizagem será o SARSA (state-action-reward-state-action).Publicado
2019-01-14
Edição
Seção
XXXVII Encontro de Iniciação Científica
Licença
Autores que publicam nesta revista concordam com os seguintes termos:
a. Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License que permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial nesta revista.
b. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.