ANÁLISE EXPERIMENTAL DE APRENDIZAGEM POR REFORÇO UTILIZANDO REDES NEURAIS CONVOLUCIONAIS

Anderson Oliveira Mesquita; CRETO AUGUSTO VIDAL; YURI LENON BARBOSA NOGUEIRA; PAULO BRUNO DE SOUSA SERAFIM; Joaquim Bento Cavalcante Neto

ANÁLISE EXPERIMENTAL DE APRENDIZAGEM POR REFORÇO UTILIZANDO REDES NEURAIS CONVOLUCIONAIS

Autores

Anderson Oliveira Mesquita
CRETO AUGUSTO VIDAL
YURI LENON BARBOSA NOGUEIRA
PAULO BRUNO DE SOUSA SERAFIM
Joaquim Bento Cavalcante Neto

Resumo

Desenvolver agentes autônomos capazes de realizar tarefas utilizando visão como sensor é uma das tendências na pesquisa e desenvolvimento de programas que usam inteligência artificial. Exemplos do nosso dia a dia são a identificação biométrica, identificação de placas de carros em uma câmera, marcação de amigos em uma foto nas redes sociais, entre outras. Contudo, também se torna um desafio devido a fatores envolvendo eficiência computacional, o modo como o agente interage com o ambiente e como este retribui sinais de resposta, o tipo de aprendizagem envolvido, entre vários outros. O propósito desta pesquisa é programar um agente autônomo que use visão computacional, um ambiente virtual que será um labirinto e analisar por meio de experimentos o modo com que esse agente aprende a caminhar dentro desse labirinto tomando como guia sinais indicando determinada ação a ser tomada. O diferencial desse experimento em relação a aprendizagem por supervisão é que não é dada a informação do significado desses sinais mas sim apenas valores numéricos denominados recompensas. Essa abordagem se chama aprendizagem por reforço. Com base nisso o agente deve identificar sinais utilizando a visão e através disso deve maximizar o valor acumulado de recompensas que recebe durante seu treinamento. Será utilizado como modelo de aprendizagem uma rede neural convolucional e o algoritmo de aprendizagem será o SARSA (state-action-reward-state-action).

Downloads

Publicado

2019-01-14

Edição

v. 3 n. 1 (2018)

Seção

XXXVII Encontro de Iniciação Científica

Licença

Autores que publicam nesta revista concordam com os seguintes termos:

a. Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License que permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial nesta revista.

b. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.

c. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.

ANÁLISE EXPERIMENTAL DE APRENDIZAGEM POR REFORÇO UTILIZANDO REDES NEURAIS CONVOLUCIONAIS

Autores

Resumo

Downloads

Publicado

Edição

Seção

Licença

Desenvolvido por

Idioma

Informações