O comportamento de termos da Ciência da Informação por meio da modelagem de tópicos
DOI:
https://doi.org/10.36517/2525-3468.ip.v8i0.2023.92075.1-3Palavras-chave:
Modelagem de tópicos, Alocação de Dirichlet Latente, Proximidade e distanciamento, Comportamento diacrônicoResumo
O crescimento da pesquisa, ciência e tecnologia na perspectiva acadêmica tem contribuído para a produção de uma quantidade elevada de informações científicas produzidas em diversos formatos e tipos de documentos da comunicação científica. Levando em consideração a quantidade, variedade e complexidade de informações produzidas, tem sido cada vez mais necessário o uso de tecnologias e métodos para elaboração e produção de registros de informação, além da necessidade de produzir informações sobre informações. A Modelagem de Tópicos, constituída de métodos estatísticos/probabilísticos e recursos tecnológicos, utiliza modelos de algoritmos de aprendizagem que possibilita identificar padrões, organizar coleções, resumir conteúdos, extrair tópicos mais frequentes, identificar relações entre assuntos e mudanças realizadas ao longo do tempo em corpora de documentos. Partindo desse princípio, questiona-se: de que forma tem se apresentado, na segunda década do século XXI, os temas da produção científica brasileira na área da Ciência da Informação quando se comparado às áreas e disciplinas já estabelecidas na literatura por pesquisadores como núcleo da área? O objetivo geral buscou verificar a proximidade e o distanciamento entre os temas extraídos dos corpora de dados constituídos por documentos científicos com as áreas e disciplinas da Ciência da Informação estabelecidas na literatura. Dentre os objetivos específicos constam identificar, analisar e discutir o comportamento diacrônico dos termos extraídos dos corpora de dados, bem com suas respectivas relações, além de analisar e discutir os modelos de treinamento de extração de tópicos, selecionar os resultados significativos e validar junto à comunidade científica brasileira da Ciência da Informação. Justifica-se a importância desta pesquisa uma vez que a comparação entre estudos – mesmo que utilizando de metodologias e intervalos de tempo diferentes na composição de documentos – permite apresentar, por meio do mapeamento científico, novos resultados e prospectar diferentes cenários e perspectivas para a ciência estudada. Para a pesquisa empírica foram realizadas as etapas de coleta de dados e formação dos corpora de dados; preparação e pré-processamento referente à limpeza, manipulação, combinação e normalização dos dados; transformação dos dados referentes às operações matemáticas e estatísticas aplicadas; modelagem e processamento, ao qual conecta os dados tratados aos modelos Latent Semantic Indexing e Latent Dirichlet Allocation; apresentação dos resultados por meio de sínteses textuais e gráficos interativos e estatísticos; validação dos resultados junto a pesquisadores da área estudada; e documentação gerada a partir dos resultados empíricos com o referencial teórico. Dentre os principais resultados constam: o comportamento parcialmente diferente entre o mapeamento científico das disciplinas do núcleo da Ciência da Informação encontrado na literatura com os resultados empíricos desta pesquisa; o comportamento diacrônico e surgimento de termos em pesquisas na área da Ciência da Informação, como fake news, big data e machine learning; a proximidade e o distanciamento entre disciplinas como Sistemas de Informação e Comunicação Científica Eletrônica; os melhores resultados na modelagem de tópicos realizada por meio do modelo Latent Dirichlet Allocation, levando em consideração o equilíbrio entre os pesos dos resultados e um maior número de bigramas e trigramas que contribuem para a uma melhor interpretação dos dados, realizada pelo indexador e validada pela comunidade científica.
Downloads
Referências
ALBRECHTSEN, H. Subject analysis and indexing: from automated indexing to domain analysis. The Indexer, Liverpool, v. 18, n. 4, p. 219–224, 1993.
ALMEIDA, M. B. Revisiting Ontologies: a necessary clarification. Journal of the American Society for Information Science and Technology, New York, v. 64, n. 8, p. 1682-1693, 2013.
ALMEIDA, M. B.; DE OLIVEIRA, V. N. P.; COELHO, K. C. Estudo exploratório sobre ontologias aplicadas a modelos de sistemas de informação: perspectivas de pesquisa em Ciência da Informação. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, Florianópolis, v. 15, n. 30, p. 32-56, 2010.
ALPAYDIN, E. Introduction to machine learning. 2. ed. Cambridge: The MIT Press, 2010.
AYODELE, T. O. Types of Machine Learning Algorithms. In: ZHANG, Y. (org.) New Advances in Machine Learning. London: Intechopen, 2010. p. 19-48.
ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 12676: Métodos para análise de documentos - determinação de seus assuntos e seleção de termos de indexação. Rio de Janeiro, 1992.
AZEREDO, J.C. Gramática Houaiss da língua portuguesa. 3. ed. São Paulo: PubliFolha, 2008.
BRASCHER, M.; CAFÉ, L. Organização da informação ou organização do conhecimento?. In: Encontro Nacional de Pesquisa em Ciência da Informação, 9., 2008, São Paulo - SP. Anais... Salvador: USP, 2008.
BARRETO, A. A. Uma história da Ciência da Informação. In: TOUTAIN, L. M. B. (org.). Para entender a Ciência da Informação. Salvador: EDUFBA, 2007. p. 13-34.
BARRETO, A. A. Uma quase história da ciência da informação. DataGramaZero - Revista de Ciência Da Informação, Rio de Janeiro, v. 9, n. 2, p. 1–17, 2008.
BERRY, M. W.; DUMAIS, S. T.; O’BRIEN, G. W. Using linear algebra for intelligent information retrieval. Society for Industrial and Applied Mathematics, Philadelphia, v. 37, n. 4, p. 573–595, 1995.
BERRY, M. W.; KOGAN. J. Text Mining Applications and Theory. West Sussex: John Wiley & Sons, 2010.
BEGHTOL, C. Bibliographic classification theory and text linguistics: aboutness analysis, intertextuality and the cognitive act of classifying documents. Journal of Documentation, London, v. 42, n. 2, p. 84-113, 1986.
BIBER, D. Variation across speech and writing. Cambridge: Cambridge University Press, 1988.
BICALHO, L. M. As relações interdisciplinares refletidas na literatura brasileira da Ciência da Informação. 2009. 268 f. Tese (Doutorado em Ciência da Informação) – Programa de Pós-Graduação em Ciência da Informação, Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte - MG, 2009.
BJÖRK, B. C. Open access to scientific publications-an analysis of the barriers to change? Information Research, Borås, v. 9, n. 2, 2004.
BLEI, D. M. Probabilistic topic models. Communications of the ACM, New York, v. 55, n. 4, p. 77–84, 2012.
BLEI, D.; CARIN, L.; DUNSON, D. Probabilistic topic models. IEEE Signal Processing Magazine, New York, v. 27, n. 6, p.55–65, 2010.
BLEI, D. M.; LAFFERTY, J. D. A correlated topic model of science. The Annals of Applied Statistics, Cleveland, v. 1, n. 1, p. 17-35, 2007.
BLEI, D. M.; LAFFERTY, J. D. Topic models. In: SRIVASTAVA, A. N.; SAHAMI, M. (org.). Text mining: Classification, clustering, and applications. Minneapolis: Chapman & Hall/CRC, 2009. p. 71-94.
BLEI, D. M.; NG, A. Y.; JORDAN, M. I. Latent dirichlet allocation. Journal of Machine Learning Research, Cambridge, v. 3, n. jan, p. 993-1022, 2003.
BLUNSOM, P. Hidden markov models. Lecture Notes, Hoboken, v. 15, n. 18-19, p. 1-7, 2004.
BOAI (Budapest Open Access Initiative). Dez anos da Iniciativa de Budapeste em Acesso Aberto: a abertura como caminho a seguir. Budapeste – HU, 2012. Disponível em: http://www.budapestopenaccessinitiative.org/boai-10-translations/portuguesebrazilian-translation. Acesso em: 5 nov. 2019.
BORKO, H. Information science: what is it? American Documentation, Washington, v.19, n.1, p.3-5, 1968.
BRAMBILLA, S. D. S.; STUMPF, I. R. C. Interfaces da Informação: Tendências Temáticas da Pós-Graduação. In: Encontro Nacional de Pesquisa em Ciência da Informação, viii., 2007, Salvador - BA. Anais... Salvador: UFBA, 2007.
BROOKES, B. C. The foundations of Information Science: part I - philosophical aspects. Journal of Information Science, New York, v. 2, n. 3-4, p. 125-133, 1980.
CALTABIANO, M.; VERZI, P.; SCAPPUZZO, S. G. Head posture in orthodontics: physiopathology and clinical aspects 2. Mondo ortodontico, Milano, v. 14, n. 3, p. 313-324, 1989.
CAMPELLO, B. S. Encontros científicos. In: CAMPELLO, B. S.; CENDÓN, B. V.; KRENMER J. M. (org.). Fontes de informação para pesquisadores e profissionais. Belo Horizonte: Editora UFMG, 2007a, p. 55-71.
CAMPELLO, B. S. Pesquisa em andamento. In: CAMPELLO, B. S.; CENDÓN, B. V.; KRENMER J. M. (org.). Fontes de informação para pesquisadores e profissionais. Belo Horizonte – MG: Editora UFMG, 2007b, p. 49-54.
CAMPELLO, B. S. Teses e dissertações. In: CAMPELLO, B. S.; CENDÓN, B. V.; KRENMER J. M. (org.). Fontes de informação para pesquisadores e profissionais. Belo Horizonte: Editora UFMG, 2007c, p. 121-128.
CAPURRO, R. Epistemologia e Ciência da Informação. In: Encontro Nacional de Pesquisa em Ciência da Informação, v., 2003, Belo Horizonte - MG. Anais... Belo Horizonte: UFMG, 2003.
CAPURRO, R.; Hjorland, B. O conceito de informação. Perspectivas em Ciência Da Informação, Belo Horizonte, v. 12, n. 1, p. 148-207, 2007.
CARVALHO, M. C. M. Construindo o saber: metodologia científica: fundamentos e técnicas. 22. ed. Campinas: Papirus, 2010.
CASTRO, C. A. História da biblioteconomia brasileira: perspectiva histórica. Brasília: Thesaurus, 2000.
CESARINO, M. A. N.; PINTO, M. C. M. F. Análise de assunto. Revista de Biblioteconomia de Brasília, Brasília, v. 8, n. 1, p. 32-43, 1980.
CHANEY, A. J. B.; BLEI, D. M. Visualizing topic models. In: Sixth international AAAI conference on weblogs and social media, p. 419-422, 2012.
CHANG, J. et al. Reading Tea Leaves: How humans interpret topic models. In: Advances in Neural Information Processing Systems, p. 288-296. 2009.
CHENG, X. et al. Coupled term-term relation analysis for document clustering. In: The 2013 International Joint Conference on Neural Networks, IEEE, p. 1-8. 2013.
CHU, C. M.; O’BRIEN, A. Subject analysis: the critical first estage in indexing. Journal of Information Science, New York, v. 19, n. 6, p. 439-454, 1993.
CHUANG, J.; MANNING, C. D.; HEER, J. Termite: Visualization Techniques for Assessing Textual Topic Models. In: Proceedings of the International Working Conference on Advanced Visual Interfaces, p. 74-77, 2012.
CONRAD, S.; BIBER, D. Variation in English: multi-dimensional studies. New York: Longman, 2001.
CRESWELL, J. W. Projeto de pesquisa: Métodos qualitativos, quantitativos e misto. 3. ed. Porto Alegre: Artmed, 2010.
CUNHA, M. B. Para saber mais: fontes de informação em ciência e tecnologia. Brasília: Briquet de Lemos, 2001.
OLIVEIRA, J. V; PEDRYCZ, W. (org.). Advances in fuzzy clustering and its applications. West Sussex: John Wiley & Sons, 2007. 454p.
DEERWESTER, S. et al. Improving information retrieval with latent semantic indexing. In: AMERICAN SOCIETY FOR INFORMATION
SCIENCE ANNUAL MEETING, 51., 1988, Atlanta. Proceedings... Medford: Information Today, 1988. p. 36-40.
DEERWESTER, S. et al. Indexing by latent semantic analysis. Journal of the american society for information science, New York, v. 41, n. 6, p. 391-407, 1990.
DEMO, P. Metodologia Científica em Ciências Sociais. 3. ed. São Paulo: Atlas, 1995.
DIAS, E. W.; NAVES, M. M. L. Análise de Assunto Teoria e Prática: Estudos Avançados em Ciência da Informação. Brasília: Thesaurus, 2007.
DUMAIS, S. T. Latent semantic indexing (lsi): Trec-3 report. In Proceedings of the Text REtrieval Conference (TREC-3), 1995. p. 219-230.
FAIRTHORNE, R.A. Content analysis, specification, and control. Annual Review of Information Science and Technology, v. 4, p. 73-109, 1969.
FONSECA, M. S. Produtividade e impacto de pesquisadores brasileiros em Ciência da Informação: análise dos autores do ENANCIB 2013. 2015. 239 f. Dissertação (Mestrado em Ciência da Informação) – Departamento de Ciência da Informação, Universidade Federal de Santa Catarina, Florianópolis, 2015.
FOSKETT, A. C. A abordagem temática da informação. São Paulo: Polígono, 1973.
FUJITA, M. S. L. A identificação de conceitos no processo de análise de assunto para indexação. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas – SP, v. 1, n. 1, p. 60–90, 2003.
GIL, A. C. Como elaborar projetos de pesquisa. 5. ed. São Paulo: Atlas, 2010.
GIL, A. C. Métodos e técnicas de Pesquisa Social. 6. ed. Campos Elísios: Atlas, 2016.
GONZALEZ, M.; LIMA, V. L. S. Recuperação de informação e processamento da linguagem natural. In: XXIII Congresso da Sociedade Brasileira de Computação, 2003. p. 347-395.
GRAESSER, A. C. et al. Using latent semantic analysis to evaluate the contributions of students in AutoTutor. Interactive learning environments, v. 8, n. 2, p. 129-147, 2000.
GRANGER, S. Learner english on computer. London: Longman, 1998.
GREENE, D.; O’CALLAGHAN, D; CUNNINGHAM. How many topics? Stability analysis for Topic models. In: CALDERS, T et al. (org). Joint European Conference on Machine Learning and Knowledge Discovery in Databases. Berlin: Springer, 2014. p. 498-513.
GRUS, J. Data Science do zero: primeiras regras com Python. Rio de Janeiro: Alta Books, 2016.
HARMON, G. On the evolution of Information Science. Journal of the American Society for Information Science and Technology, New York, v.22, n.4, p.235-241, 1971.
HIRSCH, J. E. An index to quantify an individual’s scientific research output. In: Proceedings of the National academy of Sciences, v. 102, n. 46, p. 16569-16572, 2005.
HOFMANN, T. Probabilistic Latent Semantic Analysis. In: Proceedings of the Fifteenth Conference on Uncertainty in Artificial Intelligence, p. 289-296, 1999a.
HOFMANN, T. Probabilistic Latent Semantic Indexing. In: Proceedings of the 22nd Annual International Conference on Research and Development in Information Retrieval, p. 50-57, 1999b.
KASZUBOWSKI, E. Modelo de tópicos para associações livres. 2016. 227 f. Tese (Doutorado em Psicologia) – Centro de Filosofia e Ciências Humanas, Universidade Federal de Santa Catarina, Florianópolis, 2016.
KENNEDY, G. An Introduction to corpus linguistics. London: Longman, 1998.
LANCASTER, F. W. Indexação e resumos: teoria e prática. 2. ed. Brasília: Briquet de Lemos Livros, 2004.
LANDAUER, T. K.; DUMAIS, S. T. A solution to Plato’s problem: The latent semantic analysis theory of acquisition, induction, and representation of knowledge. Psychological Review, Washington, v. 104, n. 2, p. 211-240, 1997.
LANGRIDGE, D. Classificação: abordagem para estudantes de biblioteconomia. Rio de Janeiro: Interciência, 1997.
LARA, M. L. G.; CONTI, V. L. Disseminação da informação e usuários. São Paulo em Perspectiva, São Paulo, v. 17, n. 3-4, p. 26-34, 2003.
LAU, J. H. et al. Automatic labeling of topic models. In: Proceedings of the 49th annual meeting of the association for computational linguistics, p. 1536-1545, 2011.
LE COADIC, Y.F. A ciência da informação. 2. ed. Brasília: Briquet de Lemos Livros, 2004.
LEMOS, D. L. S.; SOUZA, R. R. Organização de recursos bibliográficos e multimídia na web: contribuições interdisciplinares, Informação & Informação, Londrina, v. 23, n. 2, p. 98-126, 2018.
MARQUESONE, R. Big data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2016.
MANNING, C.D.; RAGHAVAN, P.; SCHÜTZE, H. Introduction to information retrieval. Cambridge: Cambridge University Press, 2009.
MARTIN, D. I.; BERRY, M. W. Mathematical Foundations Behind Latent Semantic Analysis. In Handbook of latent semantic analysis. In:
LANDAUER, T. K. et al. Handbook of latent semantic analysis. New York: Routledge, 2011, p. 35–56.
MCKINNEY, W. Python para análise de dados: tratamento de dados com pandas, numpy e ipython. São Paulo: Novatec, 2018.
MICHEL, M. H. Metodologia e pesquisa científica em ciências sociais: um guia prático para acompanhamento da disciplina e elaboração de trabalhos monográficos. 3. ed. São Paulo: Atlas, 2015.
MIKHAILOV, A. I.; GILYAREVSKIJ, R.G. An Introductory course on informatics/documentation. Programme and meeting document. 1970.
MIRANDA, A. A Ciência da Informação e a teoria do conhecimento objetivo: um relacionamento necessário. In: AQUINO, M. A. (org). O campo da Ciência da Informação: gênese, conexões e especificidades. João Pessoa: Universitária/UFPB, 2002, p. 9-24.
MIRANDA, D. B.; PEREIRA, M. N. F. O periódico científico como veículo de comunicação: uma revisão de literatura. Ciência da Informação, Brasília, v. 25, n. 3, p. 375-382, 1996.
MUELLER, S. P. M. A comunicação científica e o movimento de acesso livre ao conhecimento. Ciência da Informação, Brasília, v. 35, n. 2, p. 27-38, 2006.
MUELLER, S. P. M. A ciência, o sistema de comunicação e a literatura científica. In: CAMPELLO, B. S.; CENDÓN, B. V.; KRENMER J. M. (org.). Fontes de informação para pesquisadores e profissionais. Belo Horizonte: Editora UFMG, 2007a, p. 21-34.
MUELLER, S. P. M. O periódico científico. In: CAMPELLO, B. S.; CENDÓN, B. V.; KRENMER J. M. (org.). Fontes de informação para pesquisadores e profissionais. Belo Horizonte: Editora UFMG, 2007b, p. 73-95.
NAVES, M. M. L. Análise de assunto: Concepções. Revista de Biblioteconomia de Brasília, Brasília, v. 20, n. 2, p. 215-226, 1996.
NAVES, M. M. L. Fatores interferentes no processo de análise de assunto: estudo de caso de indexadores. Tese (Tese em Ciência da Informação) - Programa de Pós-Graduação em Ciência da Informação, Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2000. Universidade Federal de Minas Gerais.
NHACUONGUE, J. A.; FERNEDA, E. O campo da ciência da informação: contribuições, desafios e perspectivas. Perspectivas em Ciência da Informação, Belo Horizonte, v. 20, n. 2, p. 3-18, 2015.
NOLASCO, D. Identificação automática de áreas de pesquisa em C&T. 2016. 195 f. Dissertação (Mestrado em Informática) – Departamento de Ciência da Computação, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2016.
NOLASCO, D.; OLIVEIRA, J. Detecting knowledge innovation through automatic topic labeling on scholar data. In: 2016 49th Hawaii International Conference on System Sciences (HICSS). IEEE, p. 358-367, 2016a.
NOLASCO, D.; OLIVEIRA, J. Modelagem de tópicos e criação de rótulos: identificando temas em dados semi-estruturados e não-estruturados. In: OGASAWARE, E.; VIEIRA, V. (org.). Tópicos em gerenciamento de dados e informação. Salvador: Sociedade Brasileira da Computação, 2016b, p. 87-112.
ODDONE, N. E. Atividade editorial & Ciência da Informação: convergência epistemológica. 1998. 266 f. Dissertação (Mestrado em Ciência da Informação) – Departamento de Ciência da Informação e Documentação, Faculdade de Estudos Sociais Aplicados, Universidade de Brasília, Brasília, 1998.
OLIVEIRA, E. B. P. M. Periódicos científicos eletrônicos: definições e histórico. Informação & Sociedade, João Pessoa, v. 18, n. 2, p. 69-77, 2008.
OLIVEIRA, E. F. T.; GRACIO, M. C. C. Indicadores bibliométricos em ciência da informação: análise dos pesquisadores mais produtivos no tema estudos métricos na base Scopus. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 4, p. 16-28, 2011.
OLIVEIRA, L. P. Linguística de Corpus: teoria, interfaces e aplicações. Matraga - Estudos Linguísticos e Literários, Rio de Janeiro, v. 16, n. 24, p. 48–76, 2009.
OLIVEIRA, L. P.; DIAS, M. C. P. Compilação de corpus: representatividade e o CORPOBRAS. Calidoscópio. São Leopoldo, v. 7, n. 3, p. 192-198, 2009.
OLIVEIRA, M. A investigação científica na ciência da informação: análise da pesquisa financiada pelo CNPq. 1998. 218 f. Tese (Doutorado em Ciência da Informação) – Universidade de Brasília, Brasília, 1998.
OLIVEIRA, M. Origens e evolução da ciência da informação. In: OLIVEIRA, M. (org.). Ciência da informação e biblioteconomia: novos conteúdos e espaços de atuação. 2. ed. Belo Horizonte: Editora UFMG, 2011. p. 9-28.
OTHERO, G. Á. Lingüística Computacional: uma breve introdução. Letras de Hoje, Porto Alegre, v. 41, n. 2, p. 341–351, 2006.
PAPADIMITRIOU, C. H. et al. Latent semantic indexing: A probabilistic analysis. In: Proceedings of the 1998 17th ACM SIGART-
SIGMOD-SIGART Symposium on Principles of Database Systems, p. 159-168, 1998.
PINHEIRO, L. V. R. A Ciência da Informação entre sombra e luz: domínio epistemológico e campo interdisciplinar. 1997. 278 f. Tese (Doutorado em Comunicação) – Centro de Filosofia e Ciências Humanas, Escola de Comunicação, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 1997.
PINHEIRO, L. V. R. Gênese da Ciência da Informação ou sinais anunciadores da nova área. In: AQUINO, M. A. (org). O campo da Ciência da Informação: gênese, conexões e especificidades. João Pessoa: UFPB, 2002. p. 61-86.
PINHEIRO, L. V. R. Ciência da Informação: desdobramentos disciplinares interdisciplinaridade e transdisciplinaridade. In: GOMEZ, M. N. G.; ORRICO, E. G, D. (Org.). Políticas de memória e informação: reflexos na organização do conhecimento. Natal: EDUFRN, 2006. p. 111-141.
PINTO, A. L.; MATIAS, M.; GONZÁLEZ, J. A.M. Produção brasileira da Ciência da Informação na Web of Science entre 1994 e 2013 e a lista Qualis/Capes da Área. Ibersid: revista de sistemas de información y documentación. Saragoça, v. 10, n. 1, p. 51-61, 2016.
PUJARA, J.; SKOMOROCH, P. Large-Scale Hierarchical Topic Models. In: NIPS Workshop on Big Learning, p. 1–8, 2012.
PUSTEJOVSKY, J.; STUBBS, A. Natural Language Annotation for Machine Learning: a guide to corpus-building for applications. Champaign: O'Reilly Media, 2012.
QUEIROZ, D. G. D. C.; MOURA, A. M. M. Ciência da Informação: história, conceito e características. Em Questão. Porto Alegre, v. 21, n. 3, p. 26-42, 2015.
RAMAGE, D.; MANNING, C. D.; DUMAIS, S. Partially labeled topic models for interpretable text mining. In: Proceedings of the 17th
ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, p. 457-465, 2011.
RAYWARD, W. B. Visions of Xanadu: Paul Otlet (1868-1944) and Hypertext. Journal of the American Society for Information Science, New York, v. 45, n. 4, p. 235-250, 1994.
RICHARDSON, R. J. Pesquisa Social: Métodos e Técnicas. 3. ed. São Paulo: Atlas, 2010.
ROWLEY, J. A biblioteca eletrônica. 2. ed. Brasília: Briquet de Lemos, 2002.
RUSSO, M. Fundamentos de biblioteconomia e Ciência da Informação. Rio de Janeiro: E-papers, 2010.
SAMPAIO, M. I. C.; SABADINI, A. A. Z. P. Indexação e fator de impacto. In: SAMPAIO, M. I. C.; SABADINI, A. A. Z. P.; KOLLER, S. H. (org). Publicar em Psicologia: um enfoque para a revista científica. São Paulo: Associação Brasileira de Editores Científicos de Psicologia / Instituto de Psicologia da Universidade de São Paulo, 2009. p. 109-121.
SANTOS, F. F. Extração de tópicos baseado em agrupamento de regras de associação. 2015. 129 f. Tese (Doutorado em Ciências de Computação e Matemática Computacional) – Universidade de São Paulo, São Carlos, 2015.
SANTOS, G. C. Fontes de indexação para periódicos científicos: um guia para bibliotecários e editores. Campinas: E-color Editora, 2011.
SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspectiva em Ciência da Informação. Belo Horizonte, v. 1, n. 1, p. 41–62, 1996.
SARDINHA, T. B. Processamento Computacional do Português. Simpósio, 9o. InPLA, PUCSP, São Paulo, 1999.
SARDINHA, T. B. Lingüística de corpus: histórico e problemática. Delta: documentação de estudos em lingüística teórica e aplicada, São Paulo, v. 16, n. 2, p. 323-367, 2000a.
SARDINHA, T. B. O que é um corpus representativo? Direct Papers, São Paulo, v. 44, 2000b.
SARDINHA, T. B. Lingüística de corpus. Barueri: Manole LTDA, 2004.
SVARTVIK, J. Corpora are becoming mainstream. In: THOMAS, J.; SHORT, M. (org). Using corpora for language research. London: Longman, 1996. p. 3-13.
SAVOLAINEN, Reijo. The sense-making theory: An alternative to intermediary-centered approaches. In: library and information science. Conceptions of Library and Information Science, Taylor Graham, London, p. 149-64, 1992.
SCARPA, A. D. Técnicas de Processamento de Linguagem Natural Aplicadas às Ciências Sociais. 2017. 86 f. Dissertação (Mestrado em Matemática Aplicada) – Escola de Matemática Aplicada, Fundação Getúlio Vargas, Rio de Janeiro, 2017.
SEVERINO, A. J. Metodologia do trabalho científico. 21. ed. São Paulo: Cortez, 2000.
SEVERINO, A. J. Metodologia do trabalho científico. 24. ed. São Paulo: Cortez, 2016.
SHERA, J. H.; CLEVELAND, D. B. History and foundations of Information Science. Annual Review of Information Science and Technology, New York, v. 12, p. 249-275, 1977.
SIEVERT, C.; SHIRLEY, K. E. LDAvis: A method for visualizing and interpreting topics. In: Proceedings of the Workshop on Interactive Language Learning, Visualization, and Interfaces, p. 63-70, 2014.
SOUSA, B. P.; FUJITA, M. S. L. Análise de assunto no processo de indexação: um percurso entre teoria e norma. Informação & Sociedade, João Pessoa, v. 24, n. 1, p. 19–34, 2014.
SOUZA, M. P. N. Abordagem inter e transdiciplinar em ciência da informação. In TOUTAIN, L. M. B. B. (org.). Para entender a ciência da informação. Salvador: EDUFBA, 2007, p. 75-90.
SOUZA, M.; JÚNIOR, A. I.; SOUZA, R. R. Modelagem de tópicos: mapeamento científico do gt-8 do enancib. In: Encontro Nacional de Pesquisa em Ciência da Informação, 20., 2007, Florianópolis - SC. Anais... Florianópolis: UFSC, 2019.
SOUZA, M.; SOUZA, R. R. Modelagem de tópicos: resumir e organizar corpus de dados por meio de algoritmos de aprendizagem de máquina. Múltiplos Olhares em Ciência da Informação, Belo Horizonte, v. 9, n. 2, p. 1–11, 2019.
SOUZA, R. R.; ALMEIDA, M. B.; BARACHO, R. M. A. Ciência da informação em transformação: big data, nuvens, redes sociais e web semântica. Ciência da Informação, Brasília, v. 42, n. 2, p. 159–173, 2015.
STEYVERS, M.; GRIFFITHS, T. Probabilistic topic models. In: LANDAUER, T. K. et al. Handbook of latent semantic analysis. Mahwah: Lawrence Erlbaum Associates, 2007, p. 424-440.
TÁLAMO, M. F. G. M. Elaboração de resumos. São Paulo: Escola de Comunicação e Artes, 1987.
TEH, Y. W. et al. Hierarchical dirichlet processes. Journal of the American Statistical Association, New York, v. 101, n. 476, p. 1566-1581, 2006.
TODD, R. T. Academic indexing: what`s it all about? The Indexer, London, v. 18, n. 2, p. 101-104, 1992.
VICKERY, B. C. Classificação e indexação nas ciências. Rio de Janeiro: BNG/BRASILART, 1980.
VIEIRA, R. Lingüística computacional: fazendo uso do conhecimento da língua. Entrelinhas, São Leopoldo, ano 2, n. 4, p. 20–25, 2002.
VIEIRA, R.; LIMA, V. L. S. Lingüística computacional: princípios e aplicações. In: Congresso da Sociedade Brasileira de Computação, I Jornada de Atualização em Inteligência Artificial, xxi, 2001. p. 47-86.
WALLACH, H. M. Topic modeling: beyond bag-of-words. In: Proceedings of the 23rd international conference on machine learning, p. 977-984, 2006.
WANG, X.; MCCALLUM, A.; WEI, X. Topical N-grams: Phrase and topic discovery, with an application to information retrieval. In: Seventh IEEE international conference on data mining (ICDM 2007), p. 697-702, 2007.
WERSIG, G.; NEVELING, U. The phenomena of interest to Information Science. The information scientist, London, v. 9, n. 4, p. 127-140, 1975.
WERSIG, G. Information science: the study of postmodern knowledge usage. Information processing & management, New York, v. 29, n. 2, p. 229-239, 1993.
WITTER, D. I.; BERRY, M. W. Downdating the Latent Semantic Indexing Model for Conceptual Information Retrieval. The Computer Journal, Manchester, v. 41, n. 8, p. 589-601, 1998.
WORLD INFORMATION SYSTEM FOR SCIENCE AND TECHNOLOGY. Princípios de indexação. Revista Da Escola de Biblioteconomia Da UFMG, Belo Horizonte, v.10, n. 1, p. 83–94, 1981.
YANG, Yi et al. Active learning with constrained topic model. In: Proceedings of the Workshop on Interactive Language Learning, Visualization, and Interfaces. p. 30-33, 2014.
ZHU, D. et al. Intuitive Topic Discovery by Incorporating Word-Pair’s Connection Into LDA. In: 2012 IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology, p. 303-310, 2012.
ZINS, C. knowledge map of information science: issues, principles, implications. Jerusalem, 2005.
ZINS, C. Conceptions of informations science. Journal of the American Society for Information Science and Technology, New York, v. 58, n. 3, p. 335-350, 2007.
ZINS, C,; Santos, P. L. V. A. C. Brazilian model of library and information studies in the bachelor’s level. Informação & Sociedade, João Pessoa, v. 25, n. 3, p. 185-203, 2015.
ZIMAN, John. Conhecimento público. Belo Horizonte: Itatiaia, 1979.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Autores que publicam nesta revista concordam com os seguintes termos:
a. Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License que permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial nesta revista.
b. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.