ANÁLISE DE DOCUMENTOS DE PATENTES UTILIZANDO UM SISTEMA MULTIMODAL: PROPOSTA DE INTEGRAÇÃO DA ANÁLISE DE IMAGEM (IMAGÉTICO) E DE REDAÇÃO (SEMÂNTICO) DOS DADOS PATENTÁRIOS
DOI:
https://doi.org/10.66104/34ctx292Palavras-chave:
Análise multimodal; Patentes; Similaridade; Embeddings; Recuperação da informação.Resumo
Este artigo apresenta a proposta de um protótipo para análise de similaridade multimodal de patentes, integrando informações textuais e visuais com o objetivo de aprimorar as capacidades de busca e fomentar a análise de anterioridade. A metodologia emprega TF-IDF para a geração de embeddings textuais e uma abordagem simplificada para embeddings visuais, baseada no redimensionamento, conversão para escala de cinza e achatamento das imagens. A implementação foi realizada em ambiente Python, com ingestão direta de dados a partir de links de patentes provenientes do Google Patents, permitindo a execução automatizada dos processos de extração e análise. Os embeddings gerados são combinados por meio de uma função de pontuação multimodal ponderada, possibilitando a identificação de patentes semelhantes. Adicionalmente, é construído um grafo de conhecimento básico em memória, com a finalidade de representar as relações entre os documentos analisados. Os resultados demonstram a viabilidade e os benefícios da integração de múltiplas modalidades de dados, oferecendo um sistema inicial para o aprimoramento da recuperação de patentes. Embora fundamentado em técnicas simplificadas, o trabalho estabelece bases sólidas para pesquisas futuras, incluindo a adoção de modelos de embeddings mais avançados, soluções escaláveis de busca vetorial e a utilização de bancos de dados persistentes para grafos de conhecimento.
Downloads
Referências
AGUIAR, Isabela; CAMPOS DOS SANTOS, José L.; ALBUQUERQUE, Andréa C. F. Análise de similaridade semântica de patentes utilizando processamento de linguagem natural e busca híbrida. Edição especial: Propriedade Intelectual, Inovação e a Nova Economia Digital – Contributos da VII Semana Acadêmica da Propriedade Intelectual, v. 2, n. 4, 2025.
ANJOS, Alfredo Cesar dos. Uma arquitetura para sistemas de localização de especialistas baseada em modelo de linguagem de grande escala. 2025. Trabalho acadêmico (Pós-Graduação em Engenharia e Gestão do Conhecimento) – Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2025.
ASSOCIAÇÃO BRASILEIRA DOS AGENTES DA PROPRIEDADE INDUSTRIAL (ABAPI).
USPTO lança programa de IA de patente.
Disponível em: https://abapi.org.br/uspto-lanca-programa-de-ia-de-patente/.
Acesso em: 23 dez. 2025.
AWALE, Sushil; MÜLLER-BUDACK, Eric; DELAVIZ, Rahim; EWERTH, Ralph. Exploring patents visually: an interactive search system for multimodal patent image search and interpretation. In: 6th Workshop on Patent Text Mining and Semantic Technologies (PatentSemTech), 2025. Hannover: CEUR Workshop Proceedings, 2025. Disponível em: https://service.tib.eu/ipatent. Acesso em: 01 nov. 2025.
BARTHES, Roland. A retórica da imagem. O óbvio e o obtuso. Rio de Janeiro: Nova Fronteira, 1990.
BOTELHO, L. L. R.; CUNHA, C. C. A.; MACEDO, M. O método da revisão integrativa nos estudos organizacionais. Gestão e Sociedade, Belo Horizonte, v. 5, n. 11, p. 121-136, 2011.
BRAZ, Bruna Oliveira; CRISTOVÃO, Vera Lúcia Lopes. Análise de produções textuais multimodais de divulgação científica das ciências da linguagem. Entrepalavras, Fortaleza, v. 13, n. 2, p. 111–129, maio/ago. 2023. Disponível em: http://www.entrepalavras.ufc.br/revista/index.php/Revista/article/view/2664/1031. Acesso em: 4 nov. 2025.
CONSOLONI, Marco; GIORDANO, Vito; FANTONI, Gualtiero. Assessing text-image patent datasets with text-based metrics for engineering design applications. In: INTERNATIONAL DESIGN CONFERENCE – DESIGN 2024. Dubrovnik, Croácia: Cambridge University Press, 2024. p. 1969–1978. DOI: https://doi.org/10.1017/pds.2024.199.
DEEP LEARNING BOOK. Capítulo 84 – CLIP (Contrastive Language Image Pre-training): Conectando Texto e Imagens. Disponível em: <https://www.deeplearningbook.com.br/clip-contrastive-language-image-pre-training-conectando-texto-e-imagens/>. Acesso em: 22 dez. 2025.
FARHAT, Theodoro Casalotti; GONÇALVES-SEGUNDO, Paulo Roberto. ANÁLISE MULTIMODAL: noções e procedimentos fundamentais. Trabalhos em Linguística Aplicada, [S.L.], v. 61, n. 2, p. 435-454, ago. 2022. FapUNIFESP (SciELO). http://dx.doi.org/10.1590/010318138666675v61n22022.
HALEEM, A.; JAVAID, M.; SINGH, R. P. Understanding patent analysis through artificial intelligence. Journal of Intellectual Property Rights, v. 24, n. 2, p. 99–108, 2019.
HESSEL, Ana Maria Di Grado; LEMES, David de Oliveira. Criatividade da Inteligência Artificial Generativa. TECCOGS – Revista Digital de Tecnologias Cognitivas, São Paulo, n. 28, p. 119-130, 2023. https://doi.org/10.23925/1984-3585.2023i28p119-130
HIGUCHI, Kotaro; YANAI, Keiji. Patent image retrieval using transformer-based deep metric learning. World Patent Information, v. 74, p. 102217, set. 2023. DOI: https://doi.org/10.1016/j.wpi.2023.102217.
JI, Yong. Intelligent Patent Text Summarization Analysis Method. In: INTERNATIONAL CONFERENCE ON SYSTEMS AND INFORMATICS (ICSAI), 7., 2021. [S.l.]: IEEE, 2021. DOI: 10.1109/ICSAI53574.2021.9664064. Disponível em: https://ieeexplore.ieee.org/. Acesso em: 30 abr. 2023.
JOHNSON, J.; DOUZE, M.; JÉGOU, H. Billionscale similarity search with GPUs. IEEE Transactions on Big Data, v. 7, n. 3, p. 535547, 2019.
JURANEK, Steffen; OTNEIM, Håkon. Predicting patent lawsuits with machine learning. International Review of Law & Economics, v. 80, 106228, 2024. DOI: 10.1016/j.irle.2024.106228.
KRESTEL, R.; DERBOVEN, S.; MÜLLER, H. Machine learning in patent text analysis: A review. World Patent Information, v. 65, p. 102030, 2021.
KRESS, Gunther; VAN LEEUWEN, Theo. Reading images: the grammar of visual design. 2. ed. London: Routledge, 2006.
LEITE, Leonardo Silva; SILVA, Cícera Henrique da. Otimização de expressão para busca de patentes: estudo de caso sobre diagnóstico de malária. RECIIS – Revista Eletrônica de Comunicação, Informação e Inovação em Saúde, Rio de Janeiro, v. 7, n. 3, set. 2013. DOI: 10.3395/reciis.v7i3.599pt.
LI, X.; PARSONS, J. Ontological semantics for the use of UML in conceptual modeling. In: Proceedings of the International Conference on Conceptual Modeling. Berlin: Springer, 2009.
LI, J.; ZHAO, K.; CHEN, Y. Multimodal deep learning for patent image and text analysis. IEEE Transactions on Knowledge and Data Engineering, v. 36, n. 4, p. 2234–2247, 2024.
MORAIS, Alaydes Mikaelle de; DIAS, Cleber Gustavo. Desenvolvimento de um índice de infração de patentes com apoio de inteligência artificial multimodal. Navus – Revista de Gestão e Tecnologia, v. 16, 2025. DOI: 10.22279/navus.v16.2133. Disponível em: https://doi.org/10.22279/navus.v16.2133. Acesso em: 23 out. 2025.
MORAIS, Edison Andrade Martins; AMBRÓSIO, Ana Paula L. Ontologias: conceitos, usos, tipos, metodologias, ferramentas e linguagens. Relatório Técnico INF_001/07. Instituto de Informática, Universidade Federal de Goiás, dez. 2007. Disponível em: https://ww2.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-07.pdf. Acesso em: 19 dez. 2025.
NAVEED, H. et al. A comprehensive overview of large language models. arXiv preprint arXiv:2307.06435, 2023. Disponível em: https://arxiv.org/abs/2307.06435. Acesso em: 1 abr. 2024.
OTTELO, Andrea; SMITH, John. Multimodal learning for document analysis: integrating text and image representations. Information Processing & Management, v. 57, n. 2, p. 102–118, 2020.
OLIVEIRA, H. C.; CARVALHO, C. L. Gestão e representação do conhecimento. Goiânia: Instituto de Informática: Universidade Federal de Goiás, 2008.
OPENAI. Contrastive Language-Image Pre-training (CLIP). Disponível em: <https://en.wikipedia.org/wiki/Contrastive_Language-Image_Pre-training>. Acesso em: 22 dez. 2025.
PIRES, Edilson Araújo; RIBEIRO, Nubia Moura; QUINTELLA, Cristina M.. Sistemas de Busca de Patentes: análise comparativa entre espacenet, patentscope, google patents, lens, derwent innovation index e orbit intelligence. Cadernos de Prospecção, [S.L.], v. 13, n. 1, p. 13, 27 mar. 2020. Universidade Federal da Bahia. http://dx.doi.org/10.9771/cp.v13i1.35147.
PUSTU-IREN, Kader; BRUNS, Gerrit; EWERTH, Ralph. A multimodal approach for semantic patent image retrieval. In: PatentSemTech, 15 jul. 2021, online. Hannover: TIB – Leibniz Information Centre for Science and Technology, 2021.
RADFORD, A. et al. Learning transferable visual models from natural language supervision. Proceedings of the 38th International Conference on Machine Learning, 2021.
REIMERS, N.; GUREVYCH, I. SentenceBERT: Sentence embeddings using Siamese BERTnetworks. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing, 2019.
SALTON, G.; BUCKLEY, C. Termweighting approaches in automatic text retrieval. Information Processing & Management, v. 24, n. 5, p. 513523, 1988.
SANTOS, André Moraes dos; QUONIAM, Luc; KNIESS, Claudia Terezinha; REYMOND, David. Ferramentas para extração e análise de informações em base de patentes: uma aplicação para o modelo de hélice quíntupla. In: SINGEP – SIMPÓSIO INTERNACIONAL DE GESTÃO DE PROJETOS, INOVAÇÃO E SUSTENTABILIDADE, 2., 2014, São Paulo. Anais [...]. São Paulo: SINGEP/S2IS, 2014.
SOMMERVILLE, I. Engenharia de software. Tradução de Kalinka Oliveira e Ivan Bosnic. 9. ed. São Paulo: Pearson Prentice Hall, 2011.
SHUKLA, Shreya; SHARMA, Nakul; GUPTA, Manish; MISHRA, Anand. PatentLMM: Large Multimodal Model for Generating Descriptions for Patent Figures. In: The Thirty-Ninth AAAI Conference on Artificial Intelligence (AAAI-25), 2025, [Anais...]. Palo Alto, CA: Association for the Advancement of Artificial Intelligence, 2025. Disponível em: https://ojs.aaai.org/index.php/AAAI/article/view/34257. Acesso 23 out. 2025.
VASCONCELOS LOBO, L.; SOUSA, J. P. Uso da inteligência artificial para a automação da análise de patentes. Revista Eletrônica Científica Inovação e Tecnologia, Curitiba, v. 16, n. 39, 2025. Disponível em: https://revistas.utfpr.edu.br/recit/article/view/19171. Acesso em: 23 out. 2025.
VOLPE, Michele Cristine Soares Campos. Direito autoral e aprendizagem de IA generativa: análise comparada Brasil e Estados Unidos no uso de obras protegidas para treinamento de IA. Revista DCS, v. 22, n. 84, 2025. DOI: https://doi.org/10.54899/dcs.v22i84.3880. Disponível em: https://ojs.revistadcs.com/index.php/revista/article/view/3880. Acesso em: 11 dez. 2025.
XU, L.; WANG, H.; ZHANG, Q. Visual features in patent similarity detection using convolutional neural networks. Expert Systems with Applications, v. 221, p. 119726, 2023.
WANG, H. et al. Pre-trained language models and their applications. Engineering, v. 25, p. 51-65, 2023.
WIPO. Patent information and documentation handbook. Geneva: World Intellectual Property Organization, 2023.
WHITTEMORE, R.; KNAFL, K. The integrative review: updated methodology. Journal of Advanced Nursing, v. 52, n. 5, p. 546-53, 2005.
YAGER, K. G. Domain-specific chatbots for science using embeddings. Digital Discovery, v. 2, p. 1850-1861, 2023.
ZHANG, T.; LIU, F.; GUO, W. Patent image understanding via deep learning. Information Processing & Management, v. 59, n. 3, p. 102925, 2022
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2026 Thiago Domingos Marques , Alexandre Leopoldo Gonçalves

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista;
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista, desde que adpatado ao template do repositório em questão;
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
- Os autores são responsáveis por inserir corretamente seus dados, incluindo nome, palavras-chave, resumos e demais informações, definindo assim a forma como desejam ser citados. Dessa forma, o corpo editorial da revista não se responsabiliza por eventuais erros ou inconsistências nesses registros.
POLÍTICA DE PRIVACIDADE
Os nomes e endereços informados nesta revista serão usados exclusivamente para os serviços prestados por esta publicação, não sendo disponibilizados para outras finalidades ou a terceiros.
Obs: todo o conteúdo do trabalho é de responsabilidade do autor e orientador.
