ANÁLISE DE DOCUMENTOS DE PATENTES UTILIZANDO UM SISTEMA MULTIMODAL: PROPOSTA DE INTEGRAÇÃO DA ANÁLISE DE IMAGEM (IMAGÉTICO) E DE REDAÇÃO (SEMÂNTICO) DOS DADOS PATENTÁRIOS

Thiago Domingos  Marques; Alexandre Leopoldo  Gonçalves

doi:10.66104/34ctx292

Autores

Thiago Domingos Marques Universidade Federal de Santa Catarina
Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina

DOI:

https://doi.org/10.66104/34ctx292

Palavras-chave:

Análise multimodal; Patentes; Similaridade; Embeddings; Recuperação da informação.

Resumo

Este artigo apresenta a proposta de um protótipo para análise de similaridade multimodal de patentes, integrando informações textuais e visuais com o objetivo de aprimorar as capacidades de busca e fomentar a análise de anterioridade. A metodologia emprega TF-IDF para a geração de embeddings textuais e uma abordagem simplificada para embeddings visuais, baseada no redimensionamento, conversão para escala de cinza e achatamento das imagens. A implementação foi realizada em ambiente Python, com ingestão direta de dados a partir de links de patentes provenientes do Google Patents, permitindo a execução automatizada dos processos de extração e análise. Os embeddings gerados são combinados por meio de uma função de pontuação multimodal ponderada, possibilitando a identificação de patentes semelhantes. Adicionalmente, é construído um grafo de conhecimento básico em memória, com a finalidade de representar as relações entre os documentos analisados. Os resultados demonstram a viabilidade e os benefícios da integração de múltiplas modalidades de dados, oferecendo um sistema inicial para o aprimoramento da recuperação de patentes. Embora fundamentado em técnicas simplificadas, o trabalho estabelece bases sólidas para pesquisas futuras, incluindo a adoção de modelos de embeddings mais avançados, soluções escaláveis de busca vetorial e a utilização de bancos de dados persistentes para grafos de conhecimento.

Downloads

Os dados de download ainda não estão disponíveis.

Referências

AGUIAR, Isabela; CAMPOS DOS SANTOS, José L.; ALBUQUERQUE, Andréa C. F. Análise de similaridade semântica de patentes utilizando processamento de linguagem natural e busca híbrida. Edição especial: Propriedade Intelectual, Inovação e a Nova Economia Digital – Contributos da VII Semana Acadêmica da Propriedade Intelectual, v. 2, n. 4, 2025.

ANJOS, Alfredo Cesar dos. Uma arquitetura para sistemas de localização de especialistas baseada em modelo de linguagem de grande escala. 2025. Trabalho acadêmico (Pós-Graduação em Engenharia e Gestão do Conhecimento) – Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2025.

ASSOCIAÇÃO BRASILEIRA DOS AGENTES DA PROPRIEDADE INDUSTRIAL (ABAPI).

USPTO lança programa de IA de patente.

Disponível em: https://abapi.org.br/uspto-lanca-programa-de-ia-de-patente/.

Acesso em: 23 dez. 2025.

AWALE, Sushil; MÜLLER-BUDACK, Eric; DELAVIZ, Rahim; EWERTH, Ralph. Exploring patents visually: an interactive search system for multimodal patent image search and interpretation. In: 6th Workshop on Patent Text Mining and Semantic Technologies (PatentSemTech), 2025. Hannover: CEUR Workshop Proceedings, 2025. Disponível em: https://service.tib.eu/ipatent. Acesso em: 01 nov. 2025.

BARTHES, Roland. A retórica da imagem. O óbvio e o obtuso. Rio de Janeiro: Nova Fronteira, 1990.

BOTELHO, L. L. R.; CUNHA, C. C. A.; MACEDO, M. O método da revisão integrativa nos estudos organizacionais. Gestão e Sociedade, Belo Horizonte, v. 5, n. 11, p. 121-136, 2011.

BRAZ, Bruna Oliveira; CRISTOVÃO, Vera Lúcia Lopes. Análise de produções textuais multimodais de divulgação científica das ciências da linguagem. Entrepalavras, Fortaleza, v. 13, n. 2, p. 111–129, maio/ago. 2023. Disponível em: http://www.entrepalavras.ufc.br/revista/index.php/Revista/article/view/2664/1031. Acesso em: 4 nov. 2025.

CONSOLONI, Marco; GIORDANO, Vito; FANTONI, Gualtiero. Assessing text-image patent datasets with text-based metrics for engineering design applications. In: INTERNATIONAL DESIGN CONFERENCE – DESIGN 2024. Dubrovnik, Croácia: Cambridge University Press, 2024. p. 1969–1978. DOI: https://doi.org/10.1017/pds.2024.199.

DEEP LEARNING BOOK. Capítulo 84 – CLIP (Contrastive Language Image Pre-training): Conectando Texto e Imagens. Disponível em: <https://www.deeplearningbook.com.br/clip-contrastive-language-image-pre-training-conectando-texto-e-imagens/>. Acesso em: 22 dez. 2025.

FARHAT, Theodoro Casalotti; GONÇALVES-SEGUNDO, Paulo Roberto. ANÁLISE MULTIMODAL: noções e procedimentos fundamentais. Trabalhos em Linguística Aplicada, [S.L.], v. 61, n. 2, p. 435-454, ago. 2022. FapUNIFESP (SciELO). http://dx.doi.org/10.1590/010318138666675v61n22022.

HALEEM, A.; JAVAID, M.; SINGH, R. P. Understanding patent analysis through artificial intelligence. Journal of Intellectual Property Rights, v. 24, n. 2, p. 99–108, 2019.

HESSEL, Ana Maria Di Grado; LEMES, David de Oliveira. Criatividade da Inteligência Artificial Generativa. TECCOGS – Revista Digital de Tecnologias Cognitivas, São Paulo, n. 28, p. 119-130, 2023. https://doi.org/10.23925/1984-3585.2023i28p119-130

HIGUCHI, Kotaro; YANAI, Keiji. Patent image retrieval using transformer-based deep metric learning. World Patent Information, v. 74, p. 102217, set. 2023. DOI: https://doi.org/10.1016/j.wpi.2023.102217.

JI, Yong. Intelligent Patent Text Summarization Analysis Method. In: INTERNATIONAL CONFERENCE ON SYSTEMS AND INFORMATICS (ICSAI), 7., 2021. [S.l.]: IEEE, 2021. DOI: 10.1109/ICSAI53574.2021.9664064. Disponível em: https://ieeexplore.ieee.org/. Acesso em: 30 abr. 2023.

JOHNSON, J.; DOUZE, M.; JÉGOU, H. Billionscale similarity search with GPUs. IEEE Transactions on Big Data, v. 7, n. 3, p. 535547, 2019.

JURANEK, Steffen; OTNEIM, Håkon. Predicting patent lawsuits with machine learning. International Review of Law & Economics, v. 80, 106228, 2024. DOI: 10.1016/j.irle.2024.106228.

KRESTEL, R.; DERBOVEN, S.; MÜLLER, H. Machine learning in patent text analysis: A review. World Patent Information, v. 65, p. 102030, 2021.

KRESS, Gunther; VAN LEEUWEN, Theo. Reading images: the grammar of visual design. 2. ed. London: Routledge, 2006.

LEITE, Leonardo Silva; SILVA, Cícera Henrique da. Otimização de expressão para busca de patentes: estudo de caso sobre diagnóstico de malária. RECIIS – Revista Eletrônica de Comunicação, Informação e Inovação em Saúde, Rio de Janeiro, v. 7, n. 3, set. 2013. DOI: 10.3395/reciis.v7i3.599pt.

LI, X.; PARSONS, J. Ontological semantics for the use of UML in conceptual modeling. In: Proceedings of the International Conference on Conceptual Modeling. Berlin: Springer, 2009.

LI, J.; ZHAO, K.; CHEN, Y. Multimodal deep learning for patent image and text analysis. IEEE Transactions on Knowledge and Data Engineering, v. 36, n. 4, p. 2234–2247, 2024.

MORAIS, Alaydes Mikaelle de; DIAS, Cleber Gustavo. Desenvolvimento de um índice de infração de patentes com apoio de inteligência artificial multimodal. Navus – Revista de Gestão e Tecnologia, v. 16, 2025. DOI: 10.22279/navus.v16.2133. Disponível em: https://doi.org/10.22279/navus.v16.2133. Acesso em: 23 out. 2025.

MORAIS, Edison Andrade Martins; AMBRÓSIO, Ana Paula L. Ontologias: conceitos, usos, tipos, metodologias, ferramentas e linguagens. Relatório Técnico INF_001/07. Instituto de Informática, Universidade Federal de Goiás, dez. 2007. Disponível em: https://ww2.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-07.pdf. Acesso em: 19 dez. 2025.

NAVEED, H. et al. A comprehensive overview of large language models. arXiv preprint arXiv:2307.06435, 2023. Disponível em: https://arxiv.org/abs/2307.06435. Acesso em: 1 abr. 2024.

OTTELO, Andrea; SMITH, John. Multimodal learning for document analysis: integrating text and image representations. Information Processing & Management, v. 57, n. 2, p. 102–118, 2020.

OLIVEIRA, H. C.; CARVALHO, C. L. Gestão e representação do conhecimento. Goiânia: Instituto de Informática: Universidade Federal de Goiás, 2008.

OPENAI. Contrastive Language-Image Pre-training (CLIP). Disponível em: <https://en.wikipedia.org/wiki/Contrastive_Language-Image_Pre-training>. Acesso em: 22 dez. 2025.

PIRES, Edilson Araújo; RIBEIRO, Nubia Moura; QUINTELLA, Cristina M.. Sistemas de Busca de Patentes: análise comparativa entre espacenet, patentscope, google patents, lens, derwent innovation index e orbit intelligence. Cadernos de Prospecção, [S.L.], v. 13, n. 1, p. 13, 27 mar. 2020. Universidade Federal da Bahia. http://dx.doi.org/10.9771/cp.v13i1.35147.

PUSTU-IREN, Kader; BRUNS, Gerrit; EWERTH, Ralph. A multimodal approach for semantic patent image retrieval. In: PatentSemTech, 15 jul. 2021, online. Hannover: TIB – Leibniz Information Centre for Science and Technology, 2021.

RADFORD, A. et al. Learning transferable visual models from natural language supervision. Proceedings of the 38th International Conference on Machine Learning, 2021.

REIMERS, N.; GUREVYCH, I. SentenceBERT: Sentence embeddings using Siamese BERTnetworks. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing, 2019.

SALTON, G.; BUCKLEY, C. Termweighting approaches in automatic text retrieval. Information Processing & Management, v. 24, n. 5, p. 513523, 1988.

SANTOS, André Moraes dos; QUONIAM, Luc; KNIESS, Claudia Terezinha; REYMOND, David. Ferramentas para extração e análise de informações em base de patentes: uma aplicação para o modelo de hélice quíntupla. In: SINGEP – SIMPÓSIO INTERNACIONAL DE GESTÃO DE PROJETOS, INOVAÇÃO E SUSTENTABILIDADE, 2., 2014, São Paulo. Anais [...]. São Paulo: SINGEP/S2IS, 2014.

SOMMERVILLE, I. Engenharia de software. Tradução de Kalinka Oliveira e Ivan Bosnic. 9. ed. São Paulo: Pearson Prentice Hall, 2011.

SHUKLA, Shreya; SHARMA, Nakul; GUPTA, Manish; MISHRA, Anand. PatentLMM: Large Multimodal Model for Generating Descriptions for Patent Figures. In: The Thirty-Ninth AAAI Conference on Artificial Intelligence (AAAI-25), 2025, [Anais...]. Palo Alto, CA: Association for the Advancement of Artificial Intelligence, 2025. Disponível em: https://ojs.aaai.org/index.php/AAAI/article/view/34257. Acesso 23 out. 2025.

VASCONCELOS LOBO, L.; SOUSA, J. P. Uso da inteligência artificial para a automação da análise de patentes. Revista Eletrônica Científica Inovação e Tecnologia, Curitiba, v. 16, n. 39, 2025. Disponível em: https://revistas.utfpr.edu.br/recit/article/view/19171. Acesso em: 23 out. 2025.

VOLPE, Michele Cristine Soares Campos. Direito autoral e aprendizagem de IA generativa: análise comparada Brasil e Estados Unidos no uso de obras protegidas para treinamento de IA. Revista DCS, v. 22, n. 84, 2025. DOI: https://doi.org/10.54899/dcs.v22i84.3880. Disponível em: https://ojs.revistadcs.com/index.php/revista/article/view/3880. Acesso em: 11 dez. 2025.

XU, L.; WANG, H.; ZHANG, Q. Visual features in patent similarity detection using convolutional neural networks. Expert Systems with Applications, v. 221, p. 119726, 2023.

WANG, H. et al. Pre-trained language models and their applications. Engineering, v. 25, p. 51-65, 2023.

WIPO. Patent information and documentation handbook. Geneva: World Intellectual Property Organization, 2023.

WHITTEMORE, R.; KNAFL, K. The integrative review: updated methodology. Journal of Advanced Nursing, v. 52, n. 5, p. 546-53, 2005.

YAGER, K. G. Domain-specific chatbots for science using embeddings. Digital Discovery, v. 2, p. 1850-1861, 2023.

ZHANG, T.; LIU, F.; GUO, W. Patent image understanding via deep learning. Information Processing & Management, v. 59, n. 3, p. 102925, 2022

ANÁLISE DE DOCUMENTOS DE PATENTES UTILIZANDO UM SISTEMA MULTIMODAL: PROPOSTA DE INTEGRAÇÃO DA ANÁLISE DE IMAGEM (IMAGÉTICO) E DE REDAÇÃO (SEMÂNTICO) DOS DADOS PATENTÁRIOS

Autores

DOI:

Palavras-chave:

Resumo

Downloads

Referências

Downloads

Publicado

Edição

Seção

Licença

Como Citar

Enviar Submissão

MDPI - Metrics

Google Citations

Metrics - OpenAlex

Metrics

Mídias Sociais

Idioma

Palavras-chave

Informações