ANÁLISIS DE DOCUMENTOS DE PATENTES UTILIZANDO UN SISTEMA MULTIMODAL: PROPUESTA DE INTEGRACIÓN DEL ANÁLISIS DE IMÁGENES (VISUAL) Y DE REDACCIÓN (SEMÁNTICO) DE LOS DATOS DE PATE

Autores/as

  • Thiago Domingos Marques Universidade Federal de Santa Catarina
  • Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina

DOI:

https://doi.org/10.66104/34ctx292

Palabras clave:

Análisis multimodal; Patentes; Embeddings textuales y visuales; Similitud de documentos; Recuperación de información.

Resumen

Este artículo presenta una propuesta de prototipo para el análisis de similitud multimodal de patentes, integrando información textual y visual con el objetivo de mejorar las capacidades de búsqueda y fomentar el análisis de anterioridad. La metodología emplea TF-IDF para la generación de embeddings textuales y un enfoque simplificado para embeddings visuales, basado en el redimensionamiento, la conversión a escala de grises y el aplanamiento de las imágenes. La implementación se realizó en un entorno Python, con ingestión directa de datos a partir de enlaces de patentes provenientes de Google Patents, permitiendo la ejecución automatizada de los procesos de extracción y análisis. Los embeddings generados se combinan mediante una función de puntuación multimodal ponderada, lo que permite identificar patentes similares. Además, se construye un grafo de conocimiento básico en memoria con el fin de representar las relaciones entre los documentos analizados. Los resultados demuestran la viabilidad y los beneficios de integrar múltiples modalidades de datos, ofreciendo un sistema inicial para mejorar la recuperación de patentes. Aunque se basa en técnicas simplificadas, este trabajo establece bases sólidas para futuras investigaciones, incluyendo la adopción de modelos de embeddings más avanzados, soluciones escalables de búsqueda vectorial y el uso de bases de datos persistentes para grafos de conocimiento.

Descargas

Los datos de descarga aún no están disponibles.

Referencias

AGUIAR, Isabela; CAMPOS DOS SANTOS, José L.; ALBUQUERQUE, Andréa C. F. Análise de similaridade semântica de patentes utilizando processamento de linguagem natural e busca híbrida. Edição especial: Propriedade Intelectual, Inovação e a Nova Economia Digital – Contributos da VII Semana Acadêmica da Propriedade Intelectual, v. 2, n. 4, 2025.

ANJOS, Alfredo Cesar dos. Uma arquitetura para sistemas de localização de especialistas baseada em modelo de linguagem de grande escala. 2025. Trabalho acadêmico (Pós-Graduação em Engenharia e Gestão do Conhecimento) – Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2025.

ASSOCIAÇÃO BRASILEIRA DOS AGENTES DA PROPRIEDADE INDUSTRIAL (ABAPI).

USPTO lança programa de IA de patente.

Disponível em: https://abapi.org.br/uspto-lanca-programa-de-ia-de-patente/.

Acesso em: 23 dez. 2025.

AWALE, Sushil; MÜLLER-BUDACK, Eric; DELAVIZ, Rahim; EWERTH, Ralph. Exploring patents visually: an interactive search system for multimodal patent image search and interpretation. In: 6th Workshop on Patent Text Mining and Semantic Technologies (PatentSemTech), 2025. Hannover: CEUR Workshop Proceedings, 2025. Disponível em: https://service.tib.eu/ipatent. Acesso em: 01 nov. 2025.

BARTHES, Roland. A retórica da imagem. O óbvio e o obtuso. Rio de Janeiro: Nova Fronteira, 1990.

BOTELHO, L. L. R.; CUNHA, C. C. A.; MACEDO, M. O método da revisão integrativa nos estudos organizacionais. Gestão e Sociedade, Belo Horizonte, v. 5, n. 11, p. 121-136, 2011.

BRAZ, Bruna Oliveira; CRISTOVÃO, Vera Lúcia Lopes. Análise de produções textuais multimodais de divulgação científica das ciências da linguagem. Entrepalavras, Fortaleza, v. 13, n. 2, p. 111–129, maio/ago. 2023. Disponível em: http://www.entrepalavras.ufc.br/revista/index.php/Revista/article/view/2664/1031. Acesso em: 4 nov. 2025.

CONSOLONI, Marco; GIORDANO, Vito; FANTONI, Gualtiero. Assessing text-image patent datasets with text-based metrics for engineering design applications. In: INTERNATIONAL DESIGN CONFERENCE – DESIGN 2024. Dubrovnik, Croácia: Cambridge University Press, 2024. p. 1969–1978. DOI: https://doi.org/10.1017/pds.2024.199.

DEEP LEARNING BOOK. Capítulo 84 – CLIP (Contrastive Language Image Pre-training): Conectando Texto e Imagens. Disponível em: <https://www.deeplearningbook.com.br/clip-contrastive-language-image-pre-training-conectando-texto-e-imagens/>. Acesso em: 22 dez. 2025.

FARHAT, Theodoro Casalotti; GONÇALVES-SEGUNDO, Paulo Roberto. ANÁLISE MULTIMODAL: noções e procedimentos fundamentais. Trabalhos em Linguística Aplicada, [S.L.], v. 61, n. 2, p. 435-454, ago. 2022. FapUNIFESP (SciELO). http://dx.doi.org/10.1590/010318138666675v61n22022.

HALEEM, A.; JAVAID, M.; SINGH, R. P. Understanding patent analysis through artificial intelligence. Journal of Intellectual Property Rights, v. 24, n. 2, p. 99–108, 2019.

HESSEL, Ana Maria Di Grado; LEMES, David de Oliveira. Criatividade da Inteligência Artificial Generativa. TECCOGS – Revista Digital de Tecnologias Cognitivas, São Paulo, n. 28, p. 119-130, 2023. https://doi.org/10.23925/1984-3585.2023i28p119-130

HIGUCHI, Kotaro; YANAI, Keiji. Patent image retrieval using transformer-based deep metric learning. World Patent Information, v. 74, p. 102217, set. 2023. DOI: https://doi.org/10.1016/j.wpi.2023.102217.

JI, Yong. Intelligent Patent Text Summarization Analysis Method. In: INTERNATIONAL CONFERENCE ON SYSTEMS AND INFORMATICS (ICSAI), 7., 2021. [S.l.]: IEEE, 2021. DOI: 10.1109/ICSAI53574.2021.9664064. Disponível em: https://ieeexplore.ieee.org/. Acesso em: 30 abr. 2023.

JOHNSON, J.; DOUZE, M.; JÉGOU, H. Billionscale similarity search with GPUs. IEEE Transactions on Big Data, v. 7, n. 3, p. 535547, 2019.

JURANEK, Steffen; OTNEIM, Håkon. Predicting patent lawsuits with machine learning. International Review of Law & Economics, v. 80, 106228, 2024. DOI: 10.1016/j.irle.2024.106228.

KRESTEL, R.; DERBOVEN, S.; MÜLLER, H. Machine learning in patent text analysis: A review. World Patent Information, v. 65, p. 102030, 2021.

KRESS, Gunther; VAN LEEUWEN, Theo. Reading images: the grammar of visual design. 2. ed. London: Routledge, 2006.

LEITE, Leonardo Silva; SILVA, Cícera Henrique da. Otimização de expressão para busca de patentes: estudo de caso sobre diagnóstico de malária. RECIIS – Revista Eletrônica de Comunicação, Informação e Inovação em Saúde, Rio de Janeiro, v. 7, n. 3, set. 2013. DOI: 10.3395/reciis.v7i3.599pt.

LI, X.; PARSONS, J. Ontological semantics for the use of UML in conceptual modeling. In: Proceedings of the International Conference on Conceptual Modeling. Berlin: Springer, 2009.

LI, J.; ZHAO, K.; CHEN, Y. Multimodal deep learning for patent image and text analysis. IEEE Transactions on Knowledge and Data Engineering, v. 36, n. 4, p. 2234–2247, 2024.

MORAIS, Alaydes Mikaelle de; DIAS, Cleber Gustavo. Desenvolvimento de um índice de infração de patentes com apoio de inteligência artificial multimodal. Navus – Revista de Gestão e Tecnologia, v. 16, 2025. DOI: 10.22279/navus.v16.2133. Disponível em: https://doi.org/10.22279/navus.v16.2133. Acesso em: 23 out. 2025.

MORAIS, Edison Andrade Martins; AMBRÓSIO, Ana Paula L. Ontologias: conceitos, usos, tipos, metodologias, ferramentas e linguagens. Relatório Técnico INF_001/07. Instituto de Informática, Universidade Federal de Goiás, dez. 2007. Disponível em: https://ww2.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-07.pdf. Acesso em: 19 dez. 2025.

NAVEED, H. et al. A comprehensive overview of large language models. arXiv preprint arXiv:2307.06435, 2023. Disponível em: https://arxiv.org/abs/2307.06435. Acesso em: 1 abr. 2024.

OTTELO, Andrea; SMITH, John. Multimodal learning for document analysis: integrating text and image representations. Information Processing & Management, v. 57, n. 2, p. 102–118, 2020.

OLIVEIRA, H. C.; CARVALHO, C. L. Gestão e representação do conhecimento. Goiânia: Instituto de Informática: Universidade Federal de Goiás, 2008.

OPENAI. Contrastive Language-Image Pre-training (CLIP). Disponível em: <https://en.wikipedia.org/wiki/Contrastive_Language-Image_Pre-training>. Acesso em: 22 dez. 2025.

PIRES, Edilson Araújo; RIBEIRO, Nubia Moura; QUINTELLA, Cristina M.. Sistemas de Busca de Patentes: análise comparativa entre espacenet, patentscope, google patents, lens, derwent innovation index e orbit intelligence. Cadernos de Prospecção, [S.L.], v. 13, n. 1, p. 13, 27 mar. 2020. Universidade Federal da Bahia. http://dx.doi.org/10.9771/cp.v13i1.35147.

PUSTU-IREN, Kader; BRUNS, Gerrit; EWERTH, Ralph. A multimodal approach for semantic patent image retrieval. In: PatentSemTech, 15 jul. 2021, online. Hannover: TIB – Leibniz Information Centre for Science and Technology, 2021.

RADFORD, A. et al. Learning transferable visual models from natural language supervision. Proceedings of the 38th International Conference on Machine Learning, 2021.

REIMERS, N.; GUREVYCH, I. SentenceBERT: Sentence embeddings using Siamese BERTnetworks. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing, 2019.

SALTON, G.; BUCKLEY, C. Termweighting approaches in automatic text retrieval. Information Processing & Management, v. 24, n. 5, p. 513523, 1988.

SANTOS, André Moraes dos; QUONIAM, Luc; KNIESS, Claudia Terezinha; REYMOND, David. Ferramentas para extração e análise de informações em base de patentes: uma aplicação para o modelo de hélice quíntupla. In: SINGEP – SIMPÓSIO INTERNACIONAL DE GESTÃO DE PROJETOS, INOVAÇÃO E SUSTENTABILIDADE, 2., 2014, São Paulo. Anais [...]. São Paulo: SINGEP/S2IS, 2014.

SOMMERVILLE, I. Engenharia de software. Tradução de Kalinka Oliveira e Ivan Bosnic. 9. ed. São Paulo: Pearson Prentice Hall, 2011.

SHUKLA, Shreya; SHARMA, Nakul; GUPTA, Manish; MISHRA, Anand. PatentLMM: Large Multimodal Model for Generating Descriptions for Patent Figures. In: The Thirty-Ninth AAAI Conference on Artificial Intelligence (AAAI-25), 2025, [Anais...]. Palo Alto, CA: Association for the Advancement of Artificial Intelligence, 2025. Disponível em: https://ojs.aaai.org/index.php/AAAI/article/view/34257. Acesso 23 out. 2025.

VASCONCELOS LOBO, L.; SOUSA, J. P. Uso da inteligência artificial para a automação da análise de patentes. Revista Eletrônica Científica Inovação e Tecnologia, Curitiba, v. 16, n. 39, 2025. Disponível em: https://revistas.utfpr.edu.br/recit/article/view/19171. Acesso em: 23 out. 2025.

VOLPE, Michele Cristine Soares Campos. Direito autoral e aprendizagem de IA generativa: análise comparada Brasil e Estados Unidos no uso de obras protegidas para treinamento de IA. Revista DCS, v. 22, n. 84, 2025. DOI: https://doi.org/10.54899/dcs.v22i84.3880. Disponível em: https://ojs.revistadcs.com/index.php/revista/article/view/3880. Acesso em: 11 dez. 2025.

XU, L.; WANG, H.; ZHANG, Q. Visual features in patent similarity detection using convolutional neural networks. Expert Systems with Applications, v. 221, p. 119726, 2023.

WANG, H. et al. Pre-trained language models and their applications. Engineering, v. 25, p. 51-65, 2023.

WIPO. Patent information and documentation handbook. Geneva: World Intellectual Property Organization, 2023.

WHITTEMORE, R.; KNAFL, K. The integrative review: updated methodology. Journal of Advanced Nursing, v. 52, n. 5, p. 546-53, 2005.

YAGER, K. G. Domain-specific chatbots for science using embeddings. Digital Discovery, v. 2, p. 1850-1861, 2023.

ZHANG, T.; LIU, F.; GUO, W. Patent image understanding via deep learning. Information Processing & Management, v. 59, n. 3, p. 102925, 2022

Publicado

2026-03-27

Cómo citar

ANÁLISIS DE DOCUMENTOS DE PATENTES UTILIZANDO UN SISTEMA MULTIMODAL: PROPUESTA DE INTEGRACIÓN DEL ANÁLISIS DE IMÁGENES (VISUAL) Y DE REDACCIÓN (SEMÁNTICO) DE LOS DATOS DE PATE. (2026). REMUNOM, 13(04), 1-61. https://doi.org/10.66104/34ctx292