ANÁLISIS DE DOCUMENTOS DE PATENTES UTILIZANDO UN SISTEMA MULTIMODAL: PROPUESTA DE INTEGRACIÓN DEL ANÁLISIS DE IMÁGENES (VISUAL) Y DE REDACCIÓN (SEMÁNTICO) DE LOS DATOS DE PATE
DOI:
https://doi.org/10.66104/34ctx292Palabras clave:
Análisis multimodal; Patentes; Embeddings textuales y visuales; Similitud de documentos; Recuperación de información.Resumen
Este artículo presenta una propuesta de prototipo para el análisis de similitud multimodal de patentes, integrando información textual y visual con el objetivo de mejorar las capacidades de búsqueda y fomentar el análisis de anterioridad. La metodología emplea TF-IDF para la generación de embeddings textuales y un enfoque simplificado para embeddings visuales, basado en el redimensionamiento, la conversión a escala de grises y el aplanamiento de las imágenes. La implementación se realizó en un entorno Python, con ingestión directa de datos a partir de enlaces de patentes provenientes de Google Patents, permitiendo la ejecución automatizada de los procesos de extracción y análisis. Los embeddings generados se combinan mediante una función de puntuación multimodal ponderada, lo que permite identificar patentes similares. Además, se construye un grafo de conocimiento básico en memoria con el fin de representar las relaciones entre los documentos analizados. Los resultados demuestran la viabilidad y los beneficios de integrar múltiples modalidades de datos, ofreciendo un sistema inicial para mejorar la recuperación de patentes. Aunque se basa en técnicas simplificadas, este trabajo establece bases sólidas para futuras investigaciones, incluyendo la adopción de modelos de embeddings más avanzados, soluciones escalables de búsqueda vectorial y el uso de bases de datos persistentes para grafos de conocimiento.
Descargas
Referencias
AGUIAR, Isabela; CAMPOS DOS SANTOS, José L.; ALBUQUERQUE, Andréa C. F. Análise de similaridade semântica de patentes utilizando processamento de linguagem natural e busca híbrida. Edição especial: Propriedade Intelectual, Inovação e a Nova Economia Digital – Contributos da VII Semana Acadêmica da Propriedade Intelectual, v. 2, n. 4, 2025.
ANJOS, Alfredo Cesar dos. Uma arquitetura para sistemas de localização de especialistas baseada em modelo de linguagem de grande escala. 2025. Trabalho acadêmico (Pós-Graduação em Engenharia e Gestão do Conhecimento) – Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2025.
ASSOCIAÇÃO BRASILEIRA DOS AGENTES DA PROPRIEDADE INDUSTRIAL (ABAPI).
USPTO lança programa de IA de patente.
Disponível em: https://abapi.org.br/uspto-lanca-programa-de-ia-de-patente/.
Acesso em: 23 dez. 2025.
AWALE, Sushil; MÜLLER-BUDACK, Eric; DELAVIZ, Rahim; EWERTH, Ralph. Exploring patents visually: an interactive search system for multimodal patent image search and interpretation. In: 6th Workshop on Patent Text Mining and Semantic Technologies (PatentSemTech), 2025. Hannover: CEUR Workshop Proceedings, 2025. Disponível em: https://service.tib.eu/ipatent. Acesso em: 01 nov. 2025.
BARTHES, Roland. A retórica da imagem. O óbvio e o obtuso. Rio de Janeiro: Nova Fronteira, 1990.
BOTELHO, L. L. R.; CUNHA, C. C. A.; MACEDO, M. O método da revisão integrativa nos estudos organizacionais. Gestão e Sociedade, Belo Horizonte, v. 5, n. 11, p. 121-136, 2011.
BRAZ, Bruna Oliveira; CRISTOVÃO, Vera Lúcia Lopes. Análise de produções textuais multimodais de divulgação científica das ciências da linguagem. Entrepalavras, Fortaleza, v. 13, n. 2, p. 111–129, maio/ago. 2023. Disponível em: http://www.entrepalavras.ufc.br/revista/index.php/Revista/article/view/2664/1031. Acesso em: 4 nov. 2025.
CONSOLONI, Marco; GIORDANO, Vito; FANTONI, Gualtiero. Assessing text-image patent datasets with text-based metrics for engineering design applications. In: INTERNATIONAL DESIGN CONFERENCE – DESIGN 2024. Dubrovnik, Croácia: Cambridge University Press, 2024. p. 1969–1978. DOI: https://doi.org/10.1017/pds.2024.199.
DEEP LEARNING BOOK. Capítulo 84 – CLIP (Contrastive Language Image Pre-training): Conectando Texto e Imagens. Disponível em: <https://www.deeplearningbook.com.br/clip-contrastive-language-image-pre-training-conectando-texto-e-imagens/>. Acesso em: 22 dez. 2025.
FARHAT, Theodoro Casalotti; GONÇALVES-SEGUNDO, Paulo Roberto. ANÁLISE MULTIMODAL: noções e procedimentos fundamentais. Trabalhos em Linguística Aplicada, [S.L.], v. 61, n. 2, p. 435-454, ago. 2022. FapUNIFESP (SciELO). http://dx.doi.org/10.1590/010318138666675v61n22022.
HALEEM, A.; JAVAID, M.; SINGH, R. P. Understanding patent analysis through artificial intelligence. Journal of Intellectual Property Rights, v. 24, n. 2, p. 99–108, 2019.
HESSEL, Ana Maria Di Grado; LEMES, David de Oliveira. Criatividade da Inteligência Artificial Generativa. TECCOGS – Revista Digital de Tecnologias Cognitivas, São Paulo, n. 28, p. 119-130, 2023. https://doi.org/10.23925/1984-3585.2023i28p119-130
HIGUCHI, Kotaro; YANAI, Keiji. Patent image retrieval using transformer-based deep metric learning. World Patent Information, v. 74, p. 102217, set. 2023. DOI: https://doi.org/10.1016/j.wpi.2023.102217.
JI, Yong. Intelligent Patent Text Summarization Analysis Method. In: INTERNATIONAL CONFERENCE ON SYSTEMS AND INFORMATICS (ICSAI), 7., 2021. [S.l.]: IEEE, 2021. DOI: 10.1109/ICSAI53574.2021.9664064. Disponível em: https://ieeexplore.ieee.org/. Acesso em: 30 abr. 2023.
JOHNSON, J.; DOUZE, M.; JÉGOU, H. Billionscale similarity search with GPUs. IEEE Transactions on Big Data, v. 7, n. 3, p. 535547, 2019.
JURANEK, Steffen; OTNEIM, Håkon. Predicting patent lawsuits with machine learning. International Review of Law & Economics, v. 80, 106228, 2024. DOI: 10.1016/j.irle.2024.106228.
KRESTEL, R.; DERBOVEN, S.; MÜLLER, H. Machine learning in patent text analysis: A review. World Patent Information, v. 65, p. 102030, 2021.
KRESS, Gunther; VAN LEEUWEN, Theo. Reading images: the grammar of visual design. 2. ed. London: Routledge, 2006.
LEITE, Leonardo Silva; SILVA, Cícera Henrique da. Otimização de expressão para busca de patentes: estudo de caso sobre diagnóstico de malária. RECIIS – Revista Eletrônica de Comunicação, Informação e Inovação em Saúde, Rio de Janeiro, v. 7, n. 3, set. 2013. DOI: 10.3395/reciis.v7i3.599pt.
LI, X.; PARSONS, J. Ontological semantics for the use of UML in conceptual modeling. In: Proceedings of the International Conference on Conceptual Modeling. Berlin: Springer, 2009.
LI, J.; ZHAO, K.; CHEN, Y. Multimodal deep learning for patent image and text analysis. IEEE Transactions on Knowledge and Data Engineering, v. 36, n. 4, p. 2234–2247, 2024.
MORAIS, Alaydes Mikaelle de; DIAS, Cleber Gustavo. Desenvolvimento de um índice de infração de patentes com apoio de inteligência artificial multimodal. Navus – Revista de Gestão e Tecnologia, v. 16, 2025. DOI: 10.22279/navus.v16.2133. Disponível em: https://doi.org/10.22279/navus.v16.2133. Acesso em: 23 out. 2025.
MORAIS, Edison Andrade Martins; AMBRÓSIO, Ana Paula L. Ontologias: conceitos, usos, tipos, metodologias, ferramentas e linguagens. Relatório Técnico INF_001/07. Instituto de Informática, Universidade Federal de Goiás, dez. 2007. Disponível em: https://ww2.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-07.pdf. Acesso em: 19 dez. 2025.
NAVEED, H. et al. A comprehensive overview of large language models. arXiv preprint arXiv:2307.06435, 2023. Disponível em: https://arxiv.org/abs/2307.06435. Acesso em: 1 abr. 2024.
OTTELO, Andrea; SMITH, John. Multimodal learning for document analysis: integrating text and image representations. Information Processing & Management, v. 57, n. 2, p. 102–118, 2020.
OLIVEIRA, H. C.; CARVALHO, C. L. Gestão e representação do conhecimento. Goiânia: Instituto de Informática: Universidade Federal de Goiás, 2008.
OPENAI. Contrastive Language-Image Pre-training (CLIP). Disponível em: <https://en.wikipedia.org/wiki/Contrastive_Language-Image_Pre-training>. Acesso em: 22 dez. 2025.
PIRES, Edilson Araújo; RIBEIRO, Nubia Moura; QUINTELLA, Cristina M.. Sistemas de Busca de Patentes: análise comparativa entre espacenet, patentscope, google patents, lens, derwent innovation index e orbit intelligence. Cadernos de Prospecção, [S.L.], v. 13, n. 1, p. 13, 27 mar. 2020. Universidade Federal da Bahia. http://dx.doi.org/10.9771/cp.v13i1.35147.
PUSTU-IREN, Kader; BRUNS, Gerrit; EWERTH, Ralph. A multimodal approach for semantic patent image retrieval. In: PatentSemTech, 15 jul. 2021, online. Hannover: TIB – Leibniz Information Centre for Science and Technology, 2021.
RADFORD, A. et al. Learning transferable visual models from natural language supervision. Proceedings of the 38th International Conference on Machine Learning, 2021.
REIMERS, N.; GUREVYCH, I. SentenceBERT: Sentence embeddings using Siamese BERTnetworks. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing, 2019.
SALTON, G.; BUCKLEY, C. Termweighting approaches in automatic text retrieval. Information Processing & Management, v. 24, n. 5, p. 513523, 1988.
SANTOS, André Moraes dos; QUONIAM, Luc; KNIESS, Claudia Terezinha; REYMOND, David. Ferramentas para extração e análise de informações em base de patentes: uma aplicação para o modelo de hélice quíntupla. In: SINGEP – SIMPÓSIO INTERNACIONAL DE GESTÃO DE PROJETOS, INOVAÇÃO E SUSTENTABILIDADE, 2., 2014, São Paulo. Anais [...]. São Paulo: SINGEP/S2IS, 2014.
SOMMERVILLE, I. Engenharia de software. Tradução de Kalinka Oliveira e Ivan Bosnic. 9. ed. São Paulo: Pearson Prentice Hall, 2011.
SHUKLA, Shreya; SHARMA, Nakul; GUPTA, Manish; MISHRA, Anand. PatentLMM: Large Multimodal Model for Generating Descriptions for Patent Figures. In: The Thirty-Ninth AAAI Conference on Artificial Intelligence (AAAI-25), 2025, [Anais...]. Palo Alto, CA: Association for the Advancement of Artificial Intelligence, 2025. Disponível em: https://ojs.aaai.org/index.php/AAAI/article/view/34257. Acesso 23 out. 2025.
VASCONCELOS LOBO, L.; SOUSA, J. P. Uso da inteligência artificial para a automação da análise de patentes. Revista Eletrônica Científica Inovação e Tecnologia, Curitiba, v. 16, n. 39, 2025. Disponível em: https://revistas.utfpr.edu.br/recit/article/view/19171. Acesso em: 23 out. 2025.
VOLPE, Michele Cristine Soares Campos. Direito autoral e aprendizagem de IA generativa: análise comparada Brasil e Estados Unidos no uso de obras protegidas para treinamento de IA. Revista DCS, v. 22, n. 84, 2025. DOI: https://doi.org/10.54899/dcs.v22i84.3880. Disponível em: https://ojs.revistadcs.com/index.php/revista/article/view/3880. Acesso em: 11 dez. 2025.
XU, L.; WANG, H.; ZHANG, Q. Visual features in patent similarity detection using convolutional neural networks. Expert Systems with Applications, v. 221, p. 119726, 2023.
WANG, H. et al. Pre-trained language models and their applications. Engineering, v. 25, p. 51-65, 2023.
WIPO. Patent information and documentation handbook. Geneva: World Intellectual Property Organization, 2023.
WHITTEMORE, R.; KNAFL, K. The integrative review: updated methodology. Journal of Advanced Nursing, v. 52, n. 5, p. 546-53, 2005.
YAGER, K. G. Domain-specific chatbots for science using embeddings. Digital Discovery, v. 2, p. 1850-1861, 2023.
ZHANG, T.; LIU, F.; GUO, W. Patent image understanding via deep learning. Information Processing & Management, v. 59, n. 3, p. 102925, 2022
Descargas
Publicado
Número
Sección
Licencia
Derechos de autor 2026 Thiago Domingos Marques , Alexandre Leopoldo Gonçalves

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Authors who publish in this journal agree to the following terms:
Authors retain copyright and grant the journal the right of first publication, with the work simultaneously licensed under the Creative Commons Attribution License, which permits the sharing of the work with proper acknowledgment of authorship and initial publication in this journal;
Authors are authorized to enter into separate, additional agreements for the non-exclusive distribution of the version of the work published in this journal (e.g., posting in an institutional repository or publishing it as a book chapter), provided that authorship and initial publication in this journal are properly acknowledged, and that the work is adapted to the template of the respective repository;
Authors are permitted and encouraged to post and distribute their work online (e.g., in institutional repositories or on their personal websites) at any point before or during the editorial process, as this may lead to productive exchanges and increase the impact and citation of the published work (see The Effect of Open Access);
Authors are responsible for correctly providing their personal information, including name, keywords, abstracts, and other relevant data, thereby defining how they wish to be cited. The journal’s editorial board is not responsible for any errors or inconsistencies in these records.
PRIVACY POLICY
The names and email addresses provided to this journal will be used exclusively for the purposes of this publication and will not be made available for any other purpose or to third parties.
Note: All content of the work is the sole responsibility of the author and the advisor.
