MODELAGEM PARAMÉTRICA LPC E PRONY INTEGRADA AO FILTRO DE KALMAN PARA REDUÇÃO DE RUÍDO EM SINAIS DE FALA: ANÁLISE COMPARATIVA E AVALIAÇÃO ESTATÍSTICA
DOI:
https://doi.org/10.66104/hegxr115Palavras-chave:
Filtro de Kalman, Supressão de ruído, Enriquecimento de voz, PronyResumo
Este trabalho apresenta um estudo experimental comparativo entre duas estratégias de modelagem paramétrica incorporadas ao filtro de Kalman para redução de ruído em sinais de voz: modelos autorregressivos (LPC-AR) e modelos polo-zero estimados pelo método de Prony (ARMA). O protocolo experimental considerou controle da relação sinal-ruído segmentada de entrada (≈3 dB), múltiplas realizações estocásticas e dois cenários de ruído (branco e colorido AR(1)). O desempenho foi avaliado por meio de métricas complementares: relação sinal-ruído segmentada de saída (segSNR_out), divergência de Itakura–Saito (IS), intelligibilidade objetiva de curto prazo (STOI) e tempo de processamento. Os resultados, reportados como média ± desvio padrão e analisados por teste de Friedman com pós-hoc, indicam que a abordagem Kalman+LPC apresentou desempenho global superior e maior consistência estatística, especialmente sob ruído branco, com menor custo computacional. A formulação Kalman+Prony mostrou estabilidade numérica adequada, com polos majoritariamente dentro do círculo unitário, mas não apresentou ganho sistemático em relação ao modelo all-pole. A análise de Pareto evidenciou um compromisso entre distorção espectral e energia residual, sem vantagem clara do modelo ARMA nas condições avaliadas. Conclui-se que, para os cenários testados, o modelo LPC integrado ao filtro de Kalman constitui a alternativa mais robusta em termos de desempenho médio, estabilidade e eficiência computacional.
Downloads
Referências
BAI, Yuting et al. State of art on state estimation: Kalman filter driven by machine learning. Annual Reviews in Control, v. 56, p. 100909, 2023. Disponível em: https://researchr.org/publication/BaiYZSJ23. Acesso em: 21 fev. 2026.
BENDORY, Tamir; DE CASTRO, Yoann; ELDAR, Yonina C. On the accuracy of Prony’s method for recovery of sparse measures from noisy frequency samples. arXiv, 2024. Disponível em: https://arxiv.org/abs/2302.05883. Acesso em: 21 fev. 2026.
BROWN, Robert Grover; HWANG, Patrick Y. C. Introduction to random signals and applied Kalman filtering. New York: John Wiley & Sons, 1997.
DELLER, John R.; PROAKIS, John G.; HANSEN, John H. L. Discrete-time processing of speech signals. New Jersey: Prentice Hall, 1993.
DIONELIS, Nikolaos; BROOKES, Mike. Phase-Aware Single-Channel Speech Enhancement with Modulation-Domain Kalman Filtering. arXiv, 2017. Disponível em: https://arxiv.org/abs/1708.02171. Acesso em: 20 fev. 2026.
FÉVOTTE, Cédric; BERTIN, Nancy; DUFOUR, Jean-Louis. Nonnegative matrix factorization with the Itakura–Saito divergence: with application to music analysis. Neural Computation, 2009. Disponível em: https://perso.ens-lyon.fr/patrice.abry/ENSEIGNEMENTS/14M2SCExam/Bertin.pdf. Acesso em: 20 fev. 2026.
GABREA, Marcel. An adaptive Kalman filter for the enhancement of speech signals. In: INTERSPEECH 2004. p. 2709–2712. DOI: 10.21437/Interspeech.2004-719. Disponível em: https://www.isca-archive.org/interspeech_2004/gabrea04_interspeech.html. Acesso em: 20 fev. 2026.
GIRALDO, Juan et al. Evaluating Speech Enhancement Performance Across Demographics: Revisiting VoiceBank-DEMAND. In: INTERSPEECH 2025. Disponível em: https://www.isca-archive.org/interspeech_2025/giraldo25_interspeech.pdf. Acesso em: 20 fev. 2026.
KANTAMANENI, S. et al. Speech enhancement with noise estimation and filtration using Extended Kalman Filter approach. Theoretical Computer Science, 2023. (Discussão de EKF e sensibilidade do Kalman a modelagem/ruído). Disponível em: https://www.sciencedirect.com/science/article/abs/pii/S0304397522004935. Acesso em: 20 fev. 2026.
KIM, K. et al. Neural Network Regression for Sound Source Localization Using Classical Spectral Estimation Techniques (Yule–Walker, Prony, Steiglitz–McBride). Applied Sciences, v. 15, n. 17, 2025. Disponível em: https://www.mdpi.com/2076-3417/15/17/9272. Acesso em: 21 fev. 2026.
KUMARESAN, R.; TUFTS, D. W.; SCHARF, L. L. A Prony method for noisy data: Choosing the signal components and selecting the order in exponential signal models. Proceedings of the IEEE, 1984. Disponível em: https://www.researchgate.net/publication/2996886_A_Prony_method_for_noisy_data_Choosing_the_signal_components_and_selecting_the_order_in_exponential_signal_models. Acesso em: 20 fev. 2026.
O’SHAUGHNESSY, Douglas. Review of methods for coding of speech signals. EURASIP Journal on Audio, Speech, and Music Processing, 2023. DOI: 10.1186/s13636-023-00274-x. Disponível em: https://link.springer.com/article/10.1186/s13636-023-00274-x. Acesso em: 21 fev. 2026.
R.E. Kalman, “A new approach to linear filtering and prediction problems”, Basic Eng, Trans ASME, Series D, Vol 82, March 1960, pp 35–45.
ROY, Sujan Kumar; NICOLSON, Aaron; PALIWAL, Kuldip K. A Deep Learning-Based Kalman Filter for Speech Enhancement. In: INTERSPEECH 2020. p. 2692–2696. DOI: 10.21437/Interspeech.2020-1551. Disponível em: https://www.isca-archive.org/interspeech_2020/roy20_interspeech.html. Acesso em: 20 fev. 2026.
SELICATO, L. et al. Sparse hyperparametric Itakura–Saito nonnegative matrix factorization via bi-level optimization. arXiv, 2025. Disponível em: https://eprints.soton.ac.uk/499610/1/2502.17123v2.pdf. Acesso em: 21 fev. 2026.
TAKABATAKE, Tetsuya; YANO, Keisuke. Towards a robust frequency-domain analysis: Spectral Rényi divergence revisited. arXiv, 2023. Disponível em: https://arxiv.org/abs/2310.06902. Acesso em: 21 fev. 2026.
VASEGHI, Saeed V. Advanced digital signal processing and noise reduction. New York: John Wiley & Sons, 2000.
WANG, J. et al. Independent low-rank matrix analysis for determined blind source separation of audio and speech signals using Itakura–Saito divergence. arXiv, 2024. Disponível em: https://arxiv.org/pdf/2401.01762. Acesso em: 21 fev. 2026.
ZHENG, C. et al. Sixty Years of Frequency-Domain Monaural Speech Enhancement: From Traditional to Deep Learning Methods. IEEE/Journal survey (versão em PMC), 2023. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC10658184/. Acesso em: 20 fev. 2026.
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2026 Dr. Leandro Aureliano da Silva, Dr. Eduardo Silva Vasconcelos, Dr. Luiz Fernando Ribeiro de Paiva, Dr. Adriano Dawison de Lima, Me. Welington Mrad Joaquim, Dr. Edilberto Pereira Teixeira

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista;
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista, desde que adpatado ao template do repositório em questão;
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
- Os autores são responsáveis por inserir corretamente seus dados, incluindo nome, palavras-chave, resumos e demais informações, definindo assim a forma como desejam ser citados. Dessa forma, o corpo editorial da revista não se responsabiliza por eventuais erros ou inconsistências nesses registros.
POLÍTICA DE PRIVACIDADE
Os nomes e endereços informados nesta revista serão usados exclusivamente para os serviços prestados por esta publicação, não sendo disponibilizados para outras finalidades ou a terceiros.
Obs: todo o conteúdo do trabalho é de responsabilidade do autor e orientador.
