Reconhecimento de Dígitos de Medidores de Energia por meio da Voz no Contexto de um Aplicativo de Autoleitura / Digit Recognition of Energy Meters through Voice in the Context of an Authentication Application

Paulo Renato Conceição Mendes, Carlos Vinicios Martins Rocha, Anderson Matheus Passos Paiva, José Eduardo de Souza Oliveira, Italo Francyles Santos da Silva, Anselmo Cardoso de Paiva, Simara Vieira da Rocha, Aristófanes Correa Silva, Eliana Márcia G. Monteiro, Italo Fernandes S. da Silva Italo Fernandes S. da Silva, Márcia Izabel A. da Silva, Jose Messias dos Santos

Resumo


A Agência Nacional de Energia Elétrica (ANEEL) destaca que perdas não-técnicas estão relacionadas a entraves no processo de leitura de consumo. Para a redução dessas falhas, uma alternativa factível e de menor custo seria a leitura realizada pelo próprio consumidor, denominada de autoleitura.  Este processo leva em consideração o uso de plataformas digitais, através das quais o consumidor registraria e enviaria as informações de consumo.  Uma etapa importante desse processo é o reconhecimento automático de dígitos de medidores por meio da voz.  Este trabalho, portanto, propõe um método para a realização dessa tarefa, que utiliza processamento de áudio e inteligência computacional. Para a extração de características de áudio, utiliza-se Mel-frequency Cepstral Coefficients (MFCC) e MelSpectrogram de forma combinada. O método apresenta Recall de 94,74%; Precision de 94,91%; F1 score de 94,72% e 0,9419 de índice Kappa utilizando-se o classificador Support Vector Machine (SVM).


Palavras-chave


Consumo de Energia, Autoleitura, Reconhecimento, Processamento de Áudio, Aprendizado de Máquina, MFCC, MelSpectrogram, SVM

Texto completo:

PDF

Referências


Abusaria, A.A.M., Gunawan, T.S., Khalifa, O.O., and Abushariah, M.A.M. (2010). English digits speech re- cognition system based on hidden markov models. In International Conference on Computer and Communication Engineering (ICCCE’10), 1–5. doi:10.1109/ ICCCE.2010.5556819.

ANEEL (2019). Energia no brasil e no mundo. URL http://www2.aneel.gov.br/arquivos/pdf/atlas_ par1_cap2.pdf.

Cortes, C. and Vapnik, V. (1995). Support-vector

networks. Machine learning, 20(3), 273–297.

da Silveira, F.M., Schueler, C.F., and Cataldo, E. (2017). Utilização da técnica mfcc em conjunto com os parâmetros extraídos do sinal glotal para melhorar o desempenho de um sistema de verificação de locutor.

Davis, S. and Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(4), 357–366. doi:10.1109/TASSP.1980.1163420.

de Andrade Bresolin, A., Neto, A.D.D., and Alsina, P.J. (2008). Digit recognition using wavelet and svm in brazilian portuguese. In 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, 1545–1548. doi:10.1109/ICASSP.2008.4517917.

dos Santos, S.e.A.A. (2000). Reduced sets of subword units for continuous speech recognition of portuguese. Electronics Letters, 36(6), 586–588. doi:10.1049/el:20000446.

Kennedy, J. and Eberhart, R.C. (1997). A discrete binary version of the particle swarm algorithm. In 1997 IEEE International Conference on Systems, Man, and Cybernetics. Computational Cybernetics and Simulation, volume 5, 4104–4108 vol.5. doi:10.1109/ICSMC.1997.

Landis, J.R. and Koch, G.G. (1977). The measurement of observer agreement for categorical data. biometrics, 159–174.

Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duches- nay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825–2830.

Pessoa, M.C.P. et al. (2018). Remoção de ruídos aditivos e segmentação de palavras-chave em áudios.

Quintanilha, D.B.P., Costa, R.W.S., Diniz, J.O.B., de Almeida, J.D.S., Braz, G., Silva, A.C., de Paiva, A.C., Monteiro, E.M., Froz, B.R., Pinheiro, L.P.A., and Melho,

W. (2017). Automatic consumption reading on electromechanical meters using hog and svm. In 7th Latin American Conference on Networked and Electronic Media (LACNEM 2017), 57–61. doi:10.1049/ic.2017.0036.

S. Stevens, S., Volkmann, J., and B. Newman, E. (1937). A scale for the measurement of the psychological magnitude pitch. Journal of the Acoustical Society of America, 8, 185–190. doi:10.1121/1.1915893.

Schramm, M., Freitas, L., Zanuz, A., and Barone, D. (2006). Spoltech brazilian portuguese version 1.0 idc2006s16. Philadelphia: Linguistic Data Consortium. Silva, D.F., de Souza, V.M.A., Batista, G.E.A.P.A., and Giusti, R. (2012). Spoken digit recognition in portuguese using line spectral frequencies. In J. Pav´on, N.D. Duque- Méndez, and R. Fuentes-Fernández (eds.), Advances in Artificial Intelligence – IBERAMIA 2012, 241–250.

Springer Berlin Heidelberg, Berlin, Heidelberg. Tabarabaee, V., Azimisadjadi, B., Zahirazami, S.B., and

Lucas, C. (1994). Isolated word recognition using a hybrid neural network. In Proceedings of ICASSP ’94. IEEE International Conference on Acoustics, Speech and Signal Processing, volume ii, II/649–II/652 vol.2. doi:10.1109/ICASSP.1994.389572.

Vidinich, R. and Nery, G. (2009). Pesquisa e desenvolvimento contra o furto de energia. Revista Pesquisa e Desenvolvimento da ANEEL–P&D, 15.

Vieira, S.M., Mendonça, L.F., Farinha, G.J., and Sousa,

J.M. (2013). Modified binary pso for feature selection using svm applied to mortality prediction of septic patients. Applied Soft Computing, 13(8), 3494–3504.

Zhang, Y., Yang, S., Su, X., Shi, E., and Zhang, H. (2016). Automatic reading of domestic electric meter: an intelligent device based on image processing and zigbee/ethernet communication. Journal of Real-Time Image Processing, 12(1), 133–143




DOI: https://doi.org/10.34115/basrv4n3-098

Apontamentos

  • Não há apontamentos.