Linearização por realimentação e aprendizagem por reforço para o controle do sistema de posicionamento do ROV / Feedback linearization and reinforcement learning for controlling the positioning system of a ROV

Lucas Solano Cadengue, Samuel Amico Fidelis, Gabriel da Silva Lima, Wallace Moreira Bessa

Resumo


Um sistema ROV (Remotely Operated underwater Vehicle) precisa de uma estimação precisa da sua posição para evitar danos e movimentos imprecisos para certas tarefas. Neste artigo, um controlador inteligente foi proposto para o rastreamento da trajetória de um ROV suscetível a forças externas (dinâmica da água, correntes, animais e etc.), este controlador foi baseado no método de linearização por realimentação com uma função adaptativa otimizada utilizando uma estratégia de aprendizagem de máquina. Este trabalho propõe o emprego de um algoritmo de aprendizagem por reforço, o Ɛ-greedy, para o deixar descobrir por si só uma taxa de aprendizagem ótima para o compensador. Resultados numéricos confirmam uma forte melhora na performance do controlador quando o compensador proposto e a estratégia de aprendizagem é inserida.


Palavras-chave


ROV, controle inteligente, linearização por realimentação, Ɛ-greedy; aprendizagem de máquina.

Texto completo:

PDF

Referências


Bejar, E. and Moran, A. (2019). Control of a two-dimensional magnetic positioning system with deep reinforcement learning and feedback linearization. Midwest Symposium on Circuits and Systems, (1), 909–912. doi:10.1109/MWSCAS.2018.8623948.

Bessa, W. M., Dutra, M. S., and Kreuzer E. (2008). Depth control of remotely operated underwater vehicles using na adaptive fuzzy sliding mode controller. Robotics and Autonomous Systems, 56(8), 670 677. doi: 10.1016/j.robot.2007.11.004.

Bessa, W.M., Dutra, M.S., and Kreuzer, E. (2010). An adaptive fuzzy sliding mode controller for remotely operated underwater vehicles. Robotics and Autonomous Systems, 58, 16–26.

Bessa, W.M., Kreuzer, E., Lange, J., Pick, M.A., and Solowjow, E. (2017). Design and adaptive depth control of a micro diving agent. IEEE Robotics and Automation Letters, 2(4), 1871–1877.

Brinkmann, G., Bessa, W.M., Duecker, D.A., Kreuzer, E., and Solowjow, E. (2018). Reinforcement learning of depth stabilization with a micro diving agent. Proceedings - IEEE International Conference on Robotics and Automation, V, 6197–6203.doi:10.1109/ICRA.2018.8461137.

Goheen, K.R. and Jeffreys, E.R. (1990). Multivariable self-tuning autopilots for autonomous and remotely operated underwater vehicles. IEEE Journal of Oceanic Engineering, 15(3), 144–151.

Haykin, S. (2007). Redes neurais: princípios e prática. Bookman Editora.

Jardine, P.T., Kogan, M., Givigi, S.N., and Yousefi, S. (2019). Adaptive predictive control of a differential driverobot tuned with reinforcement learning. International Journal of Adaptive Control and Signal Processing, 33(2), 410–423. doi:10.1002/acs.2882.

Kim, J.B., Kwon, D.H., Hong, Y.G., Lim, H.K., Kim,M.S. , and Han, Y.H. (2019). Deep Q-Network Based Rotary Inverted Pendulum System and Its Monitoring on the EdgeX Platform. 1st International Conference on Artificial Intelligence in Information and Communication, ICAIIC 2019, 34–39. doi:10.1109/ICAIIC.2019.8668979.

Ludvigsen, M. and Sφrensen, A.J. (2016). Towards integrated autonomous underwater operations for ocean mapping and monitoring. Annu. Rev. Control, 42, 145–157.

Mindell, D.A. (2015). Ourselves: Robotics and the Myths of Autonomy. Viking.

Pradeep, D.J., Noel, M.M., and Arun, N. (2016). Nonlinear control of a boost converter using a robust regression based reinforcement learning algorithm. Engineering Applications of Artificial Intelligence, 52, 1–9. doi:10.1016/j.engappai.2016.02.007.

Robbins, H. (1952). Some aspects of the sequential design of experiments. Bulletin of the American Mathematical Society, 58(5), 527–535.

Teague, J., Allen, M.J., and Scott, T.S. (2018). The potential of low-cost ROV for use in deep-sea mineral, ore prospecting and monitoring. Ocean. Eng., 147, 333–339.

Yang, X., He, H., Wei, Q., and Luo, B. (2018). Reinforcement learning for robust adaptive control of partially unknown nonlinear systems subject to unmatched uncertainties. Information Sciences, 463-464, 307–322. doi:10.1016/j.ins.2018.06.022.

Yuh, J. (1994). Learning control for underwater roboticvehicles. IEEE Control Systems Magazine, 14(2), 39–46.

Zhu, L.M., Modares, H., Peen, G.O., Lewis, F.L., and Yue, B. (2015). Adaptive suboptimal output-feedback control for linear systems using integral reinforcement learning. IEEE Transactions on Control Systems Technology, 23(1), 264–273. doi:10.1109/TCST.2014.2322778.




DOI: https://doi.org/10.34115/basrv4n3-062

Apontamentos

  • Não há apontamentos.