Modelo promete eficácia maior do que robôs equipados com IA atuais, que aprendem a partir de tentativa e erro
Os robôs incorporados com IA atualmente se baseiam no aprendizado por tentativa e erro. Apesar desse método funcionar, o processo de aprendizagem completo é demorado e, ainda, há situações em que o erro é inadmissível ou arriscado.
Engenheiros da Universidade Northwestern, nos Estados Unidos, criaram um novo modelo de IA que utiliza um método diferente: os robôs aprendem por aleatoriedade. Na prática, isso se revelou mais eficaz e, em diversas ocasiões, as máquinas acertaram uma tarefa na primeira tentativa.
O modelo foi batizado de Aprendizado por Reforço de Difusão Máxima (MaxDiff RL). O diferencial dele é incentivar os robôs a explorar os ambientes de forma aleatória e aprender a partir de diferentes experiencias
Novo modelo de IA para robôs
O modelo foi batizado de Aprendizado por Reforço de Difusão Máxima (MaxDiff RL). O diferencial dele é incentivar os robôs a explorar os ambientes de forma aleatória e aprender a partir de diferentes experiências.
A aleatoriedade não é por acaso. Segundo o TechXplore, essa característica permite que os robôs coletem dados com mais rapidez e qualidade, melhorando sua própria aprendizagem e desempenho. Quando testados, eles superaram outros robôs com IA tradicionais.
Isso porque a IA tradicional aprende a partir de grandes conjuntos de dados e, na prática, usa a tentativa e erro até atingir o resultado ideal. Segundo os pesquisadores, a técnica funciona bem para chatbots, por exemplo, mas não para robôs com um corpo material. Nesse caso, as máquinas coletam dados por conta própria, mas ainda tem que lidar com as falhas e suas consequências físicas, alongando o processo de aprendizagem.