2020 — 2021

Construir un robot que aprende solo

De cero a una red neuronal DeepQ entrenada en simulación 3D propia.

En 2020 tenía una idea fija en la cabeza: construir un robot que aprendiera a moverse por sí solo. No comprar uno. Construirlo. Y enseñarle.

R0-BB1 nació en mi escritorio. Servos baratos, un microcontrolador, mucho cinta. Pero la parte interesante no estaba ahí afuera, sino adentro: la red neuronal DeepQ que iba a controlarlo.

La simulación primero

Entrenar un agente de refuerzo en el mundo físico es cruel. Cada error es plástico roto. Así que lo primero fue armar una simulación 3D propia donde el robot podía caerse mil veces sin consecuencias.

El loop era sencillo de describir y brutal de ajustar:

El agente observa su entorno
Elige una acción
Recibe una recompensa (caminar bien = +, caerse = —)
Actualiza los pesos de su red

Cientos de miles de iteraciones después, R0-BB1 empezó a caminar.

No hay nada como ver a una cosa que vos construiste tomando decisiones por su cuenta.

R0-BB2: la segunda generación

En 2021 vino R0-BB2. Hardware mejor, sensores más finos, y un modelo entrenado con un dataset de simulación 10x más grande. Pero la lección importante fue otra: el detalle del entorno simulado importa más que la complejidad del modelo.

Lo que me quedó

Que los sistemas que aprenden son una conversación entre vos y la máquina, no un trámite
Que la paciencia para iterar es más rentable que la velocidad para programar
Que la diferencia entre un proyecto que funciona y uno que no es la calidad de la simulación

Este proyecto me llevó al mundo de la IA aplicada de la única manera honesta: rompiendo cosas hasta que dejaron de romperse.