Se está volviendo un poco más fácil construir proyectos de robóticos sofisticados en casa.
La plataforma de desarrollo de AI Hugging Face lanzó a principios de esta semana un modelo de IA abierto para robótica llamado Smolvla. Entrenado en conjuntos de datos «con licencia compatiblemente» compartidos de la comunidad, Smolvla supera a modelos mucho más grandes para robótica en entornos virtuales y de mundo real, abrazando reclamos faciales.
“Smolvla tiene como objetivo democratizar el acceso a la acción-idioma de la visión [VLA] modelos y acelerar la investigación hacia agentes robóticos generalistas ”, escribe la cara abrazada en un blog. “Smolvla no solo es un modelo liviano pero capaz, sino también un método para capacitar y evaluar la robótica generalista [technologies]. «
Smolvla es parte de Hugging Face el esfuerzo en rápida expansión para establecer un ecosistema de hardware y software de robótica de bajo costo. El año pasado, la compañía lanzó Lerobot, una colección de modelos, conjuntos de datos y herramientas centrados en la robótica. Más recientemente, la cara abrazada adquirida Robótica de polenuna startup de robótica con sede en Francia, y dio a conocer varios barato sistemas de robótica, incluidos humanoidespara la compra.
Smolvla, que tiene 450 millones de parámetros de tamaño, fue capacitado en datos de conjuntos de datos de la comunidad Lerobot, conjuntos de datos de robóticos especialmente marcados compartidos en la plataforma de desarrollo de IA de Hugging Face. Los parámetros, a veces denominados pesos, son los componentes internos de un modelo que guían su comportamiento.
Abrazando a Face afirma que Smolvla es lo suficientemente pequeño como para ejecutarse con una sola GPU de consumo, o incluso en una MacBook, y puede probarse e implementarse en hardware «asequible», incluidos los sistemas de robótica propios de la compañía.
En un giro interesante, Smolvla también admite una «pila de inferencias asíncronas», que dice que abraza la cara dice que el modelo separe el procesamiento de las acciones de un robot del procesamiento de lo que ve y escucha. Como explica la compañía en su publicación de blog, «[b]Porcúa de esta separación, los robots pueden responder más rápidamente en entornos de cambio rápido «.
Smolvla está disponible para descargar desde Hugging Face. Ya, un usuario en X afirma haber utilizado el modelo para controlar un brazo robótico de terceros:
Vale la pena señalar que abrazar la cara está lejos de ser el único jugador en la naciente carrera de robótica abierta.
Nvidia tiene una colección de herramientas para robótica abierta, y la startup K-Scale Labs está construyendo los componentes para lo que llama «humanoides de código abierto». Otras empresas formidables en el segmento incluyen Dyna Robotics, inteligencia física respaldada por Jeff Bezos, y Rlwrld.