ETH Zurich e il futuro del Robot Learning
Il corso 2026 “From Fundamentals to Foundation Models” mostra come la robotica stia entrando nella nuova fase dell’intelligenza artificiale.
ETH Zurich ha reso pubblicamente accessibili i materiali
del corso “Robot Learning: From Fundamentals to Foundation Models”, offerto nel
semestre primaverile 2026.
Non si tratta di un semplice corso divulgativo online. È
un corso universitario reale, inserito nell’offerta didattica ETH, con lezioni,
slide, registrazioni, esercitazioni di programmazione, repository GitHub e una
struttura accademica completa.
Il corso è tenuto da Oier Mees ed è fornito in lingua
inglese. Anche la valutazione è prevista in inglese. Questo elemento è
importante perché conferma la vocazione internazionale del corso e ne facilita
l’accesso da parte di studenti, ricercatori, ingegneri e osservatori del
settore interessati a comprendere l’evoluzione della robotica intelligente a
partire da materiali didattici di livello universitario.
Il titolo del corso è già una dichiarazione di metodo:
Robot Learning: From Fundamentals to Foundation Models. Il percorso non parte
direttamente dai modelli più avanzati, ma costruisce progressivamente il
quadro: imitation learning, reinforcement learning, policy optimization,
modelli generativi, transformers, world models, generalist robot policies,
Vision-Language-Action models e foundation models per la robotica.
In altre parole, il corso mostra con chiarezza dove si
sta spostando la frontiera dell’intelligenza artificiale applicata al mondo
fisico.
La scelta di rendere accessibili questi materiali ha
anche un valore didattico più ampio. Come ha spiegato Oier Mees, una delle
motivazioni alla base del corso era superare la frammentazione tipica del robot
learning: per anni, chi voleva entrare in questo campo doveva ricostruire il
proprio percorso formativo mettendo insieme decine di paper, corsi separati e
materiali non sempre coordinati.
Il merito del corso ETH Zurich è proprio quello di
offrire una traiettoria ordinata: partire dai principi fondamentali e arrivare
progressivamente ai sistemi più avanzati oggi al centro della ricerca, inclusi
i foundation models per la robotica. In questo senso, il corso non è soltanto
una raccolta di lezioni, ma una vera architettura formativa per comprendere
come l’intelligenza artificiale stia entrando nel mondo fisico.
Per molti anni la robotica è stata letta soprattutto come
disciplina dell’automazione, del controllo, della meccanica, dei sensori e
degli attuatori. Oggi, invece, il centro della ricerca si sta ampliando. Il
robot non è più soltanto una macchina che esegue istruzioni in un ambiente
predefinito. Diventa progressivamente un agente fisico capace di apprendere da
dimostrazioni, dati visuali, simulazioni, linguaggio naturale, interazioni
reali e modelli multimodali.
Questa trasformazione è cruciale. Dopo l’esplosione dei
large language models, una delle grandi questioni dei prossimi anni sarà come
trasferire capacità di apprendimento, ragionamento e generalizzazione dal
dominio digitale al mondo fisico. Un chatbot può generare testo. Un modello
multimodale può interpretare immagini e linguaggio. Un robot, invece, deve
percepire, decidere, muoversi, manipolare oggetti, correggere errori, adattarsi
a vincoli materiali e agire in ambienti incerti.
È qui che il robot learning diventa una delle aree più
importanti dell’intelligenza artificiale contemporanea.
Il programma del corso ETH è particolarmente interessante
perché non presenta la robotica come un settore isolato. La colloca invece al
punto di convergenza tra machine learning, computer vision, reinforcement
learning, modelli generativi, simulazione, linguaggio, decisione autonoma e
controllo fisico.
Le prime settimane sono dedicate ai fondamenti: controllo
robotico, Markov Decision Processes, imitation learning e reinforcement
learning. Successivamente il corso introduce modelli generativi, diffusion
policy, sequence modeling, transformers, world models, embodied reasoning e
problemi aperti della ricerca. Il risultato è una sequenza didattica che
accompagna lo studente dalla base tecnica fino alla frontiera dei foundation
models per la robotica.
Anche la componente pratica è centrale. Il corso non si
limita alla teoria: include esercitazioni in Python, homework di programmazione
e un progetto finale. La valutazione è costruita su tre pilastri: presentazione
e moderazione di paper scientifici, practical homework e final project di
gruppo. È una struttura coerente con la natura stessa della robotica moderna,
dove la comprensione teorica deve sempre confrontarsi con implementazione,
simulazione, dati, errore e validazione sperimentale.
La lista dei paper discussi è un altro elemento di
valore. Nel calendario compaiono lavori su reinforcement learning, visual
imitation, diffusion models, decision transformers, ALOHA, Gato, world models,
embodied agents e Vision-Language-Action models. Per chi vuole capire dove si
sta muovendo il settore, questa non è soltanto una bibliografia didattica: è
una vera mappa della letteratura scientifica che oggi orienta la ricerca sul
robot learning.
Il punto più interessante, tuttavia, è strategico.
La robotica intelligente non riguarda soltanto la
sostituzione di compiti manuali o l’aumento dell’automazione industriale. Tocca
logistica, manifattura, sanità, assistenza, agricoltura, infrastrutture,
difesa, esplorazione spaziale, servizi e gestione di ambienti complessi. La
domanda non è più semplicemente se i robot diventeranno più capaci. La domanda
è quale tipo di intelligenza fisica stiamo costruendo, con quali dati, quali
modelli, quali limiti, quali responsabilità e quali effetti economici.
I Vision-Language-Action models rappresentano uno dei
passaggi più importanti in questa direzione. Cercano di collegare ciò che il
robot vede, ciò che comprende attraverso il linguaggio e ciò che deve fare
nello spazio fisico. È un cambio di paradigma: dall’intelligenza artificiale
come previsione o generazione di contenuti all’intelligenza artificiale come
capacità incarnata di azione.
Naturalmente, la disponibilità pubblica dei materiali non
significa che il problema sia risolto. Al contrario, il corso mostra quanto la
robotica intelligente sia ancora una frontiera aperta. Restano questioni
difficili: scarsità dei dati robotici, costo dell’hardware, generalizzazione
fuori distribuzione, robustezza, sicurezza, trasferimento dalla simulazione al
mondo reale, interpretabilità delle decisioni, affidabilità operativa e
scalabilità dell’apprendimento.
Ed è proprio per questo che il corso ETH è importante.
Non propone una narrazione semplificata. Offre metodo, codice, letteratura
scientifica e una struttura didattica per comprendere la complessità reale del
campo.
Per studenti, ricercatori, ingegneri, investitori, policy
maker e osservatori dell’innovazione, questi materiali rappresentano una
risorsa preziosa. Permettono di guardare alla robotica non come a una
successione di dimostrazioni spettacolari, ma come a un ecosistema scientifico
in rapido consolidamento, nel quale apprendimento, percezione, linguaggio e
azione stanno convergendo verso una nuova generazione di agenti fisici.
Il futuro dell’intelligenza artificiale non sarà soltanto
nei data center, nei modelli linguistici o nelle interfacce digitali. Una parte
decisiva si giocherà nel mondo reale: negli oggetti, negli spazi, nei corpi
robotici, negli ambienti produttivi e nelle infrastrutture fisiche.
Il corso ETH Zurich offre una chiave di lettura molto
chiara: per capire la prossima fase dell’intelligenza artificiale bisogna
studiare il punto in cui l’apprendimento incontra l’azione.
Ed è precisamente lì che la robotica sta tornando al
centro della scena.
Scheda sintetica del corso
Titolo: Robot Learning: From Fundamentals to Foundation Models Università: ETH Zurich
Semestre: Spring 2026
Unità catalogo: 263-5911-00L
Docente: Oier Mees
Lingua del corso: inglese
Lingua d’esame: inglese
Crediti: 5 ECTS
Formato: lezioni, discussione di paper, esercitazioni pratiche e progetto finale
Materiali disponibili: slide, registrazioni, repository GitHub, esercitazioni di programmazione
Temi principali: imitation learning, reinforcement learning, policy optimization, generative models, diffusion policy, transformers, world models, embodied reasoning, Vision-Language-Action models, foundation models for robotics
Riferimenti
ETH
Zurich – Course Catalogue, “Robot Learning: From Fundamentals to Foundation
Models”, unità 263-5911-00L, Spring Semester 2026.
https://www.vorlesungen.ethz.ch/Vorlesungsverzeichnis/lerneinheit.view?ansicht=ALLE&lang=en&lerneinheitId=201901&semkez=2026S
ETH
Zurich – Computer Vision and Geometry Group, “Robot Learning: From Fundamentals
to Foundation Models (Spring 2026)”.
https://cvg.ethz.ch/lectures/Robot-Learning/
GitHub –
mees-robot-learning-course/ethz-course-2026, repository del corso ETH Zurich
“Robot Learning: From Fundamentals to Foundation Models”.
https://github.com/mees-robot-learning-course/ethz-course-2026
ETH
Zurich Video Portal – “Robot Learning: From Fundamentals to Foundation Models”,
lecture recordings, Spring 2026.
https://video.ethz.ch/lectures/d-infk/2026/spring/263-5911-00L










