ETH Zurich e il futuro del Robot Learning


Il corso 2026 “From Fundamentals to Foundation Models” mostra come la robotica stia entrando nella nuova fase dell’intelligenza artificiale.

ETH Zurich ha reso pubblicamente accessibili i materiali del corso “Robot Learning: From Fundamentals to Foundation Models”, offerto nel semestre primaverile 2026.

Non si tratta di un semplice corso divulgativo online. È un corso universitario reale, inserito nell’offerta didattica ETH, con lezioni, slide, registrazioni, esercitazioni di programmazione, repository GitHub e una struttura accademica completa.

Il corso è tenuto da Oier Mees ed è fornito in lingua inglese. Anche la valutazione è prevista in inglese. Questo elemento è importante perché conferma la vocazione internazionale del corso e ne facilita l’accesso da parte di studenti, ricercatori, ingegneri e osservatori del settore interessati a comprendere l’evoluzione della robotica intelligente a partire da materiali didattici di livello universitario.

Il titolo del corso è già una dichiarazione di metodo: Robot Learning: From Fundamentals to Foundation Models. Il percorso non parte direttamente dai modelli più avanzati, ma costruisce progressivamente il quadro: imitation learning, reinforcement learning, policy optimization, modelli generativi, transformers, world models, generalist robot policies, Vision-Language-Action models e foundation models per la robotica.

In altre parole, il corso mostra con chiarezza dove si sta spostando la frontiera dell’intelligenza artificiale applicata al mondo fisico.

La scelta di rendere accessibili questi materiali ha anche un valore didattico più ampio. Come ha spiegato Oier Mees, una delle motivazioni alla base del corso era superare la frammentazione tipica del robot learning: per anni, chi voleva entrare in questo campo doveva ricostruire il proprio percorso formativo mettendo insieme decine di paper, corsi separati e materiali non sempre coordinati.

Il merito del corso ETH Zurich è proprio quello di offrire una traiettoria ordinata: partire dai principi fondamentali e arrivare progressivamente ai sistemi più avanzati oggi al centro della ricerca, inclusi i foundation models per la robotica. In questo senso, il corso non è soltanto una raccolta di lezioni, ma una vera architettura formativa per comprendere come l’intelligenza artificiale stia entrando nel mondo fisico.

Per molti anni la robotica è stata letta soprattutto come disciplina dell’automazione, del controllo, della meccanica, dei sensori e degli attuatori. Oggi, invece, il centro della ricerca si sta ampliando. Il robot non è più soltanto una macchina che esegue istruzioni in un ambiente predefinito. Diventa progressivamente un agente fisico capace di apprendere da dimostrazioni, dati visuali, simulazioni, linguaggio naturale, interazioni reali e modelli multimodali.

Questa trasformazione è cruciale. Dopo l’esplosione dei large language models, una delle grandi questioni dei prossimi anni sarà come trasferire capacità di apprendimento, ragionamento e generalizzazione dal dominio digitale al mondo fisico. Un chatbot può generare testo. Un modello multimodale può interpretare immagini e linguaggio. Un robot, invece, deve percepire, decidere, muoversi, manipolare oggetti, correggere errori, adattarsi a vincoli materiali e agire in ambienti incerti.

È qui che il robot learning diventa una delle aree più importanti dell’intelligenza artificiale contemporanea.

Il programma del corso ETH è particolarmente interessante perché non presenta la robotica come un settore isolato. La colloca invece al punto di convergenza tra machine learning, computer vision, reinforcement learning, modelli generativi, simulazione, linguaggio, decisione autonoma e controllo fisico.

Le prime settimane sono dedicate ai fondamenti: controllo robotico, Markov Decision Processes, imitation learning e reinforcement learning. Successivamente il corso introduce modelli generativi, diffusion policy, sequence modeling, transformers, world models, embodied reasoning e problemi aperti della ricerca. Il risultato è una sequenza didattica che accompagna lo studente dalla base tecnica fino alla frontiera dei foundation models per la robotica.

Anche la componente pratica è centrale. Il corso non si limita alla teoria: include esercitazioni in Python, homework di programmazione e un progetto finale. La valutazione è costruita su tre pilastri: presentazione e moderazione di paper scientifici, practical homework e final project di gruppo. È una struttura coerente con la natura stessa della robotica moderna, dove la comprensione teorica deve sempre confrontarsi con implementazione, simulazione, dati, errore e validazione sperimentale.

La lista dei paper discussi è un altro elemento di valore. Nel calendario compaiono lavori su reinforcement learning, visual imitation, diffusion models, decision transformers, ALOHA, Gato, world models, embodied agents e Vision-Language-Action models. Per chi vuole capire dove si sta muovendo il settore, questa non è soltanto una bibliografia didattica: è una vera mappa della letteratura scientifica che oggi orienta la ricerca sul robot learning.

Il punto più interessante, tuttavia, è strategico.

La robotica intelligente non riguarda soltanto la sostituzione di compiti manuali o l’aumento dell’automazione industriale. Tocca logistica, manifattura, sanità, assistenza, agricoltura, infrastrutture, difesa, esplorazione spaziale, servizi e gestione di ambienti complessi. La domanda non è più semplicemente se i robot diventeranno più capaci. La domanda è quale tipo di intelligenza fisica stiamo costruendo, con quali dati, quali modelli, quali limiti, quali responsabilità e quali effetti economici.

I Vision-Language-Action models rappresentano uno dei passaggi più importanti in questa direzione. Cercano di collegare ciò che il robot vede, ciò che comprende attraverso il linguaggio e ciò che deve fare nello spazio fisico. È un cambio di paradigma: dall’intelligenza artificiale come previsione o generazione di contenuti all’intelligenza artificiale come capacità incarnata di azione.

Naturalmente, la disponibilità pubblica dei materiali non significa che il problema sia risolto. Al contrario, il corso mostra quanto la robotica intelligente sia ancora una frontiera aperta. Restano questioni difficili: scarsità dei dati robotici, costo dell’hardware, generalizzazione fuori distribuzione, robustezza, sicurezza, trasferimento dalla simulazione al mondo reale, interpretabilità delle decisioni, affidabilità operativa e scalabilità dell’apprendimento.

Ed è proprio per questo che il corso ETH è importante. Non propone una narrazione semplificata. Offre metodo, codice, letteratura scientifica e una struttura didattica per comprendere la complessità reale del campo.

Per studenti, ricercatori, ingegneri, investitori, policy maker e osservatori dell’innovazione, questi materiali rappresentano una risorsa preziosa. Permettono di guardare alla robotica non come a una successione di dimostrazioni spettacolari, ma come a un ecosistema scientifico in rapido consolidamento, nel quale apprendimento, percezione, linguaggio e azione stanno convergendo verso una nuova generazione di agenti fisici.

Il futuro dell’intelligenza artificiale non sarà soltanto nei data center, nei modelli linguistici o nelle interfacce digitali. Una parte decisiva si giocherà nel mondo reale: negli oggetti, negli spazi, nei corpi robotici, negli ambienti produttivi e nelle infrastrutture fisiche.

Il corso ETH Zurich offre una chiave di lettura molto chiara: per capire la prossima fase dell’intelligenza artificiale bisogna studiare il punto in cui l’apprendimento incontra l’azione.

Ed è precisamente lì che la robotica sta tornando al centro della scena.


Scheda sintetica del corso

Titolo: Robot Learning: From Fundamentals to Foundation Models

Università: ETH Zurich
Semestre: Spring 2026
Unità catalogo: 263-5911-00L
Docente: Oier Mees
Lingua del corso: inglese
Lingua d’esame: inglese
Crediti: 5 ECTS
Formato: lezioni, discussione di paper, esercitazioni pratiche e progetto finale
Materiali disponibili: slide, registrazioni, repository GitHub, esercitazioni di programmazione
Temi principali: imitation learning, reinforcement learning, policy optimization, generative models, diffusion policy, transformers, world models, embodied reasoning, Vision-Language-Action models, foundation models for robotics


Riferimenti

ETH Zurich – Course Catalogue, “Robot Learning: From Fundamentals to Foundation Models”, unità 263-5911-00L, Spring Semester 2026.
https://www.vorlesungen.ethz.ch/Vorlesungsverzeichnis/lerneinheit.view?ansicht=ALLE&lang=en&lerneinheitId=201901&semkez=2026S

ETH Zurich – Computer Vision and Geometry Group, “Robot Learning: From Fundamentals to Foundation Models (Spring 2026)”.
https://cvg.ethz.ch/lectures/Robot-Learning/

GitHub – mees-robot-learning-course/ethz-course-2026, repository del corso ETH Zurich “Robot Learning: From Fundamentals to Foundation Models”.
https://github.com/mees-robot-learning-course/ethz-course-2026

ETH Zurich Video Portal – “Robot Learning: From Fundamentals to Foundation Models”, lecture recordings, Spring 2026.
https://video.ethz.ch/lectures/d-infk/2026/spring/263-5911-00L

Post più popolari

Post più popolari