Le tecniche descritte in questo lavoro offrono un approccio pratico e completo per affrontare le complessità dell'addestramento distribuito di modelli di deep learning. Grazie a un uso combinato di strategie di parallelismo, ottimizzazioni della memoria e tecnologie avanzate di comunicazione, le soluzioni presentate affrondano le sfide legate alla crescita delle dimensioni dei modelli e alla necessità di maggiori risorse computazionali.
Model Parallelism: Deep Learning con GPU Multiple in modo efficiente e sostenibile
Francesco Gargiulo
;Antonio Francesco Gentile;Emilio Greco
2025
Abstract
Le tecniche descritte in questo lavoro offrono un approccio pratico e completo per affrontare le complessità dell'addestramento distribuito di modelli di deep learning. Grazie a un uso combinato di strategie di parallelismo, ottimizzazioni della memoria e tecnologie avanzate di comunicazione, le soluzioni presentate affrondano le sfide legate alla crescita delle dimensioni dei modelli e alla necessità di maggiori risorse computazionali.File in questo prodotto:
| File | Dimensione | Formato | |
|---|---|---|---|
|
RT-ICAR-NA-2025-01 (1).pdf
accesso aperto
Licenza:
Dominio pubblico
Dimensione
1.19 MB
Formato
Adobe PDF
|
1.19 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


