Le tecniche descritte in questo lavoro offrono un approccio pratico e completo per affrontare le complessità dell'addestramento distribuito di modelli di deep learning. Grazie a un uso combinato di strategie di parallelismo, ottimizzazioni della memoria e tecnologie avanzate di comunicazione, le soluzioni presentate affrondano le sfide legate alla crescita delle dimensioni dei modelli e alla necessità di maggiori risorse computazionali.

Model Parallelism: Deep Learning con GPU Multiple in modo efficiente e sostenibile

Francesco Gargiulo
;
Antonio Francesco Gentile;Emilio Greco
2025

Abstract

Le tecniche descritte in questo lavoro offrono un approccio pratico e completo per affrontare le complessità dell'addestramento distribuito di modelli di deep learning. Grazie a un uso combinato di strategie di parallelismo, ottimizzazioni della memoria e tecnologie avanzate di comunicazione, le soluzioni presentate affrondano le sfide legate alla crescita delle dimensioni dei modelli e alla necessità di maggiori risorse computazionali.
2025
Istituto di Calcolo e Reti ad Alte Prestazioni - ICAR
AI, multi-GPU, Data Parallelism, Model Parallelism
File in questo prodotto:
File Dimensione Formato  
RT-ICAR-NA-2025-01 (1).pdf

accesso aperto

Licenza: Dominio pubblico
Dimensione 1.19 MB
Formato Adobe PDF
1.19 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/565404
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact