In this work performance of the INTEL i860 processor are analyzed. This processor has a superscalar architecture and multiple functional units with pipelining; the version we use, with 33 MHz clock cycle, yields a peak performance of 67 MFLOPS in single and 50 MFLOPS in double precision. In the first part of the report we analyze the efficiency of the architecture and software tools for several basic vector operations and for the matrix multiply. In the second part we present performance obtained with two applicative codes, we already employed to measure performance of FPS M64/60 and FPS 500 computers. These codes are an implementation with matrix kernels of the Back-Propagation algorithm for neural network training and two versions of the Grassberger and Procaccia algorithm to compute the Correlation Dimension. In some cases performance given by the i860 processor are compared with those achieved on the FPS 511EA, whose vector processor, with a classical register-to-register architecture, has the same clock as the i860 (33 MHz) and a peak speed of 67 MFLOPS, both in single and in double precision.
In questo lavoro è effettuata un' analisi delle prestazioni fornite dal processore INTEL i860. Tale processore ha architettura superscalare, unità funzionali multiple con pipelining e nella versione da noi utilizzata, con clock a 33 MHz, fornisce una velocità di picco di 67 MFLOPS in precisione singola e 50 MFLOPS in precisione doppia. Nella prima parte del lavoro è analizzata l'efficienza dell' architettura e degli strumenti software per varie operazioni vettoriali di base e per la moltiplicazione di matrici. Nella seconda parte sono presentate le prestazioni ottenute con due codici applicativi, già da noi utilizzati per misurare le prestazioni degli elaboratori FPS M64/60 e FPS 511EA. Tali codici sono una implementazione con nuclei matriciali dell' algoritmo di Back Propagation per l' addestramento di reti neurali e due versioni dell' algoritmo di Grassberger e Procaccia per il calcolo della Correlation Dimension, utilizzate nello studio di sistemi non lineari e caotici. In alcuni casi le prestazioni fornite dal processore i860 sono confrontate con quelle ottenute su FPS 511EA, il cui processore vettoriale, con una classica architettura di tipo register to register, ha lo stesso clock dell' INTEL i860 (33 MHz) ed una velocità di picco pari a 67 MFLOPS sia in singola the in doppia precisione.
Analisi delle prestazioni del processore Intel i860: nuclei computazionali di base e codici applicativi
A Corana;
1993
Abstract
In this work performance of the INTEL i860 processor are analyzed. This processor has a superscalar architecture and multiple functional units with pipelining; the version we use, with 33 MHz clock cycle, yields a peak performance of 67 MFLOPS in single and 50 MFLOPS in double precision. In the first part of the report we analyze the efficiency of the architecture and software tools for several basic vector operations and for the matrix multiply. In the second part we present performance obtained with two applicative codes, we already employed to measure performance of FPS M64/60 and FPS 500 computers. These codes are an implementation with matrix kernels of the Back-Propagation algorithm for neural network training and two versions of the Grassberger and Procaccia algorithm to compute the Correlation Dimension. In some cases performance given by the i860 processor are compared with those achieved on the FPS 511EA, whose vector processor, with a classical register-to-register architecture, has the same clock as the i860 (33 MHz) and a peak speed of 67 MFLOPS, both in single and in double precision.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


