CNR Institutional Research Information System

In this work performance of the INTEL i860 processor are analyzed. This processor has a superscalar architecture and multiple functional units with pipelining; the version we use, with 33 MHz clock cycle, yields a peak performance of 67 MFLOPS in single and 50 MFLOPS in double precision. In the first part of the report we analyze the efficiency of the architecture and software tools for several basic vector operations and for the matrix multiply. In the second part we present performance obtained with two applicative codes, we already employed to measure performance of FPS M64/60 and FPS 500 computers. These codes are an implementation with matrix kernels of the Back-Propagation algorithm for neural network training and two versions of the Grassberger and Procaccia algorithm to compute the Correlation Dimension. In some cases performance given by the i860 processor are compared with those achieved on the FPS 511EA, whose vector processor, with a classical register-to-register architecture, has the same clock as the i860 (33 MHz) and a peak speed of 67 MFLOPS, both in single and in double precision.

In questo lavoro è effettuata un' analisi delle prestazioni fornite dal processore INTEL i860. Tale processore ha architettura superscalare, unità funzionali multiple con pipelining e nella versione da noi utilizzata, con clock a 33 MHz, fornisce una velocità di picco di 67 MFLOPS in precisione singola e 50 MFLOPS in precisione doppia. Nella prima parte del lavoro è analizzata l'efficienza dell' architettura e degli strumenti software per varie operazioni vettoriali di base e per la moltiplicazione di matrici. Nella seconda parte sono presentate le prestazioni ottenute con due codici applicativi, già da noi utilizzati per misurare le prestazioni degli elaboratori FPS M64/60 e FPS 511EA. Tali codici sono una implementazione con nuclei matriciali dell' algoritmo di Back Propagation per l' addestramento di reti neurali e due versioni dell' algoritmo di Grassberger e Procaccia per il calcolo della Correlation Dimension, utilizzate nello studio di sistemi non lineari e caotici. In alcuni casi le prestazioni fornite dal processore i860 sono confrontate con quelle ottenute su FPS 511EA, il cui processore vettoriale, con una classica architettura di tipo register to register, ha lo stesso clock dell' INTEL i860 (33 MHz) ed una velocità di picco pari a 67 MFLOPS sia in singola the in doppia precisione.

Analisi delle prestazioni del processore Intel i860: nuclei computazionali di base e codici applicativi

A Corana;C Rolando

1993

Abstract

In this work performance of the INTEL i860 processor are analyzed. This processor has a superscalar architecture and multiple functional units with pipelining; the version we use, with 33 MHz clock cycle, yields a peak performance of 67 MFLOPS in single and 50 MFLOPS in double precision. In the first part of the report we analyze the efficiency of the architecture and software tools for several basic vector operations and for the matrix multiply. In the second part we present performance obtained with two applicative codes, we already employed to measure performance of FPS M64/60 and FPS 500 computers. These codes are an implementation with matrix kernels of the Back-Propagation algorithm for neural network training and two versions of the Grassberger and Procaccia algorithm to compute the Correlation Dimension. In some cases performance given by the i860 processor are compared with those achieved on the FPS 511EA, whose vector processor, with a classical register-to-register architecture, has the same clock as the i860 (33 MHz) and a peak speed of 67 MFLOPS, both in single and in double precision.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				1993
			
	Strutture organizzative
	
				Istituto di Elettronica e di Ingegneria dell'Informazione e delle Telecomunicazioni - IEIIT
			
	Breve descrizione dei contenuti (Abstract)
	
				In questo lavoro è effettuata un' analisi delle prestazioni fornite dal processore INTEL i860.  Tale processore ha architettura superscalare, unità funzionali multiple con pipelining e nella versione da noi utilizzata, con clock a 33 MHz, fornisce una velocità di picco di 67 MFLOPS in precisione singola e 50 MFLOPS in precisione doppia.
Nella prima parte del lavoro è analizzata l'efficienza dell' architettura e degli strumenti software per varie operazioni vettoriali di base e per la moltiplicazione di matrici.
Nella seconda parte sono presentate le prestazioni ottenute con due codici applicativi, già da noi utilizzati per misurare le prestazioni degli elaboratori FPS M64/60 e FPS 511EA.  Tali codici sono una implementazione con nuclei matriciali dell' algoritmo di Back Propagation per l' addestramento di reti neurali e due versioni dell' algoritmo di Grassberger e Procaccia per il calcolo della Correlation Dimension, utilizzate nello studio di sistemi non lineari e caotici.
In alcuni casi le prestazioni fornite dal processore i860 sono confrontate con quelle ottenute su FPS 511EA, il cui processore vettoriale, con una classica architettura di tipo register to register, ha lo stesso clock dell' INTEL i860 (33 MHz) ed una velocità di picco pari a 67 MFLOPS sia in singola the in doppia precisione.
			
	Parole chiave
	
				High Performance Computing;  vector and superscalar processors;  INTEL i860;  performance evaluation;  benchmarks;  vector and matrix operations; applicative benchmarks
			
	Appare nelle tipologie:
	
				08.04 Rapporto tecnico

File in questo prodotto:

Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/323171

Citazioni

ND

ND

ND

social impact