Echelon este numele de cod pentru un proiect de cercetare nVidia din 2010 de proiectare a unui nou microprocesor pentru supercomputing și calcul grafic .
Defense Advanced Research Projects Agency (DARPA) a anunțat sponsorizarea programului Ubiquitous High Performance Computing ( UHPC ) [ 1] [2] , care își propune să creeze un prototip de sistem server - rafturi cu o performanță de 1 petaflops și un consum de energie. de 57 kW. La competiție au participat Intel , MIT , Sandia National Labs și nVidia . Finalizarea acestui program este programată pentru anul 2018.
Pe 18 noiembrie 2010, la conferința Supercomputing 2010 din New Orleans , Louisiana , directorul de tehnologie nVidia, Bill Dally , a anunțat proiectul Echelon ca rezultat al activității companiei la inițiativa DARPA. Proiectul Echelon a fost anunțat ca un microprocesor similar în caracteristicile sale structurale cu cele mai recente GPU-uri nVidia . În ciuda faptului că la momentul anunțului, cipul exista doar pe hârtie, iar designul a fost testat într-o serie de simulări, au fost dezvăluite unele caracteristici tehnologice și planuri de dezvoltare și lansare. Au fost prezentate scheme, grafice și diagrame care arată structura internă și caracteristicile procesorului.
În 2011, cipul a fost evaluat pentru producție folosind tehnologia de proces de 10 nm cu o suprafață de cip de 290 mm2 [3] .
Microprocesorul Echelon va consta din 128 de blocuri de fire, fiecare conținând opt nuclee. Fiecare nucleu poate efectua în mod independent operații în virgulă mobilă, iar caracteristica principală este că într-un ciclu un nucleu poate efectua patru operații în virgulă mobilă cu precizie dublă. În același timp, cele mai noi procesoare grafice profesionale nVidia la momentul anunțului - Fermi - sunt capabile să efectueze o singură operație pe ceas. Astfel, 1024 de nuclee „Echelon” oferă o performanță totală teoretică de 10 TFLOPS.
Microprocesorul Echelon este capabil să efectueze o singură operație în virgulă mobilă folosind doar 10 picojouli de energie. Pentru comparație, Fermi folosește 200 de picojouli pentru o operație similară.
O altă caracteristică a cipului este memoria cache, care are șase nivele și are 256 MB. Memoria grafică externă maximă acceptată este de 256 GB.
Se afirmă că o versiune viitoare a CUDA va fi folosită ca instrument de programare a cipului „Echelon” , deși nu este exclus suportul pentru versiunile viitoare de OpenCL , OpenMP și Microsoft DirectCompute .