GeForce GTX 970 e partizioni memoria: nuovi dettagli tecnici

Written By Unknown on Selasa, 27 Januari 2015 | 17.25

Nella giornata di ieri, con questa notizia, abbiamo segnalato come le schede NVIDIA GeForce GTX 970 siano caratterizzate da un quantitativo di memoria video pari a 4 Gbytes ma che questo sia in realtà diviso in due distinte partizioni. La prima, di capacità pari a 3,5 Gbytes, è quella principale ed è chiamata in causa da GPU e driver video in ogni momento in cui venga richiesta della memoria video. La seconda, da 0,5 Gbytes di capacità, è invece attivata solo quando i 3,5 Gbytes iniziali non sono più sufficienti a gestire tutti i dati a disposizione.

Una prima spiegazione ufficiale fornita da NVIDIA evidenzia come siano presenti due partizioni e come l'utilizzo di tutto il quantitativo a disposizione porti a prestazioni velocistiche che sono pressoché proporzionali a quanto ottenibile con le schede GeForce GTX 980 in pari condizioni. Queste ultime sono dotate sempre di 4 Gbytes di memoria video, alla stessa frequenza di clock di 7 GHz effettivi dei moduli adottati dalle schede GeForce GTX 970.

Sono emersi nuovi dettagli più approfonditi sul motivo per il quale NVIDIA ha scelto di dotare le schede GeForce GTX 970, e non quelle GeForce GTX 980, di questo particolare partizionamento della memoria video onboard. La prima novità è una rivisitazione delle specifiche delle schede GeForce GTX 970 in due elementi: il numero di ROPs e il quantitativo di memoria cache L2 integrato nella GPU. La rivisitazione non riguarda una modifica intervenuta nel tempo ma una correzione di quanto inizialmente indicato da NVIDIA nella propria reviewer's guide fornita alla stampa. In questo documento, che fornisce indicazioni su vari parametri tecnici delle GPU in prova, l'azienda americana ha originariamente ed erroneamente indicato per GeForce GTX 970 la presenza dello stesso numero di ROPs di GeForce GTX 980 oltre che del medesimo quantitativo di memoria cache L2 quando in realtà, per via dell'architettura di GeForce GTX 970, così non è. Nella tabella seguente sono messe a confronto le specifiche precedenti con quelle aggiornate, accanto a quelle di GeForce GTX 980.

Modello

GeForce GTX 980 GeForce GTX 970
specifiche errate
GeForce GTX 970
nuove specifiche
GPU GM204 GM204 GM204
CUDA cores 2.048 1.664 1.664
clock GPU 1.126 MHz 1.050MHz 1.050MHz
boost clock GPU 1.216 MHz 1.178 MHz 1.178 MHz
ROPs 64 64 56
TMU 128 104 104
cache L2 2MB 2MB 1,75MB
clock memoria 7.008 MHz 7.008 MHz 7.008 MHz
dotazione memoria 4 Gbytes 4 Gbytes 4 Gbytes
bandwidth memoria 224 GB/s 224 GB/s 192 GB/s
bus memoria 256bit 256bit 256bit
alimentazione 6pin+6pin 6pin+6pin 6pin+6pin

La riduzione nel numero di ROPs e della cache L2 è legata alla presenza nella GPU GeForce GTX 970 di 13 SMM attivi contro i 16 della GPU GeForce GTX 980, senza tuttavia una relazione lineare tra questi componenti. L'architettura Maxwell adottata per queste GPU ha quale caratteristica tecnica quella di poter disabilitare alcune delle ROP presenti, oltre che di partizioni del controller memoria, indipendentemente dal numero di CUDA cores che sono attivati. Tale caratteristica tecnicha non era presente nelle soluzioni di precedente generazione: per questo motivo la cache L2 in GeForce GTX 970 è 14/16 di quella di GeForce GTX 980, al pari del numero di ROPs, mentre il rapporto tra i CUDA cores delle due GPU è di 13/16.

Il controller memoria integrato nelle GPU della famiglia Maxwell ha un design di tipo Crossbar, nel quale da un lato troviamo le connessioni con le varie SMM e quindi con gli stream processors abilitati nella specifica GPU in uso e dall'altro troviamo le partizioni della cache L2 e i memory controller. Nella GPU GeForce GTX 970 3 SMM sono disabilitate mentre unitamente ad una delle 8 partizioni della cache L2.

nvidia_gm204_crossbar.jpg (60706 bytes)
schema controller memoria e SMM di GeForce GTX 970 - fonte: NVIDIA

Ad ogni partizione della cache L2, ciascuna grande 256 Kbytes, è collegato uno degli 8 memory controller da 32bit al quale è a sua volta collegata della memoria DRAM. Notiamo come l'ultimo memory controller non sia associato ad un modulo cache L2, in quanto disabilitato: questa partizione, dalla dimensione di 0,5 Gbytes, deve quindi dipendere dalla cache L2 del blocco adiacente sfruttando una connessione appositamente prevista da NVIDIA per questo scopo. Dinamica simile vale per il blocco di ROPs associate al moduli L2 disabilitato: anche questi componenti sono in GeForce GTX 970 disabilitati, portando il loro numero complessivo a 56.

Da questo ne origina il particolare comportamento di GeForce GTX 970 e la presenza di due distinte partizioni della memoria: la prima da 3,5 Gbytes e la seconda da 0,5 Gbytes che interviene quando la prima è stata saturata dai dati necessari per la elaborazione 3D. Per via di questo design la bandwidth massima teorica della scheda, pari a 224 Gbytes al secondo, deve essere ricalcolata indicando il valore di 196 Gbytes al secondo generato dai primi 7 memory controller, cioè dalla partizione principale da 3,5 GBytes della memoria video, accanto ai 28 Gbytes al secondo provenienti dall'ultimo memory controller quando si accede a questa partizione da 512 Mbytes. Di fatto quindi la scheda o accede a banda piena al primo segmento da 3,5 Gbytes, con 196 Gbytes al secondo (7 GHz x 7 memory controller ciascuno da 32bit di ampiezza) di banda massima teorica a disposizione, oppure accede alla seconda partizione da 0,5 Gbytes con una bandwidth massima teorica di 28 Gbytes al secondo (7 GHz x 1 memory controller da 32bit di ampiezza).

Quando i dati presenti nella memoria video siano tali da saturare quanto accessibile dalla prima partizione da 3,5 Gbytes si deve necessariamente fare ricorso alla seconda da 0,5 Gbytes, con prestazioni che sono inferiori a motivo della bandwidth più ridotta. Il dato di 28 Gbytes al secondo è in ogni caso ben superiore a quanto messo a disposizione in condizioni ideali dal bus PCI Express 16x adottato dalla scheda video per collegarsi al sistema.

Quali le implicazioni pratiche di tutto questo? Il fatto che NVIDIA abbia fornito una informazione non corretta sul numero di ROPs e sulla dimensione della cache L2 integrate in GeForce GTX 970 in alcun modo influenza le prestazioni velocistiche che abbiamo rilevato con queste schede. A essere errata era l'informazione tecnica ma la GPU è sempre stata così internamente in termini di modalità di funzionamento: NVIDIA ha voluto sviluppare in questo modo questa GPU e il comportamento ottenuto sul campo è quello che NVIDIA aveva teoricamente previsto in fase di design del prodotto.

Le considerazioni sulle prestazioni di queste schede rimangono pertanto invariate: si tratta di un eccellente prodotto per il prezzo al quale viene proposto. Come abbiamo già segnalato in questo pezzo è però da rimarcare come in quelle condizioni d'uso che vanno oltre la partizione memoria da 3,5 Gbytes si possa avere un impatto prestazionale, tipicamente molto contenuto anche in virtù della potenza di elaborazione complessiva: parliamo di scenari con risoluzione 4K o superiore, quindi non di quelli che tipicamente sono utilizzati al momento dai videogiocatori anche molto appassionati.

Da tempo si attende il debutto di schede GeForce GTX 970 dotate di 8 Gbytes di memoria video; per questi prodotti, alla luce di quanto indicato qui sopra, il partizionamento della memoria passerà ad una struttura con 7 Gbytes affiancati da 1 Gbyte, ovviando quindi a possibili ricadute prestazionali nell'utilizzo di risoluzioni video che possono diventare per la memoria video un collo di bottiglia con le declinazioni a 4 Gbytes.


Anda sedang membaca artikel tentang

GeForce GTX 970 e partizioni memoria: nuovi dettagli tecnici

Dengan url

http://gameserunik.blogspot.com/2015/01/geforce-gtx-970-e-partizioni-memoria.html

Anda boleh menyebar luaskannya atau mengcopy paste-nya

GeForce GTX 970 e partizioni memoria: nuovi dettagli tecnici

namun jangan lupa untuk meletakkan link

GeForce GTX 970 e partizioni memoria: nuovi dettagli tecnici

sebagai sumbernya

0 komentar:

Posting Komentar

techieblogger.com Techie Blogger Techie Blogger