web-dev-qa-db-fra.com

Quelle est la différence entre la bande passante et la vitesse de la mémoire GPU?

Je regardais les spécifications des cartes graphiques de la série 10 de Nvidia et remarquais que la vitesse de la mémoire et la bande passante de la mémoire étaient spécifiées. La vitesse de la mémoire est exprimée en Gbps et la bande passante de la mémoire, en Go/s. Pour moi, cela ressemble à la vitesse de la mémoire divisée par 8 devrait être égale à la bande passante de la mémoire, car 8 bits constituent un octet et toutes les autres unités sont les mêmes, mais ce n'est pas le cas.

Je me demandais si quelqu'un pourrait m'expliquer ce qui indique en réalité un taux de transfert réel des données. S'il y avait 2 GPU, l'un avec une vitesse de mémoire supérieure (Gbps) et l'autre avec une bande passante de mémoire supérieure (Go/s), auquel on pourrait transférer plus de données dans un laps de temps fixe (ou est-ce impossible d'une certaine façon)?

Est-ce que j'ai râté quelque chose? Je n'arrive pas à trouver une bonne réponse n'importe où ... Qu'est-ce qui est important ici? Et pourquoi les deux mesures sont-elles exprimées avec presque les mêmes unités (puisqu'un octet est composé de 8 bits, une mesure doit être égale à une autre, si vous convertissez les deux en bits ou en octets)?

Preuve ici et ici (cliquez sur "VIEW FULL SPECS" dans le SPECS section).

13
BassGuitarPanda

Deux choses distinctes sont spécifiées ici. J'ai copié la spécification Nvidia de la page que vous avez liée pour mieux la montrer.

enter image description here

L'un est la puce de mémoire ligne de données vitesse d'interface de 8gbps qui fait partie de la spécification GDDR5, et le suivant est la vitesse de mémoire globale de 256 Go/s.

La mémoire GDDR5 a généralement une largeur de 32 bits, donc le calcul (pour le 1070) est le suivant:

  • 8 Gbps par ligne
  • 32 lignes par puce
  • 8 puces de mémoire sur carte

Multiplier cela nous donne une vitesse de mémoire de 2048gbps, divisez-le par 8 et nous obtenons une bande passante mémoire de 256 Go/s.

Les 8 puces à 32 bits par puce correspondent également à la largeur de l'interface mémoire de 256 bits, ce qui vous permet de faire facilement (8 Gbit/s * 256 bits)/8 bits par octet (ce qui annule parfaitement jusqu'à simplement "256") et arriver avec le même chiffre.

Pour le 1080: 10gbps * 256b/8 = 320GB/s
Pour le 1050: 7gbps * 128b/8 = 112GB/s


Si vous avez deux périphériques qui ont le même débit en bits, mais des Go/s différents, cela vous indique qu'il y a un nombre différent de puces dans la banque de mémoire. En règle générale, vous voudriez choisir la bande passante mémoire globale la plus élevée (Go/s), étant donné que ce sera généralement la bande passante mémoire utile .

Un périphérique avec 10 Gbps par broche mais seulement 4 puces aurait une bande passante totale de 160 Go/s ((10 * 32 * 4) divisé par 8), ce qui serait inférieur au 8 Gbit/s sur 8 puces (256 Go/s) que je vous ai montré plus haut. pour le 1070.

12
Mokubai