Elegir una tarjeta gráfica en función de su referencia

Diciembre 2016

Los consejos para la elección de una tarjeta gráfica son dados en este truco:
Cómo elegir la tarjeta gráfica de nuestra PC

En este artículo, vamos a tratar de dar las claves de desciframiento para comprender cómo los fabricantes nombran a sus diferentes tarjetas gráficas, en la medida de lo posible, porque la lógica no siempre es considerada. Luego trataremos de comparar de un punto de vista teórico los rendimientos de las tarjetas según su estructura interna.

El componente determinante en una tarjeta gráfica es el procesador gráfico, GPU en inglés, con el cual es asociada la memoria para el almacenamiento de los datos.

El GPU está compuesto de procesadores (Stream Processors, SP), haciendo lo esencial de los cálculos, unidades de textura (TU), añadiendo las texturas para cada píxel y ROP (Raster Operators), tratamiento final sobre los píxeles, tratamiento de otros anti-aliasing (suavización automática de los bordes de los gráficos).

Mientras más unidades de cálculo tenga un GPU, Stream Processors sobre todo, pero también Unidades de Textura y Unidades de operación Raster (ROPs), más potente será el GPU.

Dos fabricantes comparten el mercado de las tarjetas gráficas: ATI (comprado por AMD) y NVIDIA.

Para el público en general, las tarjetas NVIDIA son llamadas GeForce y las tarjetas ATI/AMD se llaman Radeon y esto ocurre desde aproximadamente el año 2000.

Resumen:

¿Cómo identificar los rendimientos de una tarjeta gráfica ATI/AMD por su denominación comercial?

Podemos decir que en AMD las denominaciones siguen más o menos un orden lógico (series 3000, 4000, 5000 y 6000):
  • La cifra de los miles caracteriza a la familia del GPU: cuanto más es elevado, la tarjeta es más reciente; por ejemplo, la serie 6000 es más reciente que la serie 5000.
  • Una tarjeta 4850 es claramente más potente que una tarjeta 4650, la cifra más elevada de las centenas indica un GPU superior.
  • Una tarjeta 4850 es claramente menos potente que una tarjeta 4870. Aquí, sólo la cifra de las decenas cambió, se trata del mismo GPU, con un poco menos de unidades de cálculo para la tarjeta HD 4850.

Podemos comparar tarjetas de generaciones diferentes, pero ninguna tarjeta cuya referencia fuera completamente diferente; una tarjeta 4850 es menos potente que una tarjeta 5850 (una sola cifra de diferencia), pero no podemos decir nada a priori sobre los rendimientos comparados de una 4850 y de una 5770, la 5770 son más recientes (cifra de los millares = 5 > 4), pero la cifra centenas es inferior (7 < 8), hay que ver la estructura de su GPU para poder decir más sobre eso.

Desgraciadamente hay casos donde esta lógica de numeración no es respetada, como veremos con la HD 6800.

Cómo identificar los rendimientos de una tarjeta gráfica NVIDIA por su referencia

En NVIDIA, la numeración sigue también un orden más o menos lógico:

GeForce GT/GTS/GTX series 100 a 500:
  • La cifra de las centenas caracteriza a la familia del GPU, más o menos el año de salida. Por ejemplo, una GT 250 es más antiguo que una GT 450. El prefijo GT / GTS / GTX simplemente indica una tarjeta cada vez más potente, es redundante con la numeración. Las tarjetas a partir de la serie 400 son compatibles DX11, la menos potente es la GT 430 y la más potente es la GT 580.
  • La cifra de las decenas que aumenta corresponde a un GPU más potente, pero basado en principio sobre la misma estructura: por ejemplo, la GTX 480 es más potente que la GTX 470, basado en el mismo GPU, con unidades de tratamiento desactivadas. Pero hay unas excepciones: la GTX 460 no es una GTX 470 con unidades desactivadas o menos numerosas.


En NVIDIA, los procesadores de flujo (Stream Processors, SP) son también llamados unidades de tratamiento o CUDA cores. CUDA son las siglas de Compute Unified Device Architecture (Arquitectura Unificada de Dispositivos de Cómputo).

Para las series GT 200, 400 y 500, la potencia de la tarjeta gráfica corresponde a la regla de numeración.

En cambio, entre la serie GT 100 y la GT 200 es imposible de determinarla, por lo que es necesario ver la estructura interna del procesador gráfico (GPU).

Se obtiene esto datos comparativos Series 100/200 y GeForce 9000:

Serie 100:
  • G 100*: 8 SP, inferior a la 9400 GT
  • GT 120*: 32 SP, equivalente a la 9500 GT
  • GT 130*: 48 SP, intermediario entre 9500 GT y 9600 GT
  • GTS 150*: 128 SP, similar a la 9800 GTX+


Serie 200:
  • G 210: 16 SP, equivalente a la 9400 GT
  • GT 220: 48 SP, intermediario entre 9500 GT y 9600 GT
  • GT 230*: 64 SP, similar a la 9600 GT
  • GT 240: 96 SP, equivalente a la 9600 GSO (9600 GT potenciado)
  • GTS 240*: 112 SP, equivalente a une 9800 GT overclockeado
  • GTS 250: 128 SP, equivalente a la 9800 GTX+

(*) Estas tarjetas son incorporadas en las PC de marcas y no disponibles a la venta al detalle.

Comparación teórica de las tarjetas ATI/AMD y NVIDIA

Para tener una idea más exacta de los rendimientos teóricos de tarjeta del mismo fabricante entre ellas, es necesario mirar la estructura del GPU.

Luego, podemos comparar las frecuencias de funcionamiento del GPU y la memoria, pero esto tiene sentido sólo como modelos muy parecidos.

De hecho, comparar la frecuencia del GPU de una tarjeta HD 5850 (725 MHz) con una tarjeta HD 5870 (850 Mhz) tiene sentido, porque las 2 tarjetas están basadas en el mismo GPU, con un número diferente de procesadores de flujo, pero no tiene ningún sentido comparar una tarjeta HD 5850 y una tarjeta HD 6950 (800 MHz), porque la estructura del GPU es totalmente distinta.

En AMD:

Como se mencionó anteriormente, la lógica no se sigue en AMD para los HD 6800. Por ejemplo, entre la tarjeta HD 5850 y la HD 6850, la comparación de las cifras de los miles indica que la HD 6850 es más reciente y es verdad. Pero la lógica se detiene allí, la cifra de las centenas idéntica debería significar que el HD 6850 es superior al HD 5850, pero no es así.

Hay que mirar las unidades internas del GPU para comprender:
  • HD 5850: procesadores de flujo 288 vec5, a menudo contabilizados 1440 (288x5), 72 unidades de textura y 32 unidades Raster (ROPs).
  • HD 6850: procesadores de flujo: 192 vec5, contados 960 (192x5), 48 unidades de textura y 32 unidades Raster (ROPs).

Aquí, comprobamos fácilmente una cantidad más importante de procesadores de flujo y de unidades de textura en el HD 5850.

La optimización del tratamiento del teselado facetado y las frecuencias más elevadas en el HD 6850 permiten reducir la diferencia, pero los hechos son:
  • La HD 5850 es el más potente que la HD 6850 en las pruebas reales en los juegos, mientras que eso debería ser a la inversa, según la numeración.

Obtenemos el mismo resultado con la HD 5870 y la HD 6870, la primera es la más potente, contrariamente a lo que la numeración podría suponer.

Para la última generación de tarjetas gráficas AMD, las HD 79XX, la estructura "Graphics Core Next" es todavía diferente.

Desde la serie 5000 Radeon HD, AMD propone un modelo de arquitectura basado en el VLIW o Very Large Instruction Word. Claramente, se trata que las unidades de microprocesadores ejecuten de un solo golpe varias instrucciones simultáneamente (según la codificación), es lo que se puede calificar de comportamiento vectorial.

Con Graphics Core Next, la empresa traza una línea en esta época y propone una arquitectura que comprende una unidad vectorial + coprocesador escalar, asociado a un planificador de la ejecución de tareas.

Se trata aquí de trabajar una sola instrucción por bloque, siempre en varios elementos a la vez. Tenemos un recorte del chip donde las unidades de cálculo, llamadas también CU o Compute Unit son constituidas de bloques SIMD (cuatro por CU), cada uno puede ejecutar una instrucción en un máximo de 16 elementos.

En NVIDIA:

En NVIDIA, la lógica de numeración corresponde bien a la realidad medida; pero ciertas denominaciones son engañosas.

Por ejemplo si se compara un GT 460 768MB con una GT 460 1GB, pensamos que se trata del mismo modelo de tarjeta gráfica, simplemente con una cantidad de memoria menos importante en la versión 768MB.

Pero mirando la estructura de su GPU, encontramos otras diferencias: los 2 GPU tienen cada uno 336 procesadores de flujo y 56 unidades de textura, pero la versión 1 GB posee 32 unidades ROPs, contra 24 para la versión 768 MB y la velocidad de bus es mayor (256 bits contra 192) en la versión de 1 GB:
  • Los ROPs intervienen para los filtrados, la versión de 1 GB está más adaptada para los que juegan con A-A (Anti Aliasing).
  • El ancho de bus que interviene en la velocidad de los intercambios entre GPU y memoria, la versión de 1 GB será un poco más rápida que la versión de 768 MB.


Son de hecho las 2 características "escondidas" que hacen la diferencia de rendimiento entre las 2 tarjetas y no la diferencia de memoria, que es a fin de cuentas bastante poca.

El interés en analizar la estructura interna permite ver cómo es construido el GPU, pero no permite ver todo.

El ejemplo del mejor tratamiento del teselado sobre la serie HD 6800 no aparece en la estructura interna del GPU; del mismo modo, la capacidad de procesamiento GPGPU de las HD 5800 (ausente en las HD 6800) no aparece más, se deberá confiar en las informaciones comerciales o en los test independientes.

Comparación teórica de la tarjeta ATI/AMD y NVIDIA

Comparar los rendimientos de una tarjeta gráfica NVIDIA y de una tarjeta AMD es mucho más complicado.

Podemos tratar de comparar el número de procesadores de flujo, de unidades de textura y de ROPs, pero la arquitectura es bastante diferente de los GPU en NVIDIA y AMD, que particularmente afecta a los procesadores de flujo y obliga a entrar un poco más en detalle y caer rápidamente en un impase.

En efecto, desde los 8800 primera versión, NVIDIA propone una arquitectura que califica de SIMT es decir "Single Instruction, Multiple Threads" y que corresponde a la aplicación de una operación en varios threads (flujo de ejecución) por oposición a la arquitectura retenida por ATI que es llamado SIMD "Single Instruction, Multiple Data", donde una instrucción de varias operaciones es aplicada a un elemento.

Técnicamente, aunque se trate de arquitecturas SIMT o SIMD, los microprocesadores son dotados en todos los casos de unidades escalares. Teóricamente, el SIMT es considerado más eficaz, el programador no tiene que tener en cuenta el relleno de la unidad vectorial, lo que no es el caso del SIMD.

Aunque los microprocesadores de AMD y de NVIDIA proponen arquitecturas gráficas unificadas, la arquitectura SIMT o SIMD induce una contabilización diferente de los procesadores de flujo ya que en AMD cada procesador de flujo puede contener hasta 5 instrucciones (4 en los HD 69XX).

Una simple comparación del número de unidades no permite estimar la potencia de un microprocesador frente al otro.

Toda la dificultad consiste en saber cuántas unidades de tratamiento vectorial son utilizadas simultáneamente, porque eso va a depender de las instrucciones y de la codificación de los juegos.

Con la última arquitectura de AMD, Graphic Core Next, es también complicado, porque a pesar de una apariencia escalar del punto de vista del desarrollador, hay siempre unidades vectoriales.

Prácticamente es misión imposible comparar una tarjeta AMD y una tarjeta NVIDIA sin benchs de apoyo.

Probemos comparar según la estructura del GPU la GTX 580 y la HD 7950, que según los benchs en juegos dan rendimientos similares.

La GTX 580 está compuesto de: 4 GPC o Graphics Processing Cluster. Cada uno de estos clusters dispone a su vez de 4 SM (Streaming Multiprocessor en inglés). Cada SM contiene 32 núcleos de ejecución CUDA, lo que da un total de 512 procesadores de flujos, elementos que trabajan simultáneamente.

El análisis de la HD 7950 da: 28 CU o Compute Unit, cada uno dotado de 4 SIMD, cada uno puede trabajar en 16 elementos, lo que nos da 1 792 procesadores de flujo.

¿Cómo explicar tal diferencia en los procesadores de flujo, mientras que los resultados en juegos son similares?

A mi parecer, esto viene del hecho de que los procesadores de flujo no trabajan simultáneamente en AMD, debido a la presencia de unidades vectoriales.

Como la GTX 580 con 512 Stream Processors (SP) da resultados similares en juegos, podemos concluir provisionalmente que la HD 7950 hace trabajar simultáneamente sólo 500 a 600 SP, es decir un rendimiento de 3 a 4 veces inferior en el GPU de NVIDIA.

Conclusión

El análisis de la arquitectura del GPU permite ir más allá en la previsión de los rendimientos de las tarjetas, pero con una menor precisión que las pruebas prácticas, que son en todos los casos la referencia.

Si este método da buenos resultados en el seno de una misma marca, encuentra sus límites comparando las tarjetas gráficas de los 2 principales fabricantes.

La estructura bastante diferente de sus GPU lo hace muy difícil, incluso imposible, la comparación puramente teórica de las unidades de cálculo.

Consulta también :
El documento «Elegir una tarjeta gráfica en función de su referencia» de CCM (es.ccm.net) se encuentra disponible bajo una licencia Creative Commons. Puedes copiarlo o modificarlo siempre y cuando respetes las condiciones de dicha licencia y des crédito a CCM.