NVIDIA RTX Logic aumenta el área de TPC en un 22% en comparación con Turing sin RTX

La percepción pública sobre la nueva serie de tarjetas gráficas RTX de NVIDIA a veces se vio empañada por la impresión de una asignación de recursos incorrecta de NVIDIA. Se argumentó que NVIDIA había aumentado considerablemente el área de chips al agregar la funcionalidad RTX (en sus dos núcleos Tensor y RT) que podría haberse utilizado mejor para aumentar el rendimiento en las cargas de trabajo basadas en sombreado y sin trazado de rayos. Si bien los méritos del trazado de rayos en sí (en términos de aceptación de los desarrolladores) son ciertamente dignos de discusión, parece que NVIDIA no dedicó mucho más espacio a su funcionalidad RTX, al menos no al tono de la percepción pública. .

Después de analizar imágenes completas y de alta resolución de los chips TU106 y TU116 de NVIDIA, el usuario reddit @Qesa hizo un análisis de la estructura TPC de los chips Turing de NVIDIA, y llegó a la conclusión de que la diferencia entre el TU106 con capacidad RTX de NVIDIA en comparación con su RTX el TU116 eliminado equivale a solo 1.95 mm² de lógica adicional por TPC, un aumento del área del 22%. De estos, 1,25 mm² se reservan para la lógica del tensor (que acelera tanto el DLSS como la eliminación de ruido en las cargas de trabajo de trazado de rayos), mientras que solo se utilizan 0,7 mm² para los núcleos de RT.

De acuerdo con las matemáticas, esto significa que un chip TU102 utilizado para el RTX 2080 Ti, que en su configuración completa tiene un área de 754 mm², podría haberlo hecho con un chip de 684 mm². Parece que la mayor parte del aumento del área en comparación con la arquitectura de Pascal en realidad se debe a un mayor rendimiento (y tamaño) de los cachés y conjuntos de instrucciones más grandes en Turing que en la funcionalidad RTX. Sin tener en cuenta la densidad de área obtenida de la transición de 16 nm a 12 nm, un chip TU106 que alimenta un RTX 2060 ofrece aproximadamente el mismo rendimiento que el chip GP104 que alimenta al GTX 1080 ( 410 mm² en el TU106 frente a 314 mm² en el GP104 ), mientras llevando solo el 75% del conteo de SM (1920 versus 2560 SM).