NVIDIA RTX

덤프버전 : (♥ 0)

분류

파일:다른 뜻 아이콘.svg
은(는) 여기로 연결됩니다.
배틀그라운드 프로게임단에 대한 내용은 Team Quadro 문서
Team Quadro번 문단을
Team Quadro# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
참고하십시오.






GPU 목록

GeForce · GeForce Laptop · NVIDIA RTX · 데이터 센터 GPU
[ 펼치기 · 접기 ]

NVNV1
NV3RIVA 128
TwiN Texel
(Fahrenheit)
RIVA TNT
RIVA TNT2
QuadPipe
(Celcius)
GeForce 256-Quadro--
GeForce 2-Quadro 2--
nFiniteFX I, II
(Kelvin)
GeForce 3-Quadro DCC--
GeForce 4-Quadro 4Quadro 4 NVS-
CineFX 1.0, 2.0
(Rankine)
GeForce FX-Quadro FXQuadro NVS-
CineFX 3.0, 4.0
(Curie)
GeForce 6--
GeForce 7-QUADRO FX--
Unified (Shader)
(Tesla)
GeForce 8-QUADRO NVSTESLA 800
GeForce 9---
GeForce 200-QUADRO NVSTESLA 1000
GeForce 100----
GeForce 300----
FermiGeForce 400-QUADRO-TESLA 2000
GeForce 500-NVS
KeplerGeForce 600-QUADRO KTESLA K
GeForce 700GTX TITAN
GeForce 800GTX TITAN BLACK/Z
MaxwellGeForce 700---
GeForce 800----
GeForce 900GTX TITAN XQUADRO M-TESLA M
PascalGeForce 10TITAN X/XpQUADRO P-TESLA P
Volta-TITAN VQUADRO GV100-TESLA V
TuringGeForce 20TITAN RTXQUADRO RTX-TESLA T
GeForce 16----
AmpereGeForce 30-RTX A-A
Hopper----H
Ada LovelaceGeForce 40-RTX--
















1. 개요
2. Quadro 제품군
2.1. Quadro 데스크톱용 제품군
2.1.1. NV10(Celsius) 마이크로아키텍처
2.1.1.1. Quadro
2.1.1.2. Quadro 2
2.1.1.3. Quadro 4 XGL
2.1.2. NV20(Kelvin) 마이크로아키텍처
2.1.2.1. Quadro DCC
2.1.2.2. Quadro 4 XGL
2.1.3. NV30(Rankine) 마이크로아키텍처
2.1.3.1. Quadro FX (x000)
2.1.3.2. Quadro FX (x100)
2.1.3.3. Quadro FX (x300)
2.1.4. NV40(Curie) 마이크로아키텍처
2.1.4.1. Quadro FX (x000)
2.1.4.2. Quadro FX (x400)
2.1.4.3. Quadro FX (x500)
2.1.5. G80(Tesla) 마이크로아키텍처
2.1.5.1. Quadro FX (x600)
2.1.5.2. Quadro FX (x700)
2.1.5.3. Quadro FX (x800)
2.1.5.4. Quadro CX
2.1.5.5. Quadro VX
2.1.6. Fermi 마이크로아키텍처
2.1.6.1. Quadro (x000)
2.1.7. Kepler 마이크로아키텍처
2.1.7.1. Quadro K
2.1.8. Maxwell 마이크로아키텍처
2.1.8.1. Quadro M
2.1.9. Pascal 마이크로아키텍처
2.1.9.1. Quadro P
2.1.10. Volta 마이크로아키텍처
2.1.10.1. Quadro V
2.1.11. Turing 마이크로아키텍처
2.1.11.1. Quadro RTX
2.1.12. Ampere 마이크로아키텍처
2.1.12.1. RTX A
2.1.13. Ada Lovelace 마이크로아키텍처
2.1.13.1. RTX Ada
2.2. Quadro 모바일용 제품군
2.2.1. NV10(Celsius) 마이크로아키텍처
2.2.1.1. Quadro 4 Go
2.2.2. NV20(Kelvin) 마이크로아키텍처
2.2.2.1. Quadro 4 Go
2.2.3. NV30(Rankine) 마이크로아키텍처
2.2.3.1. Quadro FX Go
2.2.4. NV40(Curie) 마이크로아키텍처
2.2.4.1. Quadro FX Go
2.2.4.2. Quadro FX (x500M)
2.2.5. G80(Tesla) 마이크로아키텍처
2.2.5.1. Quadro FX (x600M)
2.2.5.2. Quadro FX (x700M)
2.2.5.3. Quadro FX (x800M)
2.2.6. Fermi 마이크로아키텍처
2.2.6.1. Quadro (x000M)
2.2.7. Kepler 마이크로아키텍처
2.2.7.1. Quadro Kx000M
2.2.7.2. Quadro Kx100M
2.2.8. Maxwell 마이크로아키텍처
2.2.8.1. Quadro Kx200M
2.2.8.2. Quadro Mx000M
2.2.8.3. Quadro Mxx00
2.2.9. Pascal 마이크로아키텍처
2.2.9.1. Quadro Pxx00
2.2.9.2. Quadro Pxx00 Max-Q
2.2.10. Turing 마이크로아키텍처
2.2.10.1. Quadro RTX
2.2.10.2. Quadro RTX Max-Q
2.2.11. Ampere 마이크로아키텍처
2.2.11.1. RTX A
3. NVS 제품군
3.1. NVS 데스크톱용 제품군
3.1.1. NV10(Celsius) 마이크로아키텍처
3.1.2. NV30(Rankine) 마이크로아키텍처
3.1.3. NV40(Curie) 마이크로아키텍처
3.1.4. G80(Tesla) 마이크로아키텍처
3.1.5. Fermi 마이크로아키텍처
3.1.6. Kepler 마이크로아키텍처
3.1.7. Maxwell 마이크로아키텍처
3.2. NVS 모바일용 제품군
3.2.1. NV40(Curie) 마이크로아키텍처
3.2.2. G80(Tesla) 마이크로아키텍처
3.2.3. Fermi 마이크로아키텍처
4. 데이터 센터 GPU 제품군 (구 Tesla)
4.1. G80(Tesla) 마이크로아키텍처
4.2. Fermi 마이크로아키텍처
4.3. Kepler 마이크로아키텍처
4.4. Maxwell 마이크로아키텍처
4.5. Pascal 마이크로아키텍처
4.6. Volta 마이크로아키텍처
4.7. Turing 마이크로아키텍처
4.8. Ampere 마이크로아키텍처
5. GRID 제품군
5.1. Kepler 마이크로아키텍처
5.1.1. GRID K1
5.1.2. GRID K2
5.1.3. GRID K3
5.1.4. GRID K5
5.2. Maxwell 마이크로아키텍처
5.2.1. GRID M
6. Mining 제품군
6.1. Pascal 마이크로아키텍처
7. 관련 문서



1. 개요[편집]


NVIDIA워크스테이션용 GPU 목록. 용도별로 그래픽 정밀 렌더링용인 Quadro, 비즈니스 멀티 모니터 출력용인 NVS, 고성능 컴퓨팅용인 Tesla, 가상 작업 공간용인 GRID, 암호화폐 채굴용인 Mining 제품군이 있다.


2. Quadro 제품군[편집]


1999년 지포스와 비슷한 시기에 탄생했다. 지포스와 다르게 일반 사용자가 아닌 전문가를 대상으로 정밀 렌더링 작업용으로 내놓은 제품이다. 하지만, GPU 칩셋 자체는 지포스와 같다. 같은 칩셋을 쓰고 있음에도 불구하고 단일이 아닌 두 제품군으로 내놓는 것은 하드웨어 자원은 한정되어 있으므로 용도별 드라이버 소프트웨어로 자원 분배를 차등해야 하기 때문이다. 게이밍용인 지포스는 빠른 프레임률을 추구하는 방향으로, 쿼드로는 프레임률이 다소 느려도 정확한 렌더링을 추구하는 방향으로 차등해 놓았다. 전문가용 시장 공략에 대성공한데다가 근본적인 알맹이가 똑같은 게이밍용 지포스보다 전문가용이라는 이유로 훨씬 비싸게 판매해서 더 많은 이득을 보고 있다. 쿼드로와 같은 워크스테이션 GPU를 사용하는 주 목적인 레거시 OpenGL을 사용하는 프로그램들이 점차 없어지면서 3D 작업을 위해 쿼드로를 사용하는 의미가 점차 퇴색되고 있다. 최근에는 ECC/REG 같은 오류 보정 기능이 있는 서버용 메모리와 소비자용 그래픽카드에서 보이는 NVENC 제한[1]이 없고 vGPU등을 지원해 차등화하는 편이다. 지포스 시리즈는 오류 보정 기능이 없는 일반 메모리를 탑재했다. 이는 AMD의 Radeon Instinct 제품군도 마찬가지로 라데온 시리즈와의 차별화를 두고 있다.

다만, 현업자들은 아무리 쿼드로의 특장점이 과거보다 퇴색됐다 하더라도, 일반 지포스 제품과 엄연한 차이가 있다고 말한다. 또한, 여전히 더 비싼 값을 주더라도 동세대 일반 지포스보다 스펙상 성능이 떨어지는 쿼드로를 선택하고 있다. 그 가장 대표적인 이유는 쿼드로로 작업할 때는 작업 시간과 관계 없이 성능이 일정하게 유지되는데, 일반 지포스는 짧은 작업시간 내에서도 성능 널뛰기가 심하다는 것이다. 특히, 무압축 고해상도 2D 작업같은 경우엔 방대한 규모의 VRAM이 필요하기에 쿼드로 제품군을 선택할 수밖에 없다. 또한, 랩탑을 많이 활용하는 기술영업 직군에서도 쿼드로의 인기는 여전한데, 고객사에게 뭔가를 보여줄 때 버벅거리는 모습을 절대 보여줘서는 안 되기 때문이다.

"쿼드로는 지포스랑 별개의 독자적인 것"으로 생각하거나 심지어 "쿼드로는 게임성능이 구리다" 라는 선입견이 상당히 널리 퍼져있는데, 물론 같은 가격대 카드끼리 비교하면 구린게 맞다 사실 기본구조는 지포스나 쿼드로나 거의 같다. 지포스에 쓰던 칩 가져와서 몇몇 기능 해제시켜주고, VRAM 늘리고, 가격 뻥튀기한게 쿼드로다. 그래서 동일 칩을 쓰는 쿼드로와 지포스는 실제로 게임성능이 거의 동일하다. 지포스와 동급의 쿼드로를 찾는법은 간단한데 쿠다코어 갯수로 비교해보면 된다. 예를 들어 하나 찾아보자면 Quadro RTX 8000(쿠다 4608개)은 TU102 풀칩이 들어갔는데 이 칩은 TITAN RTX(쿠다 4608개)에 들어가는 TU102 풀칩과 완전 동일하기 때문에 게임에서만큼은 QUADRO RTX 8000 =< TITAN RTX 라고 볼 수 있다.[2] 따라서 설마 그런 돈지랄을 할사람이 있는지는 모르겠지만 쿼드로로 게임을 해도 게임 하는데에는 전혀 지장이 없다.

2002년부터는 지포스와 마찬가지로 쿼드로에도 랩톱 제품군이 투입되었지만, 랩톱이라는 작고 얇은 제약된 공간 특성상 데스크톱용보다 사양을 낮췄고, 그런 점에서는 랩톱용 지포스와 비슷하다. 모바일 워크스테이션에 탑재하는 쿼드로는 외장 그래픽으로 내놓은 쿼드로 제품군 대부분을 탑재하고 있다. 하지만 전문가용이라 웬만한 게이밍 랩톱보다 훨씬 비싸다. 이에 관한 자세한 내용은 모바일 워크스테이션 문서 참조.

2020년 10월 암페어 아키텍처 기반의 RTX A6000과 A40이 출시되었는데 쿼드로 브랜드가 사라진 채 발표되었다. 이미 사라진 테슬라와 균형을 맞추기 위한 것인지는 확실히 밝혀지지 않았지만, 일단 엔비디아 홈페이지에서는 신형 쿼드로로 소개하고 있다. 다만 제품 명칭에서는 확실하게 사라졌다. 테슬라야 그렇다 쳐도 쿼드로는 지포스와 같이 20년을 이어져 온 브랜드인데 왜 갑자기 사라졌는지가 의문이다.


2.1. Quadro 데스크톱용 제품군[편집]



2.1.1. NV10(Celsius) 마이크로아키텍처[편집]



2.1.1.1. Quadro[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PP:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
QuadroNV10
(220㎚)
(111㎟)
4:4:4135128SDR16632??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.1.2. Quadro 2[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PP:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 2 ProNV15
(180㎚)
(90㎟)
4:4:4200128DDR250
(500)
64??
Quadro 2 MXRNV11
(180㎚)
(65㎟)
2:4:4SDR18332??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.1.3. Quadro 4 XGL[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PP:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 550 XGLNV17
(150㎚)
(65㎟)
2:4:4270128DDR200
(400)
64??
Quadro 4 500 XGL250SDR166128??
Quadro 4 580 XGLNV18
(150㎚)
(65㎟)
300DDR200
(400)
64??
Quadro 4 380 XGL275256
(512)
128??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.2. NV20(Kelvin) 마이크로아키텍처[편집]



2.1.2.1. Quadro DCC[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro DCCNV20
(150㎚)
(128㎟)
4:1:4:4200128SDR23064??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.2.2. Quadro 4 XGL[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 900 XGLNV25
(150㎚)
(142㎟)
4:2:8:8300128DDR325
(650)
128??
Quadro 4 750 XGL275225
(450)
??
Quadro 4 700 XGL64??
Quadro 4 980 XGLNV28
(150㎚)
(101㎟)
300325
(650)
128??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.3. NV30(Rankine) 마이크로아키텍처[편집]



2.1.3.1. Quadro FX (x000)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 1000NV30
(130㎚)
(200㎟)
4:2:8:4300128GDDR2300
(600)
128??
Quadro FX 2000400400
(800)
??
Quadro FX 3000NV35
(130㎚)
(207㎟)
4:3:8:8256DDR425
(850)
256??
Quadro FX 7004:1:4:4275128275
(550)
128??
Quadro FX 600
[3]
NV34
(150㎚)
(91㎟)
4:2:4:4270240
(480)
??
Quadro FX 5004:1:4:4??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.3.2. Quadro FX (x100)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 1100NV36
(130㎚)
(125㎟)
4:3:4:4425128GDDR2325
(650)
256??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.3.3. Quadro FX (x300)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 1300NV38
(130㎚)
(207㎟)
8:3:8:8350128DDR275
(550)
128??
Quadro FX 330NV35
(130㎚)
(207㎟)
4:2:4:225064GDDR2200
(400)
64??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.4. NV40(Curie) 마이크로아키텍처[편집]



2.1.4.1. Quadro FX (x000)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 4000NV40
(130㎚)
(287㎟)
12:5:12:8375256GDDR3500
(1000)
256??
Quadro FX 4000 SDINV41
(130㎚)
(225㎟)
12:5:12:12425??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.4.2. Quadro FX (x400)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 4400NV40
(AGP)
(130㎚)
(287㎟)
12:5:12:12375256GDDR3525
(1050)
256??
Quadro FX 3450NV41
(PCIe)
(130㎚)
(225㎟)
425500
(1000)
??
Quadro FX 3400NV45
(PCIe)
(130㎚)
(287㎟)
350450
(900)
??
Quadro FX 1400NV41
(PCIe)
(130㎚)
(225㎟)
12:5:12:8128DDR300
(600)
128??
Quadro FX 540NV43
(PCIe)
(110㎚)
(150㎟)
8:4:8:8300GDDR3250
(500)
??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.4.3. Quadro FX (x500)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 4500G70
NV47
(110㎚)
(333㎟)
24:8:24:16430256GDDR3525
(1050)
512??
Quadro FX 5500G71
NV49
(90㎚)
(196㎟)
650505
(1010)
1024??
Quadro FX 4500 X224:8:24:16
x2
375256
x2
605
(1210)
512
x2
??
Quadro FX 350020:7:20:16450256660
(1320)
256??
Quadro FX 1500325625
(1250)
??
Quadro FX 560G73
NV4B
(90㎚)
(125㎟)
12:5:12:8350128600
(1200)
128??
Quadro FX 550NV43
(110㎚)
(150㎟)
8:4:8:8360400
(800)
??
Quadro FX 350G72
NV4A
(90㎚)
(81㎟)
4:3:4:255064DDR2405
(810)
??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.5. G80(Tesla) 마이크로아키텍처[편집]



2.1.5.1. Quadro FX (x600)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 5600G80
(90㎚)
(484㎟)
128:32:24
(8, 16)
600
(코어)
1350
(셰이더)
384GDDR3800
(1600)
15361712999
FX 460096:24:24
(6, 12)
500
(코어)
1200
(셰이더)
700
(1400)
7681341999
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.5.2. Quadro FX (x700)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 3700G92
(65㎚)
(324㎟)
112:56:16
(7, 14)
500
(코어)
1250
(셰이더)
256GDDR3800
(1600)
512781599
FX 4700 X2128:64:16
(8 x2, 16 x2)
x2
600
(코어)
1500
(셰이더)
256
x2
1024
x2
2262999
FX 1700G84
(80㎚)
(169㎟)
32:16:8
(2, 4)
460
(코어)
920
(셰이더)
256DDR2400
(800)
51242699
FX 57016:8:8
(1, 2)
12825638199
FX 37016:8:4
(1, 2)
360
(코어)
720
(셰이더)
64500
(1000)
35129
FX 370 LPG98
(65㎚)
(86㎟)
8:8:4
(1, 1)
540
(코어)
1080
(셰이더)
25
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.5.3. Quadro FX (x800)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 5800G200B
(55㎚)
(470㎟)
240:80:32
(10, 30)
500
(코어)
1250
(셰이더)
256GDDR3800
(1600)
512781599
FX 4800192:64:24
(8, 24)
602
(코어)
1204
(셰이더)
38415361501799
FX 3800192:64:16
(8, 24)
2561024108799
FX 1800G94
(65㎚)
(240㎟)
64:32:12
(4, 8)
550
(코어)
1375
(셰이더)
19276859489
FX 580G96C
(55㎚)
(121㎟)
32:16:8
(2, 4)
450
(코어)
1125
(셰이더)
12851240199
FX 380G96
(65㎚)
(144㎟)
16:8:8
(1, 2)
450
(코어)
1100
(셰이더)
700
(1400)
25634129
FX 380 LPGT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
650
(코어)
1375
(셰이더)
64800
(1600)
51228169
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.5.4. Quadro CX[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
CXG200B
(55㎚)
(470㎟)
192:64:24
(8, 24)
602
(코어)
1204
(셰이더)
384GDDR3800
(1600)
15361501999
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.5.5. Quadro VX[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
VX 200G92
(65㎚)
(324㎟)
112:56:16
(7, 14)
450
(코어)
1125
(셰이더)
256GDDR3800
(1600)
51275?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.6. Fermi 마이크로아키텍처[편집]



2.1.6.1. Quadro (x000)[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
7000GF110
(40㎚)
(520㎟)
512:64:48
(4, 16)
651
(코어)
1301
(셰이더)
768384GDDR5924
(3696)
620414499
6000GF100
(40㎚)
(529㎟)
448:56:48
(4, 14)
574
(코어)
1147
(셰이더)
747
(2988)
4399
5000352:44:40
(3, 11)
513
(코어)
1026
(셰이더)
640320750
(3000)
2.51522499
4000256:32:32
(2, 8)
475
(코어)
950
(셰이더)
512256702
(2808)
21421199
2000GF106
(40㎚)
(238㎟)
192:32:16
(1, 4)
625
(코어)
1250
(셰이더)
256128650
(2600)
162599
600GF108
(40㎚)
(116㎟)
96:16:8
(1, 2)
640
(코어)
1280
(셰이더)
DDR3800
(1600)
40179
400GT216
(40㎚)
(100㎟)
48:16:8
(2, 6)
450
(코어)
1125
(셰이더)
-64770
(1540)
0.532169
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]


이 모델까지 듀얼 DVI를 지원하기 때문에 일반적인 사무실에서 2D 작업용으로 쓰기에 괜찮다. 쿼드로 K시리즈만 가도 dp 포트가 달리기 때문이다.
쿼드로 2000은 크기도 작고 6pin 보조전원을 필요로 하지 않아 사무실 컴퓨터에서 쓰기에도 용이하다.

2.1.7. Kepler 마이크로아키텍처[편집]



2.1.7.1. Quadro K[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX/SMM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K6000GK110
(28㎚)
(561㎟)
2880:240:48
(5, 15)
797
(기본)
902
(부스트)
1536384GDDR51502
(6008)
122255265
K52002304:192:48
(4, 12)
667
(기본)
771
(부스트)
10242568150?
K5000GK104
(28㎚)
(294㎟)
1536:128:32
(4, 8)
706
(기본)
5121350
(5400)
41222499
K42001344:112:32
(4, 7)
771
(기본)
784
(부스트)
108?
K4000GK106
(28㎚)
(221㎟)
768:64:24
(2, 4)
810
(기본)
3841921404
(5616)
3801269
K2200GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1046
(기본)
1124
(부스트)
20481281253
(5012)
468?
K2000GK107
(28㎚)
(118㎟)
384:32:16
(1, 2)
954
(기본)
2561000
(4000)
251599
K1200GM107
(28㎚)
(148㎟)
512:32:16
(1, 4)
1058
(기본)
1124
(부스트)
20481250
(5000)
445?
K620384:16:16
(1, 3)
1058
(기본)
1124
(부스트)
DDR3900
(1800)
241?
K600GK107
(28㎚)
(118㎟)
192:16:16
(1, 1)
876
(기본)
256891
(1792)
141199
K420?
K410192:16:8
(1, 1)
706
(기본)
128640.538149
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GK110 칩셋 한정 → (단정밀도 연산 속도) ÷ 3 = (배정밀도 연산 속도) [GFLOPS]
GK104, GK106, GK107 칩셋 한정 → (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
GM107 칩셋 한정 → (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.8. Maxwell 마이크로아키텍처[편집]



2.1.8.1. Quadro M[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX/SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
M6000GM200
(28㎚)
(601㎟)
3072:192:96
(6, 24)
988
(기본)
1114
(부스트)
3384GDDR51653
(6612)
12
24
2504999
M5000GM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
861
(기본)
1038
(부스트)
22568150?
M40001664:104:64
(4, 13)
773120?
M3000 SE1024:64:32
(2, 8)
5401253
(5012)
475?
M2000GM206
(28㎚)
(228㎟)
768:48:32
(2, 6)
872
(기본)
1180
(부스트)
11281653
(6612)
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.9. Pascal 마이크로아키텍처[편집]



2.1.9.1. Quadro P[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
GP100GP100
(16㎚)
(610㎟)
3584:224:96
(6, 56)
1380
(기본)
1441
(부스트)
44096HBM2900
(1800)
162356999
P6000GP102
(16㎚)
(471㎟)
3840:240:96
(6, 30)
1417
(기본)
1531
(부스트)
3384GDDR5X1127
(9016)
242504999
P5000GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1607
(기본)
1733
(부스트)
2256161802499
P40001792:112:64
(4, 14)
1202
(기본)
1480
(부스트)
GDDR51901
(7604)
8105815
P2000GP106
(16㎚)
(200㎟)
1024:64:40
(2, 8)
1076
(기본)
1480
(부스트)
1.251601752
(7008)
575?
P1000GP107
(16㎚)
(132㎟)
640:40:32
(1, 5)
1266
(기본)
1480
(부스트)
11281253
(5012)
447?
P620384:24:16
(1, 3)
1354
(기본)
1455
(부스트)
1003
(4012)
240?
P6001329
(기본)
1557
(부스트)
0.564?
P400256:16:16
(1, 2)
1228
(기본)
1328
(부스트)
30?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.10. Volta 마이크로아키텍처[편집]



2.1.10.1. Quadro V[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
GV100GV100
(12㎚)
(815㎟)
5120:640:320:128
(6, 80)
1132
(기본)
1628
(부스트)
84096HBM2850
(1700)
322508999
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.11. Turing 마이크로아키텍처[편집]



2.1.11.1. Quadro RTX[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX 8000TU102
(12㎚)
(754㎟)
4608:576:288:72:96
(6, 72)
1005
(기본)
1200
(부스트)
6384GDDR61750
(14000)
482509999
RTX 60001440
(기본)
1770
(부스트)
246299
RTX 5000TU104
(12㎚)
(545㎟)
3072:384:192:48:64
(6, 48)
1620
(기본)
1815
(부스트)
4256162002299
RTX 40002304:288:144:36:64
(5, 36)
1215
(기본)
1710
(부스트)
1625
(13000)
8160899
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]



같은 세대의 GeForce 20이 그렇듯 USB-C 단자를 지원한다.

2.1.12. Ampere 마이크로아키텍처[편집]



2.1.12.1. RTX A[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX A6000GA102
(8㎚)
(628㎟)
10752:336:336:84:112
(7, 84)
1410
(기본)
1800
(부스트)
6384GDDR62000
(16000)
48300????
RTX A550010240:320:320:80:96
(7, 80)
1170
(기본)
1695
(부스트)
24230????
RTX A50008192:256:256:64:96
(6, 64)
1170
(기본)
1695
(부스트)
24????
RTX A4500GA104
(8㎚)
(393㎟)
7168:224:224:56:96
(6, 56)
1050
(기본)
1650
(부스트)
43201750
(14000)
20200????
RTX A40006144:192:192:48:96
(6, 48)
745
(기본)
1560
(부스트)
25616140????
RTX A2000GA106
(8㎚)
(276㎟)
3328:104:104:26:48
(3, 26)
562
(기본)
1200
(부스트)
2.251921500
(12000)
6
12
70???
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.1.13. Ada Lovelace 마이크로아키텍처[편집]



2.1.13.1. RTX Ada[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX 6000 AdaAD102
(4㎚)
(609㎟)
18176:568:568:142:192
(12, 142)
915
(기본)
2505
(부스트)
96384GDDR62500
(20000)
483006799
RTX 5000 Ada12800:400:400:100:???
(12, ???)
1170
(기본)
2500
(부스트)
??256????
(18000)
322503999
RTX 4500 AdaAD104
(4㎚)
(295㎟)
7680:240:240:60:??
(5, ??)
???
(기본)
2600
(부스트)
??19224210????
RTX 4000 Ada[4]6144:192:192:48:80
(5, 48)
???
(기본)
2200
(부스트)
4816020130????
RTX 4000 Ada SFF[5]720
(기본)
1560
(부스트)
1750
(16000)
701249
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]



2.2. Quadro 모바일용 제품군[편집]



2.2.1. NV10(Celsius) 마이크로아키텍처[편집]



2.2.1.1. Quadro 4 Go[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
PP:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 500 Go GLNV17
(150㎚)
(65㎟)
2:4:2220128SDR22064?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.2. NV20(Kelvin) 마이크로아키텍처[편집]



2.2.2.1. Quadro 4 Go[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 700 Go GLNV28
(150㎚)
(101㎟)
4:2:4:4176128SDR20064?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.3. NV30(Rankine) 마이크로아키텍처[편집]



2.2.3.1. Quadro FX Go[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX Go 1000NV36
(130㎚)
(125㎟)
4:3:4:4295128DDR285
(570)
128?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.4. NV40(Curie) 마이크로아키텍처[편집]



2.2.4.1. Quadro FX Go[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX Go 1400NV41
(130㎚)
(225㎟)
8:5:8:8275256DDR295
(590)
256?
Quadro FX Go 540NV43
(110㎚)
(150㎟)
8:4:8:8300128225
(450)
12825
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.4.2. Quadro FX (x500M)[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 3500MG71
NV49
(90㎚)
(196㎟)
24:8:24:16575256GDDR3600
(1200)
51245
Quadro FX 2500M500
Quadro FX 1500M20:7:24:16375500
(1000)
Quadro FX 550MG73
NV4B
(90㎚)
(125㎟)
12:5:12:848012835
Quadro FX 350MG72
NV4A
(90㎚)
(81㎟)
4:3:4:2450450
(900)
25615
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.5. G80(Tesla) 마이크로아키텍처[편집]



2.2.5.1. Quadro FX (x600M)[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 3600MG92
(65㎚)
(324㎟)
96:48:16
(6, 12)
500
(코어)
1250
(셰이더)
256GDDR3800
(1600)
51270
FX 2600M64:32:16
(4, 8)
799
(1598)
FX 1600MG84
(80㎚)
(169㎟)
32:16:8
(2, 4)
625
(코어)
1250
(셰이더)
128800
(1600)
50
FX 360MG86
(80㎚)
(127㎟)
16:8:4
(1, 2)
400
(코어)
800
(셰이더)
64DDR2600
(1200)
25617
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.5.2. Quadro FX (x700M)[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 3700MG92
(65㎚)
(324㎟)
128:64:16
(8, 16)
550
(코어)
1375
(셰이더)
256GDDR3800
(1600)
102475
FX 2700MG94
(65㎚)
(240㎟)
48:24:16
(3, 6)
530
(코어)
1325
(셰이더)
799
(1598)
51265
FX 1700MG96
(65㎚)
(144㎟)
32:16:8
(2, 4)
625
(코어)
1550
(셰이더)
128800
(1600)
50
FX 770M500
(코어)
1250
(셰이더)
35
FX 570MG84
(80㎚)
(169㎟)
475
(코어)
950
(셰이더)
700
(1400)
45
FX 370MG98
(65㎚)
(86㎟)
8:4:4
(1, 1)
550
(코어)
1400
(셰이더)
64600
(1200)
25620
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.5.3. Quadro FX (x800M)[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 3800MG92
(65㎚)
(324㎟)
128:64:16
(8, 16)
675
(코어)
1650
(셰이더)
256GDDR31000
(2000)
1024100
FX 2800M96:48:16
(6, 12)
600
(코어)
1500
(셰이더)
75
FX 1800MGT215
(40㎚)
(144㎟)
72:24:8
(3, 9)
561
(코어)
1125
(셰이더)
128GDDR5550
(2200)
45
FX 880MGT216
(40㎚)
(100㎟)
48:16:8
(2, 6)
500
(코어)
1250
(셰이더)
GDDR3790
(1580)
35
FX 380MGT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
550
(코어)
1400
(셰이더)
6451225
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.6. Fermi 마이크로아키텍처[편집]



2.2.6.1. Quadro (x000M)[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
5010MGF110
(40㎚)
(520㎟)
384:48:32
(3, 12)
450
(코어)
900
(셰이더)
512256GDDR5650
(2600)
4100
5000MGF100
(40㎚)
(529㎟)
320:40:32
(3, 10)
405
(코어)
810
(셰이더)
600
(2400)
1.75
4000MGF104
(40㎚)
(332㎟)
336:56:32
(2, 7)
475
(코어)
950
(셰이더)
625
(2500)
2
3000M240:40:32
(2, 5)
450
(코어)
900
(셰이더)
75
2000MGF106
(40㎚)
(238㎟)
192:32:16
(1, 4)
550
(코어)
1100
(셰이더)
256128DDR3900
(1800)
55
1000MGF108
(40㎚)
(116㎟)
96:16:4
(1, 2)
700
(코어)
1400
(셰이더)
45
500M135
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF104, GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.7. Kepler 마이크로아키텍처[편집]



2.2.7.1. Quadro Kx000M[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K5000MGK104
(28㎚)
(294㎟)
1344:112:32
(4, 7)
601
(기본)
512256GDDR5750
(3000)
4100
K4000M960:80:32
(3, 5)
700
(2800)
K3000M576:48:32
(2, 3)
654
(기본)
275
K2000MGK107
(28㎚)
(118㎟)
384:32:16
(1, 2)
745
(기본)
256128DDR3900
(1800)
55
K1000M192:16:16
(1, 1)
850
(기본)
45
K500M192:16:8
(1, 1)
12864800
(1600)
135
K200M
K100M
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.7.2. Quadro Kx100M[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K5100MGK104
(28㎚)
(294㎟)
1536:128:32
(4, 8)
771
(기본)
512256GDDR5900
(3600)
8100
K4100M1152:96:32
(3, 6)
706
(기본)
800
(3200)
4
K3100M768:64:32
(2, 4)
75
K2100MGK106
(28㎚)
(221㎟)
576:48:16
(2, 3)
667
(기본)
256128752
(3016)
255
K1100MGK107
(28㎚)
(118㎟)
384:32:16
(1, 2)
706
(기본)
700
(2800)
45
K610MGK208
(28㎚)
(87㎟)
192:16:8
(1, 1)
980
(기본)
12864650
(2600)
130
K510M846
(기본)
600
(2400)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.8. Maxwell 마이크로아키텍처[편집]



2.2.8.1. Quadro Kx200M[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K2200MGM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
667
(기본)
2128GDDR51253
(5012)
265
K620MGM108
(28㎚)
(81㎟)
384:24:8
(1, 3)
1029
(기본)
164DDR3900
(1800)
30
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.8.2. Quadro Mx000M[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
M5000MGM204
(28㎚)
(398㎟)
1536:96:64
(3, 12)
975
(기본)
2256GDDR51253
(5012)
8100
M4000M1280:80:64
(3, 10)
4
M3000M1024:64:32
(2, 8)
1050
(기본)
112875
M2000MGM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1029
(기본)
1098
(부스트)
255
M1000M512:32:16
(1, 4)
993
(기본)
240
M600M384:24:8
(1, 3)
1029
(기본)
1124
(부스트)
30
M500MGM108
(28㎚)
(81㎟)
164DDR3900
(1800)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.8.3. Quadro Mxx00[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
M5500GM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
861
(기본)
1038
(부스트)
2256GDDR51753
(7012)
8150
M2200GM206
(28㎚)
(228㎟)
1024:64:32
(2, 8)
1025
(기본)
11281375
(5500)
455
M1200GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1093
(기본)
21281253
(5012)
45
M620512:32:16
(1, 4)
756
(기본)
977
(부스트)
230
M520GM108
(28㎚)
(81㎟)
384:24:8
(1, 3)
1041
(기본)
16425
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.9. Pascal 마이크로아키텍처[편집]



2.2.9.1. Quadro Pxx00[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
P5200GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1556
(기본)
1746
(부스트)
2256GDDR51800
(7200)
16100
P50002048:128:64
(4, 16)
1278
(기본)
1582
(부스트)
1502
(6008)
P42002304:144:64
(4, 18)
1227
(기본)
1647
(부스트)
8
P40001792:112:64
(3, 14)
1227
(기본)
P32001328
(기본)
1476
(부스트)
1.51921753
(7012)
675
P30001280:80:48
(2, 10)
1088
(기본)
1215
(부스트)
P2000GP107
(16㎚)
(132㎟)
768:48:32
(1, 6)
1557
(기본)
1607
(부스트)
11281502
(6008)
450
P1000512:32:16
(1, 4)
1303
(기본)
1493
(부스트)
40
P600384:24:16
(1, 3)
1430
(기본)
1557
(부스트)
1253
(5012)
25
P500GP108
(16㎚)
(74㎟)
256:16:16
(1, 2)
1228
(기본)
1455
(부스트)
0.564218
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.9.2. Quadro Pxx00 Max-Q[편집]


모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
P5200 Max-QGP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1316
(기본)
1569
(부스트)
2256GDDR51804
(7216)
16100
P4000 Max-Q1792:112:64
(4, 14)
1114
(기본)
1228
(부스트)
1502
(6008)
8
P3200 Max-Q1139
(기본)
1404
(부스트)
1.51921753
(7012)
675
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.10. Turing 마이크로아키텍처[편집]



2.2.10.1. Quadro RTX[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX 5000TU104
(12㎚)
(545㎟)
3072:384:192:48:64
(6, 48)

(기본)

(부스트)
4256GDDR61750
(14000)
16110
RTX 40002560:320:160:40:64
(5, 40)
1110
(기본)
1560
(부스트)
8
RTX 3000TU106
(12㎚)
(445㎟)
2304:288:144:36:48
(5, 36)
945
(기본)
1380
(부스트)
660~80
RTX T2000TU117
(12㎚)
(200㎟)
1024:0:64:0:32
(2, 0)
1575
(기본)
1785
(부스트)
1128GDDR52000
(8000)
460
RTX T1000896:0:56:0:32
(2, 0)
1395
(기본)
1455
(부스트)
40~50
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]



2.2.10.2. Quadro RTX Max-Q[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX 5000 Max-QTU104
(12㎚)
(545㎟)
3072:384:192:48:64
(6, 48)
600
(기본)
1350
(부스트)
4256GDDR61750
(14000)
1680
RTX 4000 Max-Q2560:320:160:40:64
(5, 40)
1005
(기본)
1200
(부스트)
1625
(13000)
8
RTX 3000 Max-QTU106
(12㎚)
(445㎟)
2304:288:144:36:48
(5, 36)
600
(기본)
1215
(부스트)
660
RTX T2000 Max-QTU117
(12㎚)
(200㎟)
1024:0:64:0:32
(2, 0)

(기본)

(부스트)
1128GDDR52000
(8000)
440
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.11. Ampere 마이크로아키텍처[편집]



2.2.11.1. RTX A[편집]


모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX A5500GA103
(8㎚)
(496㎟)
7424:232:232:58:96
(6, 58)
????
(기본)
????
(부스트)
4256GDDR62000
(16000)
1680~165????
RTX A4500GA104
(8㎚)
(393㎟)
5888:184:184:46:96
(6, 46)
????
(기본)
????
(부스트)
1680~140????
RTX A30004096:128:128:32:80
(5, 32)
???
(기본)
????
(부스트)
1921750
(14000)
1260~130????
RTX A2000GA107
(8㎚)
(???㎟)
2560:80:80:20:32
(2, 20)
???
(기본)
????
(부스트)
1.5835~95???
RTX A10002048:64:64:16:32
(2, 16)
???
(기본)
????
(부스트)
128435~95???
RTX A5002048:64:64:16:32
(2, 16)
???
(기본)
????
(부스트)
64420~60???
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]



3. NVS 제품군[편집]


2003년부터 등장한 비즈니스 멀티 모니터 출력용 제품군으로, 본래 쿼드로에서 파생된 녀석이라 2009년까지는 제품명이 NVS 앞에 쿼드로가 붙여 있었다가 2010년 이후에 출시된 제품부터 쿼드로를 뺀 것이 현재의 모습이다. 멀티 모니터용으로써는 과거엔 매트록스가 꽉 잡고 있었기 때문에 지포스에서는 좀처럼 볼 수 없는 하위 GPU를 2개 붙인 형태의 제품을 통해 멀티 모니터 지원을 꾀하기도 했지만 현재까지도 인지도는 낮은 편. 2015년 11월에 발매한 맥스웰 아키텍처 기반의 NVS 810이 최신 NVS 제품으로 이 제품이 나와서야 멀티 모니터 출력용 그래픽 카드에 걸맞는 스펙을 갖추었다. 최대 8개의 디스플레이 출력을 지원하는데 80만원을 호가할 만큼 만만한 제품이 아니다. 이보다 하위 제품은 최대 4개로 4개의 출력은 지포스 제품군에서도 흔하게 볼 수 있어서 4개 이하의 모니터 출력만큼은 효용성이 많이 줄어든 상태. 가격 대비 더 많은 모니터 출력 지원이라면 NVIDIA보단 차라리 AMD 라데온을 알아보는게 더 나을 정도.

쿼드로와 마찬가지로 NVS도 랩톱용 제품군이 존재한다. 그런데 저렴한 중고 워크스테이션 랩톱을 구한답시고 알아본 그래픽의 스펙이 NVS가 붙은 경우가 제법 많이 보이는데 광고 카탈로그에도 NVS 계열 모델에 대한 제원이 자세하지 않은 경우가 많아서 뭔가 좋아보이는 네이밍으로 착각해 낭패볼 수 있으니 주의할 것. NVS는 지금까지 NVS 510M(G71 칩셋 즉 지포스 Go 7900 GTX)을 제외하면 메인스트림 이상의 체급인 칩셋이 사용된 적이 별로 없고 로우엔드 칩셋이 주로 사용되는 명색이 멀티 모니터 출력용인 모델이다. 그래픽 정밀 렌더링용 중고 워크스테이션 랩톱을 알아보고 있는데 뭐가 뭔지 잘 모르겠다면 너무 저렴해 보이는 워크스테이션 랩톱은 일단 거르는 것이 좋은데 쿼드로가 아닌 NVS가 탑재된 제품일 확률이 높다.

NVS에 대한 정보는 해당 공식 홈페이지에서도 확인할 수 있다.[6][7]


3.1. NVS 데스크톱용 제품군[편집]



3.1.1. NV10(Celsius) 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PP:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 100 NVSNV17
(150㎚)
(65㎟)
2:4:2250128DDR166
(332)
64??
Quadro 4 200 NVS250
(500)
??
Quadro 4 400 NVS PCI220166
(332)
??
Quadro NVS 280 PCINV18
(150㎚)
(65㎟)
275250
(500)
??
Quadro NVS 280 SD25064200
(400)
??
Quadro NVS 55 PCI??
Quadro NVS 50 PCI??
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3.1.2. NV30(Rankine) 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 280 AGPNV34
(150㎚)
(91㎟)
4:1:4:4275128DDR250
(500)
64??
Quadro NVS 280 PCIeNV37
(150㎚)
(91㎟)
13?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3.1.3. NV40(Curie) 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 440NV43
(110㎚)
(150㎟)
8:4:8:8
x2
275128
x2
DDR250
(500)
128
x2
31?
Quadro NVS 285NV44
(150㎚)
(91㎟)
4:3:4:212812818?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3.1.4. G80(Tesla) 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 290G86
(80㎚)
(127㎟)
16:8:4
(1, 2)
459
(코어)
918
(셰이더)
64DDR2400
(800)
25621149
Quadro NVS 295G98
(65㎚)
(86㎟)
8:8:4
(1, 1)
540
(코어)
1300
(셰이더)
GDDR3695
(1390)
23?
Quadro NVS 4208:8:4
x2
(1 x2, 1 x2)
550
(코어)
1400
(셰이더)
64
x2
700
(1400)
256
x2
40?
Quadro NVS 450480
(코어)
1200
(셰이더)
35?
NVS 300GT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
520
(코어)
1230
(셰이더)
64790
(1380)
51218109
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3.1.5. Fermi 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
NVS 310GF119
(40㎚)
(79㎟)
48:8:4
(1, 1)
523
(코어)
1046
(셰이더)
12864DDR3875
(1750)
0.520159
NVS 315119
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3.1.6. Kepler 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
NVS 510GK107
(28㎚)
(118㎟)
192:16:16
(1, 1)
797
(기본)
256128DDR3891
(1782)
235449
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3.1.7. Maxwell 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
NVS 810GM107
(28㎚)
(148㎟)
512:32:16
x2
(1 x2, 4 x2)
902
(기본)
1033
(부스트)
0.5
x2
64
x2
DDR3900
(1800)
2
x2
68?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3.2. NVS 모바일용 제품군[편집]



3.2.1. NV40(Curie) 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 510MG71
NV49
(90㎚)
(196㎟)
24:8:24:16450128GDDR3600
(1200)
25635
Quadro NVS 300MG73
NV4B
(90㎚)
(125㎟)
4:3:4:2500700
(1400)
16
Quadro NVS 120MG72
NV4A
(90㎚)
(81㎟)
45064DDR251210
Quadro NVS 110M300DDR300
(600)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3.2.2. G80(Tesla) 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 320MG84
(80㎚)
(169㎟)
32:16:8
(1, 2)
575
(코어)
1150
(셰이더)
128GDDR3700
(1400)
51220
Quadro NVS 160MG98
(65㎚)
(86㎟)
8:8:4
(1, 1)
580
(코어)
1450
(셰이더)
6425612
Quadro NVS 150M530
(코어)
1300
(셰이더)
10
Quadro NVS 140MG86
(80㎚)
(127㎟)
16:8:4
(1, 2)
400
(코어)
800
(셰이더)
64DDR2600
(1200)
51212
Quadro NVS 135M594
(1188)
25610
Quadro NVS 130M8:4:4
(1, 1)
DDR700
(1400)
NVS 5100MGT216
(40㎚)
(100㎟)
48:16:8
(2, 6)
550
(코어)
1210
(셰이더)
128GDDR3800
(1600)
102435
NVS 3100MGT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
606
(코어)
1468
(셰이더)
64790
(1580)
51214
NVS 2100M535
(코어)
1230
(셰이더)
11
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3.2.3. Fermi 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
NVS 5400MGF108
(40㎚)
(116㎟)
96:16:4
(1, 2)
660
(코어)
1320
(셰이더)
256128DDR3900
(1800)
2 [8]35
NVS 5200M672
(코어)
1344
(셰이더)
12864GDDR5785
(3140)
125
GF117
(28㎚)
(116㎟)
DDR3900
(1800)
NVS 4200MGF119
(40㎚)
(79㎟)
48:8:4
(1, 1)
810
(코어)
1620
(셰이더)
800
(1600)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




4. 데이터 센터 GPU 제품군 (구 Tesla)[편집]


파일:다른 뜻 아이콘.svg
은(는) 여기로 연결됩니다.
Tesla 마이크로아키텍처에 대한 내용은 NVIDIA/GPU 문서
3.8번 문단을
NVIDIA/GPU# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
참고하십시오.




2020년 5월까지 사용되던 상표는 Tesla

2007년 5월부터 내놓은 상표로, GPU가 게임용 연산에만 사용되는 것이 아닌 범용 연산(GPGPU)용으로 확대되면서 고성능 연산 작업을 목적으로 하는 곳을 공략하기 위한 제품군이다. Tesla도 알맹이는 지포스와 같지만 대체로 디스플레이 출력 단자가 없는데다 연산에 주로 사용되기 때문에 GPU 내부에 있는 텍스처 유닛과 ROP이 쓸 일은 없다. 게임 그래픽과는 거리가 먼 분야에 사용되기 때문. 물론 페르미 아키텍처 기반의 일부 제품 한정으로 DVI 단자 1개가 탑재되기도 했지만 케플러 아키텍처부터는 디스플레이 단자가 다시 빠지면서 지금까지 이어져오고 있다. 명색이 전문가를 넘어선 데이터 센터를 주로 공략하는 시장인만큼 가격도 매우 비싼 편인데 지포스와 같은 GPU라 훨씬 저렴한 지포스로 연산 작업을 하면 되지 않겠냐고 반문할 수도 있지만, 쿼드로와 마찬가지로 Tesla용 드라이버가 따로 있고 단일 GPU인 제품은 주로 하위 라인에나 해당되는 제품이지 최상위로 올라가면 GPU가 2개는 물론이고 4개를 한 기판에 탑재된 쿼드 GPU 타입 제품도 있다. GPU를 복수로 붙이면서 전력 소모량, 발열, 부피를 감안해서라도 당대 최고의 고성능 연산을 구현하는 것을 추구하는 방향이기 때문이다. 테슬라는 탑재 대상 컴퓨터들이 최소 워크스테이션에서 최대로는 슈퍼 컴퓨터와 데이터 센터급이며 소비 전력이 엄청 나기 때문에 모바일 제품군이 없다.

2020년 5월에 브랜드가 폐지되었는데. 모 자동차 회사와의 혼동 때문이라는게 공식적인 설명이다. 엔비디아 역시 자율주행 자동차 사업에 진출해 있고 여기에 사용되는 연산용 GPGPU의 명칭이 가장 큰 경쟁사의 명칭과 겹친다는게 좀 아니라고 생각했는듯. 이후 출시된 RTX A100부터는 데이터 센터 GPU라는 명칭으로 불리고 있다.(그리고2020년 10월 5일 테슬라의 뒤를 잇는 데이터센터 용 그래픽카드인 A40이 공개되었다)

특이하게 최근 나오는 데이터센터 GPU 제품군에는 쿨러가 없이 방열판과 제품 덮개만 딱 있는데, 이는 절대로 칩의 온도가 낮아서 그런게 아니다. 데이터센터 gpu는 열이 심한 vram을 덕지덕지 붙이고 나오기 때문에 일반 게이밍용 gpu보다 온도가 높으면 높았지 절대 낮지 않다. 얘네들이 쿨러가 없는 이유는 바로 패시브 쿨링 이라는 방법을 쓰기 때문이다. 우리가 일반적으로 보는 팬이 기본 장착되어 있는 그래픽카드는 "액티브 쿨링"이라고 하는데 데이터센터 GPU 제품군은 서버 컴퓨터를 사용하는 고객들이 자기네들만의 독자적인 쿨링 시스템을 자유롭게 구성할수 있도록 일부러 팬을 달지 않고 방열판만 달고 나오는 것이다.

4.1. G80(Tesla) 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
S870G80
(90㎚)
(484㎟)
128:32:24
x4
(8 x4, 16 x4)
600
(코어)
1350
(셰이더)
384
x4
GDDR3800
(1600)
1536
x4
80011999
D870128:32:24
x2
(8 x2, 16 x2)
384
x2
1536
x2
5207499
C870128:32:24
(8, 16)
38415361711499
S1075G200B
(55㎚)
(470㎟)
240:80:32
x4
(10 x4, 30 x4)
610
(코어)
1296
(셰이더)
512
x4
4096
x4
800?
S10707999
C1060240:80:32
(10, 30)
5124096188?
M106020481699
T104096?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
G200B 칩셋 한정 → (단정밀도 연산 속도) ÷ 8 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




4.2. Fermi 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
S2050GF100
(40㎚)
(529㎟)
448:56:48
x4
(4 x4, 14 x4)
574
(코어)
1147
(셰이더)
768
x4
384
x4
GDDR5773
(3092)
3
x4
90011999
M2050448:56:48
(4, 14)
575
(코어)
1150
(셰이더)
76838432252699
M2070574
(코어)
1150
(셰이더)
783
(3132)
62253099
M2070-Q5489
C2050575
(코어)
1150
(셰이더)
750
(3000)
3238?
C20706?
X2090GF110
(40㎚)
(520㎟)
512:64:48
(4, 16)
650
(코어)
1300
(셰이더)
925
(3700)
225?
X2070?
M2090250?
C2090?
M2075448:56:48
(4, 14)
574
(코어)
1147
(셰이더)
783
(3132)
2252399
C2075575
(코어)
1150
(셰이더)
750
(3000)
247?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




4.3. Kepler 마이크로아키텍처[편집]



모델명GPU그래픽 메모리최대 연산 성능TDP지원
API
칩셋명CUDA 코어클럭버스규격클럭용량단정밀도
(FP32)
(GFLOPS)
배정밀도
(FP64)
(GFLOPS)
K102×GK1042×1536745MHz2×256bitGDDR52500MHz
(5000MT/s)
2×4GB4577190.7225WCUDA 3.0
K20GK1102496706MHz320bit2600MHz
(5200MT/s)
5GB35241175CUDA 3.5
K20XGK1102688732MHz384bit2600MHz
(5200MT/s)
6GB39351312235W
K40GK110B2880745MHz
(기본)
875MHz
(부스트)
384bit2500MHz
(5000MT/s)
12GB50401680
K802×GK2102×2496560MHz
(기본)
875MHz
(부스트)
2×384bit2750MHz
(5500MT/s)
2×12GB87362912300WCUDA 3.7



4.4. Maxwell 마이크로아키텍처[편집]



모델명GPU그래픽 메모리단정밀도(FP32)
최대 연산 성능
(GFLOPS)
TDP지원
API
칩셋명CUDA 코어클럭버스규격클럭용량
M4GM2061024872MHz
(기본)
1072MHz
(부스트)
128bitGDDR52750MHz
(5500MT/s)
4GB219550~75WCUDA 5.2
M6GM2041536722MHz
(기본)
1051MHz
(부스트)
256bit2300MHz
(4600MT/s)
8GB322975~100W
M104×GM1074×5121033MHz4×128bit2099MHz
(5188MT/s)
4×8GB5289225W
M40GM2003072948MHz
(기본)
1114MHz
(부스트)
384bit3000MHz
(6000MT/s)
12GB6844250W
M602×GM2042×2048899MHz
(기본)
1178MHz
(부스트)
2×256bit2500MHz
(5000MT/s)
2×8GB9650225~300W



4.5. Pascal 마이크로아키텍처[편집]


P100은 GP100 컷칩이면서 HBM2 규격을 채택한 모델로 FP64 연산이 5.3 TFLOPS다. P40과 P4는 각각 GP102 풀칩과 GP104 풀칩을 기반으로 개발된 모델이다.

모델명GPU그래픽 메모리최대 연산 성능TDP지원
API
칩셋명CUDA 코어클럭버스규격클럭용량바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(GFLOPS)
단정밀도
(FP32)
(GFLOPS)
배정밀도
(FP64)
(GFLOPS)
P4GP1042560810MHz
(기본)
1063MHz
(부스트)
256bitGDDR51500MHz
(6000MT/s)
8GB2242.55443170.150~75WCUDA 6.1
P40GP10238401303MHz
(기본)
1531MHz
(부스트)
384bit1800MHz
(7200MT/s)
24GB4791.911758367.4250W
P100
(PCIe)
GP10035841126MHz
(기본)
1303MHz
(부스트)
3072bitHBM2703MHz
(1406MT/s)
12GB-1868093404670250WCUDA 6.0
4096bit16GBCUDA 6.0
P100
(NVLink)
1380MHz
(기본)
1480MHz
(부스트)
21218106095340300WCUDA 6.0



4.6. Volta 마이크로아키텍처[편집]


일부 잘못된 내용이 있을 수 있으니 주의할 것.

모델명GPU그래픽 메모리최대 연산 성능TDP지원
API
칩셋명CUDA 코어클럭버스규격클럭용량단정밀도
(FP32)
(TFLOPS)
배정밀도
(FP64)
(TFLOPS)
V100
(PCIe)
GV10051201245MHz
(기본)
1380MHz
(부스트)
4096bitHBM2877MHz
(1754MT/s)
16GB147250W?
V100
(NVlink)
?MHz
(기본)
1533MHz
(부스트)
32GB15.77.8300W?
V100S
(PCIe)
?MHz
(기본)
1600MHz
(부스트)
1107MHz
(2214MT/s)
32GB16.48.2300W?



4.7. Turing 마이크로아키텍처[편집]



모델명GPU그래픽 메모리최대 연산 성능TDP지원
API
칩셋명CUDA 코어클럭버스규격클럭용량4비트
정수형
(INT4)
(TOPS)
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(TFLOPS)
단정밀도
(FP32)
(TFLOPS)
T4TU1042560585 MHz
(기본)
1590 MHz
(부스트)
256 bitGDDR61250 MHz
(10000 MT/s)
16GB260.504130.25265.1268.14170 W?



4.8. Ampere 마이크로아키텍처[편집]


* A10
* A16
* A40

모델명GPU그래픽 메모리최대 연산 성능TDP지원
API
칩셋명CUDA 코어클럭버스규격클럭용량4비트
정수형
(INT4)
(TOPS)
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(TFLOPS)
단정밀도
(FP32)
(TFLOPS)
A16GA??? x4???? x4?? bitGDDR6?16GB x4????250W?
A10GA??? x4???? x4?? bitGDDR6?24GB????150W?


5. GRID 제품군[편집]



5.1. Kepler 마이크로아키텍처[편집]



5.1.1. GRID K1[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K1GK107
(28㎚)
(118㎟)
192:16:16
x4
(1 x4, 1 x4)
850
(기본)
256
x4
128
x4
DDR3891
(1782)
4
x4
1304140
K180Q192:16:16
(1, 1)
2561281125
K160Q
K140Q
K120Q0.5
K1000.2563
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




5.1.2. GRID K2[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K2GK104
(28㎚)
(294㎟)
1536:128:32
x2
(4 x2, 8 x2)
745
(기본)
512
x2
256
x2
GDDR51250
(5000)
4
x2
2255199
K280Q1536:128:32
(4, 8)
51225641875
K260Q2937
K240Q1469
K220Q0.5
K2000.25235
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




5.1.3. GRID K3[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K340GK107
(28㎚)
(118㎟)
384:32:8
x4
(1 x4, 2 x4)
950
(기본)
128
x4
64
x4
GDDR5900
(3600)
1
x4
2253299
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




5.1.4. GRID K5[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K560QGK104
(28㎚)
(294㎟)
1536:128:32
x2
(4 x2, 8 x2)
745
(기본)
512
x2
256
x2
GDDR51250
(5000)
4
x2
2253599
K540Q
K520Q
K520
K500
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




5.2. Maxwell 마이크로아키텍처[편집]



5.2.1. GRID M[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
M60-8QGM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
930
(기본)
1180
(부스트)
2256GDDR51253
(5012)
82253599
M60-4A4?
M60-2Q2?
M60-1Q1?
M6-8Q1536:96:64
(3, 12)
722
(기본)
8100?
M10-8QGM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1033
(기본)
1306
(부스트)
1281300
(5200)
225?
M3-30202??
M40384:32:16
(1, 3)
930
(기본)
1000
(부스트)
1350
(5400)
450?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




6. Mining 제품군[편집]


이름에서 보듯 채굴기이다. 그래서 모니터 연결용 단자가 없다. Linus Tech Tips는 중국에서 이걸 사와서 이걸로 게임을 돌리는 데 성공했다..


6.1. Pascal 마이크로아키텍처[편집]



모델명GPU그래픽 메모리TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
P102-101GP102
(16㎚)
(471㎟)
3200:200:80
(5, 25)
1557
(기본)
1670
(부스트)
2.5320GDDR52002
(8008)
10250?
P102-1001481
(기본)
1582
(부스트)
GDDR5X1251
(10008)
5?
P104-101GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1607
(기본)
1733
(부스트)
22568??
P104-1001920:120:64
(3, 15)
4??
P106-100GP106
(16㎚)
(200㎟)
1280:80:48
(2, 10)
1506
(기본)
1709
(부스트)
1.5192GDDR52002
(8008)
6120?
P106-090768:48:48
(2, 6)
1354
(기본)
1531
(부스트)
375?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




7. 관련 문서[편집]



파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 2023-10-26 19:17:14에 나무위키 NVIDIA RTX 문서에서 가져왔습니다.


[1] 소비자용 카드는 동시에 3개를 초과하는 영상 트랜스코딩이 불가능하다.[2] <이 아니라 =<이라고 한 이유는, 쿼드로 RTX 8000은 냉각에 불리한 블로워팬이라 일반 플라워형 팬을 장착한 TITAN RTX에 비해 온도가 높아서 클럭이 상대적으로 딸린다. 그래서 게임 프레임률이 TITAN RTX보다 소폭 낮게 나오는 것을 감안한 것이다.[3] PCI 슬롯형 모델.[4] 싱글슬롯, non-LP[5] 더블슬롯, LP[6] 직접 4200M을 사용해본 결과, 게임은 마인크래프트 하옵이 일부 경우 40을 넘지 못하지만, 경우에 따라 1440P 유튜브 영상은 네트워크가 좋다는 전제 하에 재생 가능. avi 같은 파일로 1440P 영상은 당연하게 재생이 가능하다. 전체적 시스템은 i5-2520M+8GB 랩톱용 DDR3 메모리 싱글채널+HM65 칩셋+Windows 7+SanDisk 256G SSD이며 유튜브는 버전 54 베타 채널이다.[7] 모바일용으로는 페르미 기반(GF108, GF117) 칩셋 모델까지만 나왔다.[8] 다만 제조사에 따라 1기가만 장착하는 경우도 있다.