PTX(ISA)
덤프버전 : (♥ 1)
분류
1. 개요[편집]
PTX는 NVIDIA 병렬 스레드 실행 가상머신의 명령어 집합 아키텍처이다.
2. 역사[편집]
2.1. PTX 8.0 (Hopper)[편집]
-
wgmma
명령어 추가
2.2. PTX 6.0 (Volta)[편집]
-
wmma
명령어 추가 -
barrier
} 명령어 추가 -
neg
명령어의.f16
및.f16x2
자료형 지원 -
fns
명령어 추가 -
bar.warp.sync
} 명령어 추가 -
match.sync
} 명령어 추가 -
brx.idx
} 명령어 추가
2.3. PTX 5.0 (Pascal)[편집]
-
dp4a
,dp2a
명령어 추가 (4-way/2-way dot product with accumulation) - 특수 레지스터
%clock_hi
지원
2.4. PTX 3.0 (Kepler)[편집]
-
mad.cc
,madc
명령어 추가 - 성능 모니터 카운터 특수 레지스터
%pm4..%pm7
추가
2.5. PTX 2.0 (Fermi)[편집]
- 단정밀도 명령어가 subnormal number를 지원
- 1.x와의 호환성을 위해
.ftz
수식어를 지원- 단정밀도
add
,sub
,mul
이.rm
및.rp
rounding 수식어를 지원 - 단정밀도 fused multiply-add (FMA) 명령어
fma.f32
추가
- 기존
mad.f32
명령어는 호환성을 위해 유지- 단정밀도 및 배정밀도
div
,rcp
,sqrt
명령어에 IEEE 754 대응 rounding 추가 -
testp
및copysign
명령어 추가
3. 자료형[편집]
4. 명령어 목록[편집]
5. 기타[편집]
6. 관련 문서[편집]
이 문서의 내용 중 전체 또는 일부는 2024-05-11 04:48:51에 나무위키 PTX(ISA) 문서에서 가져왔습니다.