이곳은 개발을 위한 베타 사이트 입니다.
기여내역은 언제든 초기화될 수 있으며, 예기치 못한 오류가 발생할 수 있습니다.

PTX(ISA)

덤프버전 :



1. 개요
2. 역사
2.1. PTX 8.0 (Hopper)
2.2. PTX 6.0 (Volta)
2.3. PTX 5.0 (Pascal)
2.4. PTX 3.0 (Kepler)
2.5. PTX 2.0 (Fermi)
3. 자료형
4. 명령어 목록
5. 기타
6. 관련 문서


1. 개요[편집]


PTX는 NVIDIA 병렬 스레드 실행 가상머신의 명령어 집합 아키텍처이다.


2. 역사[편집]


PTX ISA 버전CUDA 연산 능력CUDA 버전해당 GPU 칩셋
1.0CUDA 1.0G80
1.1CUDA 1.1
1.2CUDA 2.0
1.3CUDA 2.1
1.4CUDA 2.2
2.0CUDA 3.0GF110
2.3CUDA 4.0
3.0CUDA 4.1GK104
4.05.0CUDA 6.0
5.06.0CUDA 8.0
6.07.0CUDA 9.0


2.1. PTX 8.0 (Hopper)[편집]


  • wgmma 명령어 추가


2.2. PTX 6.0 (Volta)[편집]


  • wmma 명령어 추가
  • barrier} 명령어 추가
  • neg 명령어의 .f16.f16x2 자료형 지원
  • fns 명령어 추가
  • bar.warp.sync} 명령어 추가
  • match.sync} 명령어 추가
  • brx.idx} 명령어 추가


2.3. PTX 5.0 (Pascal)[편집]


  • dp4a, dp2a 명령어 추가 (4-way/2-way dot product with accumulation)
  • 특수 레지스터 %clock_hi 지원


2.4. PTX 3.0 (Kepler)[편집]


  • mad.cc, madc 명령어 추가
  • 성능 모니터 카운터 특수 레지스터 %pm4..%pm7 추가


2.5. PTX 2.0 (Fermi)[편집]


  • 단정밀도 명령어가 subnormal number를 지원
- 1.x와의 호환성을 위해 .ftz 수식어를 지원
  • 단정밀도 add, sub, mul.rm.rp rounding 수식어를 지원
  • 단정밀도 fused multiply-add (FMA) 명령어 fma.f32 추가
- 기존 mad.f32 명령어는 호환성을 위해 유지
  • 단정밀도 및 배정밀도 div, rcp, sqrt 명령어에 IEEE 754 대응 rounding 추가
  • testpcopysign 명령어 추가


3. 자료형[편집]


기본 형식형식 지정자
부호 있는 정수.s8, .s16, .s32, .s64
부호 없는 정수.u8, .u16, .u32, .u64
부동소수점.f16, .f32, .f64
비트 (자료형 없음).b8, .b16, .b32, .b64
Predicate.pred


4. 명령어 목록[편집]




5. 기타[편집]




6. 관련 문서[편집]


파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 2024-05-11 04:48:51에 나무위키 PTX(ISA) 문서에서 가져왔습니다.