SAS(통계)
(♥ 0)
Statistical Analysis System
슬로건은 "THE POWER TO KNOW'이다.
1. 개요[편집]
DATA _NULL;
word = "Hello, World!";
call symputx('word',word);
RUN;
&put &word.;
통계분석 프로그램으로 SAS Institute.에서 출시하였다. 데이터베이스에서 통계학 수치를 산출하거나 리스트를 관리하는 등 다양한 통계학 기능을 수행할 수 있는 프로그램.
SAS는 기본적으로 SAS식 언어를 이용한 프로그래밍을 바탕으로 한다. 이는 초급자에게 불편하다는 단점으로 작용하기도 하지만, 통계분석을 자유롭게 할 수 있다는 장점을 제공해주기도 한다. SPSS에서는 한번 분석을 시행하고 옵션이나 사후분석 등을 바꿔서 다시 분석하려면 분석 명령을 마우스로 찾아가야 하지만 SAS는 이전에 프로그래밍한 프로시저에서 조건만 바꿔주고 다시 시행하면 된다. 그래도 결과창은 별개로 나오기 때문에.
데이터의 양이 매우 많을 경우에는 SPSS보다 SAS가 훨씬 효율적이며, SAS도 GUI식 인터페이스를 동시에 지원하는 방향으로 업데이트 되고있기 때문에 꼭 SPSS가 좋다고만 할 수는 없다.
라이선스가 매우 비싸다. SAS Studio, SAS Miner등의 다양한 응용 버전이 존재한다. 1년간 사용할 라이선스를 얻는데 500 - 1,400만원 정도 한다.
관련 자격증 시험으로 SAS Base Programmer, SAS Advanced Programmer등이 있다.
한국에서는 건강보험공단, 심사평가원 등에서 SAS를 사용하기에 보건학 전공자들은 무조건 쓸 줄 알아야 한다.
2. 특징[편집]
모든 줄의 끝은 ; 세미콜론으로 끝을 낸다.
프로그래밍이지만, 일반 사용자도 쉽게 접근할 수 있게, 실수를 하더라도 컴퓨터가 예측해서 고쳐줄 때가 많다.
3. 경쟁 소프트웨어[편집]
SPSS와 더불어 많이 쓰인다. R, STATA도 있으며 요즘엔 Python도 많이 쓰인다.
SPSS는 마우스를 이용한 GUI 인터페이스 위주로 되어있어서 직관적이고 진입장벽이 낮다. 이 때문에 사회과학계에서는 SAS보다는 SPSS가 더 인기있다. 실제로 대학에서도 SPSS를 더 많이 가르치고 있다.[1] [2] 하지만 SPSS는 데이터의 양이 매우 많을 경우 비효율적이고 전문적인 작업을 할 수 없기 때문에 전문가 레벨에서는 SAS가 더욱 선호되고 있다.
역사가 오래되었고, 업계에서 검증받은 패키지이지만, 더이상 대학에서 체계적인 교육을 진행하고 있지 않다. SAS의 리즈시절에는 대부분의 통계학 책이 SAS 코드를 책의 본문이나 부록에 첨부하는 경우가 많았다. 하지만 점점 SAS의 자리를 R이나 Python이 잠식해가고 있다. 즉, 기업 입장에서는 신규 유저의 유입이 줄었거나 단종 되었다는 것이 현실. 딥러닝 대항마로 내세운 SAS VIYA 의 경우에는 ...
그럼에도 불구하고, 바이오스탯 쪽은 여전히 SAS를 선호하고 있고, job requirement에도 거의 필수적인 경우가 대부분이기 때문에, 본인의 진로 방향에 따라 Python보다 SAS를 더 많이 다뤄야 할 수도 있다.
4. 관련 문서[편집]
이 문서의 내용 중 전체 또는 일부는 2024-08-03 10:15:50에 나무위키 SAS(통계) 문서에서 가져왔습니다.