이곳은 개발을 위한 베타 사이트 입니다.기여내역은 언제든 초기화될 수 있으며, 예기치 못한 오류가 발생할 수 있습니다.문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 CAPTCHA (문단 편집) == 효과 == || {{{#!wiki style="margin:-5px -10px" [[파일:캡챠수원.jpg|width=100%]]}}} || || [[매교역|한국 사진이 등장]]한 [[디스코드]]의 reCAPTCHA. || 단순해 보이지만 특성상 프로그램이나 인공지능이 뚫기가 매우 어렵다. 정교한 CAPTCHA는 [[알파고|바둑을 인공지능으로 풀어내는 것]] 이상으로 어렵다고 봐야 한다.~~[[튜링 테스트]]~~ 이는 이미지 인식, 음성 인식 같은 분야들의 공통점이다. [[OCR]]만 해도 이 정도로 발전하기까지 20년 이상의 세월이 걸렸다. 특히 [[스팸메일]] 방지를 위해 많이 쓰인다. 스팸 소프트웨어의 자동 계정 등록을 막기 위해 계정을 등록할 때 거치는 테스트로 이미지 단어를 보여준 뒤 그 단어를 쓰는 것으로 사용자의 명령을 수행하는 프로세스로 진행. 물론 소프트웨어가 진화하다 보면 그냥 숫자나 글자는 인식해 버리기도 하는지라,[* 실제로 최근 프로그램들은 글자를 인식해서 쓰며 게임들을 이런 실시간 온스크린 번역 프로그램으로 한국어로 플레이하는 것이 그 예.] 가끔 단어를 시각적으로 변형시킨 복잡한 패턴을 사용하기 때문에 심하면 사람이 봐도 이게 글자인지 뭔지 모를 단어를 보여주고 입력하라고 하는 경우가 있다. 이런 경우를 대비해서 친절하게 해결책이 마련되어 있는데, 단어를 새로고침하거나 단어를 직접 --외계어--음성으로 들려주어 입력하게 하는 옵션을 이용하면 된다.[* 음성 기능은 원래 [[시각장애인]]에 대한 배려 차원에서 들어간 것이다. 음성 인식을 방지하기 위해 보통 배경에 소음을 깔아 놓고 들려준다.] --하지만 저시력자들이 음성 지원이 되지 않는 것을 만난다면... 특히 [[거짓말 탐지기(메이플스토리)|거짓말 탐지기]]-- 일반적인 CAPTCHA 패턴은 사람은 쉽게 알아볼 수 있지만 스팸 소프트웨어나 봇은 자동으로 인식할 수 없다. 결과적으로는 자동 계정 생성이나 메일 자동 발송 등을 어렵게 하여 스팸을 차단하는 효과를 보게 되는 것. 사실 이런 게 가능한 이유는 CAPTCHA에 들어가는 연산의 대부분이 일단 실행된 뒤에는 되돌릴 수 없는 '''비가역적 연산'''이기 때문이다. 그럴 만도 한 게, 대부분이 글자를 비틀거나 회전시키는 등 역연산이 존재하지 않는 방법으로 글자를 왜곡한다.[* 의심된다면 포토샵에서 아무 필터나 이용해보자. 대부분은 한번 이미지가 일그러지면 실행을 취소하지 않는 한 절대로 완벽히 되돌릴 수 없다.] 같은 이유로 [[JPEG]]로 저장된 이미지를 완벽하게 복원하는 것도 불가능하다. 하지만, 이미 문자 기반의 CAPTCHA 중 일부는 연구자들에 의해 [[http://www.phrack.org/issues.html?issue=68&id=4#article|뚫린]] 상태. 이를 보완하기 위해 문자 대신 이미지를 변형시키는 형태도 연구되고 있다. 특히 이미지 기반의 CAPTCHA는 이미지 특성상 특정 문화에 익숙해져 있지 않으면 맞히기 어렵게 하는 경우(예: [[태극기]], [[무궁화]] 등)도 있어 해외 스패머들을 막을 수 있지만 이미지를 이용하기 때문에 데이터베이스의 크기가 커질 수 있다는 단점을 지니고 있다. 사실, 대부분의 CAPTCHA들이 과학자 커뮤니티에 나와 있는 상용 프로그램을 사용하면 10-20%의 확률로 뚫린다. 10-20%면 낮아 보이지만, [[브루트 포스|컴퓨터의 특성상 수도 없이 대입해 볼 수 있기 때문에]] 모든 CAPTCHA는 결국에는 뚫린다고 말할 수 있다. 하지만 해커들이 이런 컴퓨터 비전 소프트웨어를 쓰면서까지 CAPTCHA를 뚫으려고 하지는 않는데, 인터넷 상에는 CAPTCHA 안 뚫어도 쉽게 가입할 수 있는 대체 웹사이트나 서비스가 많기 때문. CAPTCHA의 단점은 기본적으로 웹 접근성을 약화시킨다는 점이다. 특성상 이미지를 보고 텍스트를 입력해야 하기 때문에, 이미지를 볼 수 없는 시각장애인은 CAPTCHA를 통과할 수 없다는 문제점이 있다. 시각장애인을 위한 텍스트 리더 프로그램은 이미지로 된 CAPTCHA를 읽지 못하기 때문이다. 이 때문에 요즘 CAPTCHA에는 음성으로 읽어주는 오디오 기능이 들어가 있다. 이 오디오 기능을 이용해서 프로그램으로 CAPTCHA를 뚫는 경우도 있다. 음성의 경우 정도의 차이는 있지만 명확하게 나오기 때문이다. 시각장애인이 아니더라도 눈이 조금 안 좋은 사람도 통과하기 매우 힘든 CAPTCHA들도 있는 데다가 거의 로마자 알파벳이기 때문에 알파벳 모양에 익숙하지 않은 사람들, 노인들에게는 헬이 펼쳐진다. 알파벳이 어디가 어때서 하는 사람들에게는, 일본어 사이트에서 캡차를 히라가나로 입력하게 해 놓은 것을 직접 풀어보면 된다. 이건 뭐 비슷한 그림 찾기가 된다. 시각과 청각이 모두 안 좋거나 스피커가 없는 환경일 경우도 문제. 설정에 따라서는 대소문자나 띄어쓰기 혹은 점 하나만 틀려도 까칠하게 오답 처리할 수도 있고, 한 두 글자 정도는 틀려도 그냥 넘어가도록 설정할 수도 있다. CAPTCHA를 설치했는데도 우르르 스팸 게시물이 등록되는 경우가 종종 있는데, 이건 CAPTCHA의 결함이라기보다는 게시판이나 서버에 보안 구멍이 있는 경우가 많다. 보안 구멍을 이용해서 CAPTCHA를 우회하는 것. 만약 CAPTCHA가 설치되어 있는데도 스팸 게시물이 많이 등록된다면 CAPTCHA만 맹신하지 말고 게시판이나 서버에 다른 경로로 게시물이 등록되는 것이 가능한지도 점검해 봐야 한다. 흔히 외국 사이트에서 볼 수 있는 구글 [[reCAPTCHA]]의 경우 신호등, 자동차, 횡단보도 등등의 이미지를 클릭하라고 하는데 분명히 존재함에도 불구하고 안 되는 경우라던가, 어중간하게 걸쳐있는 목표 때문에 체크를 해야 한다와 안 해야 한다는 의견차로 수십 번을 해야 하는 경우도 있다. 가장 욕 나오는 케이스는 사진 화질이 구린 것. 음영 등의 문제로 이게 맞는지 아닌지 확신하기가 어렵다. [[나무위키]]에서도 --도로 표지판 성애자-- 이것이 남발되는 경우가 있다. 심하면 5번, 게시글 작성 시에는 20번도 넘게 해야 하는 경우도 있다. 캡차를 뚫기 위해 인건비가 저렴한 국가에서 '''캡차 입력 알바'''나 전문업체를 고용하여 캡차를 푸는 업자들이 등장하기도 했다. 보통 이런 알바들은 한화로 환산하면 시급 몇백 원 ~ 천원 남짓의 박봉으로 일하지만, 일단 별다른 교육 없이 글만 읽을 줄 알면 할 수 있는 일인데다, 경제 사정이 좋지 않은 [[개발도상국]]에서는 시급 1천원 정도면 나쁜 조건이 아닌 경우도 있기 때문에... 심지어 AI를 동원하여 푸는 경우도 있다고 한다.저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기