2026-03-30
자소서 바이트 수 기준, 왜 확인해야 할까?
자기소개서를 다 쓰고 채용 시스템에 붙여넣었는데 갑자기 "글자수 초과"라는 안내가 뜬 경험이 있다면, 바이트 수 기준 때문일 가능성이 있습니다.
유니코드 글자수와 바이트 수의 차이
우리가 흔히 세는 '글자수'는 유니코드 기준으로, 한글이든 영문이든 한 글자를 하나로 셉니다. 하지만 일부 채용 시스템, 특히 오래전에 구축된 사내 시스템은 EUC-KR이라는 옛 인코딩 방식을 기준으로 글자수 제한을 검사합니다. EUC-KR에서는 한글 한 글자가 2바이트로 처리되기 때문에, 같은 700자라도 실제로 시스템에 입력했을 때는 바이트 수 기준으로 훨씬 더 많은 용량을 차지하게 됩니다.
예를 들어 한글 700자로만 이루어진 문장은 EUC-KR 기준으로 약 1,400바이트에 해당합니다. 만약 시스템이 "700바이트 이내"로 제한하고 있다면, 실제로 입력할 수 있는 한글은 약 350자 정도밖에 되지 않는 셈입니다.
바이트 수 초과를 예방하는 법
지원하는 기업의 채용 시스템이 오래된 형태이거나, 제한 안내에 '바이트'라는 단어가 포함되어 있다면 바이트 수 기준일 가능성이 높습니다. 이런 경우 유니코드 글자수만 확인하고 안심했다가 실제 제출 단계에서 당황할 수 있으니, 미리 바이트 수까지 확인해두는 것이 안전합니다.
실제 숫자로 비교해보면
순수 한글 텍스트를 기준으로 글자수와 바이트 수를 비교하면 다음과 같습니다.
| 글자수 | UTF-8 바이트 | EUC-KR 바이트 |
|---|---|---|
| 100자 | 300바이트 | 200바이트 |
| 300자 | 900바이트 | 600바이트 |
| 500자 | 1,500바이트 | 1,000바이트 |
| 700자 | 2,100바이트 | 1,400바이트 |
한글 한 글자는 UTF-8에서 3바이트, EUC-KR에서 2바이트를 차지합니다. 그래서 같은 글자수라도 어떤 인코딩을 기준으로 검사하느냐에 따라 실제로 차지하는 바이트 수가 1.5배가량 차이 납니다.
영문·숫자·공백이 섞이면 어떻게 달라질까
영문 알파벳과 숫자, 공백은 UTF-8과 EUC-KR 모두에서 1바이트로 처리됩니다. 즉 한글과 영문이 섞인 자소서는 순수 한글로만 쓸 때보다 바이트 수가 적게 나옵니다. 다만 자소서 특성상 대부분 한글로 채워지는 경우가 많아 이 차이로 여유를 크게 벌기는 어렵고, 참고 수준으로만 알아두면 됩니다.
글자수 세기 툴에서 바이트 수도 함께 확인하기
글자수 세기 툴은 EUC-KR 기준 근사 바이트 수와 UTF-8 바이트 수를 함께 제공합니다. 지원하는 시스템이 어떤 인코딩을 사용하는지 정확히 알 수 없는 경우에도, 두 값을 미리 확인해두면 시스템 차이로 인한 제출 실패를 예방할 수 있습니다.