📊 텍스트 분석 도구
암호 해독 및 언어학을 위한 전문 텍스트 통계, 빈도 분석 및 가독성 점수
반복되는 시퀀스 (3자 이상)
텍스트 빈도 분석은 시저 암호, 비즈네르 암호 및 기타 고전적인 암호화 방법과 같은 치환 암호를 해독하는 데 특히 중요합니다. 문자 빈도 패턴을 분석하고 알려진 언어 통계와 비교함으로써 암호 분석가는 평문 문자를 식별하고 암호화된 메시지를 해독할 수 있습니다. 또한 언어학, 자연어 처리 및 콘텐츠 분석에도 사용됩니다.
가독성 점수는 텍스트를 이해하기 얼마나 쉬운지를 측정합니다. 플레시 읽기 용이성 점수는 0-100 범위이며, 점수가 높을수록 더 쉬운 텍스트를 나타냅니다. 플레시-킨케이드 학년 수준은 텍스트를 이해하는 데 필요한 미국 학교 학년을 나타냅니다. 이러한 점수는 문장 길이, 단어 길이 및 음절 수와 같은 요소를 분석하여 복잡성을 결정합니다.
영어 텍스트에서 가장 빈번한 문자는 E (12.7%), T (9.1%), A (8.2%), O (7.5%), I (7.0%), N (6.7%), S (6.3%), H (6.1%), R (6.0%)입니다. 가장 드문 문자는 Q, J, X, Z입니다. 이 빈도 분포는 빈도 분석을 통해 치환 암호를 해독하는 데 중요합니다.
암호문에서 반복되는 패턴은 종종 원본 평문에서 반복되는 단어 나 구문을 나타냅니다. 예를 들어, 비즈네르 암호에서 동일한 시퀀스가 일정한 간격으로 여러 번 나타나는 것을 발견하면 반복 간의 거리가 키 길이를 나타낼 수 있습니다. 패턴 분석은 다중 문자 및 전치 암호의 암호 분석에 기본입니다.
예, 이 텍스트 분석 도구는 라틴 알파벳을 사용하는 모든 언어에서 작동합니다. 그러나 가독성 점수는 영어 텍스트에 맞춰져 있습니다. 다른 언어의 정확한 암호 분석을 위해서는 해당 특정 언어(예: 프랑스어, 스페인어, 독일어)의 알려진 빈도 분포와 문자 빈도를 비교해야 합니다.
문자 수에는 문자, 숫자, 구두점, 공백 및 특수 기호를 포함한 모든 문자가 포함됩니다. 글자 수에는 알파벳 문자(A-Z, a-z)만 포함됩니다. 대부분의 고전 암호는 문자만 암호화하고 다른 문자는 변경하지 않으므로 암호 분석에서는 글자 수가 더 중요합니다.