📊 テキスト分析ツール
暗号解読と言語学のための専門的なテキスト統計、頻度分析、および可読性スコアリング
繰り返しシーケンス(3文字以上)
テキスト頻度分析は、シーザー暗号、ヴィジュネル暗号などの古典的な換字暗号を解読するために、暗号解読において不可欠です。文字の頻度パターンを分析し、既知の言語統計と比較することで、暗号解読者は平文の文字を推定し、暗号化されたメッセージを解読できます。言語学、自然言語処理、コンテンツ分析でも使用されます。
可読性スコアは、テキストの理解しやすさを測定します。フレッシュ可読性スコアは0から100の範囲で、スコアが高いほど読みやすいテキストを示します。フレッシュ・キンケイド学年レベルは、テキストを理解するために必要な米国の学校の学年を示します。これらのスコアは、文の長さ、単語の長さ、音節数などの要因を分析して複雑さを決定します。
英語のテキストで最も頻繁に出現する文字は、E (12.7%), T (9.1%), A (8.2%), O (7.5%), I (7.0%), N (6.7%), S (6.3%), H (6.1%), R (6.0%) です。最も少ないのは Q, J, X, Z です。この頻度分布は、頻度分析によって換字暗号を解読する上で非常に重要です。
暗号文中の繰り返されるパターンは、元の平文で繰り返される単語やフレーズを示唆することがよくあります。例えば、ヴィジュネル暗号では、同じシーケンスが一定の間隔で複数回出現する場合、その繰り返しの間の距離が鍵の長さを明らかにする可能性があります。パターン分析は、多表式暗号や転置暗号の暗号解読の基本です。
はい、このテキスト分析ツールはラテンアルファベットを使用するどの言語でも機能します。ただし、可読性スコアは英語のテキストに合わせて調整されています。他の言語の正確な暗号解読のためには、その特定の言語(例:フランス語、スペイン語、ドイツ語)の既知の頻度分布と文字頻度を比較する必要があります。
文字数には、文字、数字、句読点、スペース、特殊記号など、すべての文字が含まれます。アルファベット数には、アルファベット文字(A-Z、a-z)のみが含まれます。ほとんどの古典的な暗号は文字のみを暗号化し、他の文字は変更しないため、暗号解読ではアルファベット数がより重要です。