📊 Ferramenta de Análise de Texto
Estatísticas de texto profissionais, análise de frequência e pontuação de legibilidade para criptanálise e linguística
Sequências Repetidas (3+ caracteres)
A análise de frequência de texto é essencial para a criptanálise, particularmente para quebrar cifras de substituição como a cifra de César, a cifra de Vigenère e outros métodos de criptografia clássicos. Ao analisar os padrões de frequência das letras e compará-los com as estatísticas de um idioma conhecido, os criptanalistas podem identificar prováveis letras do texto original e quebrar mensagens criptografadas. Também é usada em linguística, processamento de linguagem natural e análise de conteúdo.
As pontuações de legibilidade medem a facilidade de compreensão de um texto. A pontuação de Facilidade de Leitura Flesch varia de 0 a 100, com pontuações mais altas indicando um texto mais fácil. O Nível de Grau Flesch-Kincaid indica o nível de escolaridade dos EUA necessário para entender o texto. Essas pontuações analisam fatores como o comprimento da frase, o comprimento da palavra e a contagem de sílabas para determinar a complexidade.
Em textos em inglês, as letras mais frequentes são: E (12.7%), T (9.1%), A (8.2%), O (7.5%), I (7.0%), N (6.7%), S (6.3%), H (6.1%), R (6.0%). As menos comuns são: Q, J, X, Z. Essa distribuição de frequência é crucial для quebrar cifras de substituição por meio da análise de frequência.
Padrões repetidos em texto cifrado muitas vezes indicam palavras ou frases repetidas no texto original. Por exemplo, em uma cifra de Vigenère, se você encontrar a mesma sequência aparecendo várias vezes em intervalos regulares, a distância entre as repetições pode revelar o comprimento da chave. A análise de padrões é fundamental para a criptanálise de cifras polialfabéticas e de transposição.
Sim, esta ferramenta de análise de texto funciona com qualquer idioma que use o alfabeto latino. No entanto, as pontuações de legibilidade são calibradas para o texto em inglês. Para uma criptanálise precisa de outros idiomas, você deve comparar as frequências das letras com a distribuição de frequência conhecida desse idioma específico (por exemplo, francês, espanhol, alemão).
A contagem de caracteres inclui todos os caracteres: letras, números, pontuação, espaços e símbolos especiais. A contagem de letras inclui apenas caracteres alfabéticos (A-Z, a-z). Para a criptanálise, a contagem de letras é mais importante porque a maioria das cifras clássicas criptografa apenas letras, deixando outros caracteres inalterados.