📊 أداة تحليل النصوص
إحصائيات نصية احترافية، تحليل التكرار، وتقييم قابلية القراءة لتحليل الشفرات واللغويات
التسلسلات المتكررة (3+ أحرف)
تحليل تكرار النصوص أساسي في تحليل الشفرات، خاصة لكسر شفرات التبديل مثل شفرة قيصر وشفرة فيجينير وغيرها من طرق التشفير الكلاسيكية. من خلال تحليل أنماط تكرار الحروف ومقارنتها بإحصائيات اللغات المعروفة، يمكن لمحللي الشفرات تحديد الحروف المحتملة في النص الأصلي وفك الرسائل المشفرة. كما يُستخدم في اللغويات ومعالجة اللغات الطبيعية وتحليل المحتوى.
تقيس درجات قابلية القراءة مدى سهولة فهم النص. تتراوح درجة سهولة القراءة لفليش بين 0-100، حيث تشير الدرجات الأعلى إلى نص أسهل. ويشير مستوى فليش-كينكيد الدراسي إلى مستوى الصف الدراسي في الولايات المتحدة اللازم لفهم النص. تحلل هذه الدرجات عوامل مثل طول الجملة وطول الكلمة وعدد المقاطع لتحديد التعقيد.
في النص الإنجليزي، الحروف الأكثر تكرارًا هي: E (12.7%)، T (9.1%)، A (8.2%)، O (7.5%)، I (7.0%)، N (6.7%)، S (6.3%)، H (6.1%)، R (6.0%). الأقل شيوعًا هي: Q، J، X، Z. هذا التوزيع التكراري حاسم لكسر شفرات التبديل من خلال تحليل التكرار.
غالبًا ما تشير الأنماط المتكررة في النص المشفر إلى كلمات أو عبارات متكررة في النص الأصلي. على سبيل المثال، في شفرة فيجينير، إذا وجدت نفس التسلسل يظهر عدة مرات على فترات منتظمة، فإن المسافة بين التكرارات يمكن أن تكشف عن طول المفتاح. تحليل الأنماط أساسي لتحليل الشفرات متعددة الأبجدية وشفرات التبديل الموضعي.
نعم، تعمل أداة تحليل النصوص هذه مع أي لغة تستخدم الأبجدية اللاتينية. ومع ذلك، فإن درجات قابلية القراءة معايرة للنص الإنجليزي. لتحليل دقيق للشفرات بلغات أخرى، يجب مقارنة تكرارات الحروف مع توزيع التكرار المعروف لتلك اللغة المحددة (مثل الفرنسية والإسبانية والألمانية).
يشمل عدد الأحرف جميع الرموز: الحروف والأرقام وعلامات الترقيم والمسافات والرموز الخاصة. أما عدد الحروف الأبجدية فيشمل الحروف الأبجدية فقط (A-Z، a-z). بالنسبة لتحليل الشفرات، يعد عدد الحروف الأبجدية أكثر أهمية لأن معظم الشفرات الكلاسيكية تشفر الحروف فقط، وتترك الرموز الأخرى دون تغيير.