Phân tích kết quảĐơn giản của mô tả, chúng tôi sử dụng ngôn ngữ của thống kê từ trong văn bản, nơi biểu thị tần số của từ với xếp hạng. Tuy nhiên, kết quả là không giới hạn đối với hệ thống ngôn ngữ. Lưu ý là số riêng biệt từ với tần suất lớn hơn, rất. Biểu thị tổng số lần xuất hiện từ (tức là, các kích thước của văn bản) và số tương ứng khác biệt từ, sau đó(1)Lưu ý rằng với một hằng số. Theo các điều kiện bình thường hóa, khi và (hai điều kiện bao gồm giữ cho thực sự đặt hệ thống), Thay thế trong Eq. 1 bởi, chúng tôi có(2)Theo luật pháp của Zipf và mối quan hệ giữa của Zipf và quyền lực-luật số mũ, phần bên phải của Eq. 2 có thể được bày tỏ trong thuật ngữ của, và như(3)Kết hợp Eq. 1 và Eq. 3, chúng tôi có thể có được ước tính, như(4)Rõ ràng, kích thước văn bản là tổng của tất cả từ trường hợp, nói
đang được dịch, vui lòng đợi..