Các biện pháp xu hướng trung tâm cho dữ liệu được nhóm

Các thước đo của xu hướng trung tâm của dữ liệu được nhóm được sử dụng trong thống kê để mô tả các hành vi nhất định của một nhóm dữ liệu được cung cấp, chẳng hạn như giá trị nào gần với, trung bình của dữ liệu được thu thập, trong số các dữ liệu khác.

Khi một lượng lớn dữ liệu được thực hiện, sẽ rất hữu ích khi nhóm chúng để có thứ tự tốt hơn và do đó có thể tính toán các biện pháp nhất định của xu hướng trung tâm.

Trong số các biện pháp của xu hướng trung tâm được sử dụng nhiều nhất là trung bình số học, trung vị và chế độ. Những con số này cho biết những phẩm chất nhất định về dữ liệu được thu thập trong một thử nghiệm nhất định.

Để sử dụng các biện pháp này, trước tiên cần biết cách nhóm một tập hợp dữ liệu.

Dữ liệu được nhóm

Để nhóm dữ liệu trước tiên, bạn phải tính toán phạm vi dữ liệu, thu được bằng cách trừ giá trị cao nhất trừ đi giá trị thấp nhất của dữ liệu.

Sau đó chọn một số "k", đó là số lớp mà bạn muốn nhóm dữ liệu.

Chúng tôi tiến hành phân chia phạm vi giữa «k» để thu được biên độ của các lớp được nhóm. Số này là C = R / k.

Cuối cùng, việc nhóm được bắt đầu, trong đó một số nhỏ hơn được chọn so với giá trị thấp nhất của dữ liệu thu được.

Con số này sẽ là giới hạn dưới của lớp đầu tiên. Thêm vào đây C. Giá trị thu được sẽ là giới hạn trên của lớp đầu tiên.

Sau đó, C được thêm vào giá trị này và thu được giới hạn trên của lớp thứ hai. Theo cách này, chúng tôi tiến hành cho đến khi chúng tôi đạt được giới hạn trên của lớp cuối cùng.

Sau khi dữ liệu được nhóm, bạn có thể tiến hành tính giá trị trung bình, trung bình và chế độ.

Để minh họa ý nghĩa số học, trung bình và chế độ được tính toán, chúng tôi sẽ tiến hành với một ví dụ.

Ví dụ

Do đó, khi nhóm dữ liệu, bạn sẽ nhận được một bảng như sau:

3 biện pháp trung tâm chính

Bây giờ chúng ta sẽ tiến hành tính toán trung bình số học, trung vị và chế độ. Ví dụ trước sẽ được sử dụng để minh họa thủ tục này.

1- Trung bình số học

Giá trị trung bình số học bao gồm nhân mỗi tần số với trung bình của khoảng. Sau đó, tất cả các kết quả này được thêm vào, và cuối cùng nó được chia cho tổng dữ liệu.

Sử dụng ví dụ trước, chúng ta sẽ có được rằng trung bình số học bằng:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111

Điều này chỉ ra rằng giá trị trung bình của dữ liệu trong bảng là 5.11111.

2- Trung bình

Để tính trung bình của một tập dữ liệu, đầu tiên tất cả dữ liệu được sắp xếp từ ít nhất đến lớn nhất. Hai trường hợp có thể được trình bày:

- Nếu số dữ liệu là số lẻ, thì trung vị là dữ liệu ở ngay trung tâm.

- Nếu số dữ liệu là số chẵn thì trung vị là trung bình của hai dữ liệu vẫn ở trung tâm.

Khi nói đến dữ liệu được nhóm lại, việc tính toán trung vị được thực hiện theo cách sau:

- N / 2 được tính toán, trong đó N là tổng dữ liệu.

- Khoảng đầu tiên được tìm kiếm trong đó tần số tích lũy (tổng tần số) lớn hơn N / 2 và giới hạn dưới của khoảng này, được gọi là Li, được chọn.

Trung vị được cho theo công thức sau:

Me = Li + (Ls-Li) * (N / 2 - Tần số tích lũy trước Li) / Tần số của [Li, Ls)

Ls là giới hạn trên của phạm vi được đề cập ở trên.

Nếu bảng dữ liệu trên được sử dụng, chúng ta có N / 2 = 18/2 = 9. Tần số tích lũy là 4, 8, 14 và 18 (một cho mỗi hàng của bảng).

Do đó, nên chọn khoảng thứ ba, vì tần số tích lũy lớn hơn N / 2 = 9.

Vậy Li = 5 và Ls = 7. Áp dụng công thức được mô tả ở trên, bạn phải:

Tôi = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.

3- Thời trang

Thời trang là giá trị có tần suất lớn nhất trong số tất cả các dữ liệu được nhóm; đó là giá trị được lặp lại nhiều lần nhất trong tập dữ liệu ban đầu.

Khi bạn có một lượng dữ liệu rất lớn, công thức sau đây được sử dụng để tính toán chế độ của dữ liệu được nhóm:

Mo = Li + (Ls-Li) * (Tần số Li - Tần số L (i-1)) / ((Tần số Li tần số của L (i-1)) + (Tần số tần số Li của L (i-1) i + 1)))

Khoảng [Li, Ls) là khoảng thời gian tìm thấy tần số cao nhất. Đối với ví dụ được thực hiện trong bài viết này, chúng ta có thời trang được đưa ra bởi:

Mơ = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

Một công thức khác được sử dụng để đạt được giá trị gần đúng với thời trang là:

Mo = Li + (Ls-Li) * (tần số L (i + 1)) / (tần số L (i-1) + tần số L (i + 1)).

Với công thức này, các tài khoản như sau:

Mơ = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.