Cho mẫu số liệu ghép nhóm:
Nhóm | Tần số |
$[a_1; a_2)$ |
$m_1$ |
$[a_2; a_3)$ | $m_2$ |
$\vdots$ | $\vdots$ |
$[a_k; a_{k+1})$ |
$m_k$ |
Gọi $n=m_1+m_2+\cdots +m_k$ là cỡ mẫu.
Với mỗi $i \in \{1,2,\cdots, k\}$, gọi
$x_i=\dfrac{a_i+a_{i+1}}{2}$ là giá trị đại diện của nhóm $[a_i; a_{i+1}).$
Công thức tính số trung bình
Số trung bình của mẫu số liệu ghép nhóm đã cho, kí hiệu là $\bar{x}$, được tính theo công thức sau:
$$\bar{x}=\dfrac{m_1x_1+m_2x_2+\cdots m_kx_k}{n}.$$
Ý nghĩa của số trung bình
Số trung bình của mẫu số liệu ghép nhóm xấp xỉ cho số trung bình của mẫu số liệu gốc, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu.
Ví dụ minh họa
Ví dụ. Tìm cân nặng trung bình của học sinh lớp 11D cho trong bảng sau:
Cân nặng (kg) |
$[40,5; 45,5)$ | $[45,5; 50,5)$ | $[50,5; 55,5)$ | $[55,5; 60,5)$ | $[60,5; 65,5)$ | $[65,5; 70,5)$ |
Số học sinh |
$10$ |
$7$ |
$16$ |
$4$ |
$2$ |
$3$ |
Trong mỗi khoảng cân nặng, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có bảng sau:
Cân nặng (kg)
|
$43$ |
$48$ |
$53$ |
$58$ |
$63$ |
$68$ |
Số học sinh |
$10$ |
$7$ |
$16$ |
$4$ |
$2$ |
$3$ |
Tổng số học sinh là $n = 42$ (cỡ mẫu).
Cân nặng trung bình của học sinh lớp 11D là
$\bar{x}=\dfrac{
10.43+7.48+16.53+4.58+2.63+3.68}{42}$ $= 51,81 \ (\text{kg}).$