Lẽ ra bài này phải được
viết vào tối hôm qua, nhưng do mải chơi DotA nên giờ tôi mới có thời gian để
viết vậy.
Tôi
bắt đầu công việc trợ giảng với môn Nguyên lý thống kê và Dự báo trong kinh
doanh, dĩ nhiên lúc học thì một đằng còn đi giảng lại là một đằng khác. Do đó
tôi phải đọc lại sách để hiểu kĩ hơn các khái niệm - một thời mình từng bỏ qua
vì chỉ học cho qua chứ chả biết kiến thức đó dùng để làm gì.
Trong
những khái niệm cơ bản ban đầu của 2 môn học định lượng này, tôi có sự chú ý
tới hai giá trị sau: mức ý nghĩa α - alpha
và độ giá trị - 1-β. Về vấn đề
này tôi cũng có trao đổi với 2 người thầy của tôi là thầy Trần Bá Nhẫn (Đại học
Kinh tế TP. Hồ Chí Minh) và thấy Trần Kim Ngọc (Đại học Công nghệ Sài Gòn) do
đó đã hiểu được chút it. Tôi viết lại vừa nhằm để ôn lại kiến thức, vừa để tìm
cho mình một lối hành văn dễ nhớ, đặng sau này có quên thì coi lại vẫn tốt hơn.
Nếu
đã từng học ( hoặc đang học) các môn phân tích định lượng thì chắc không ai
không biết tới giá trị α và β:
Ở
đây tôi chỉ đề cập tới phương diện kiểm định giả thuyết. Trong kiểm định giả
thuyết, người ta thường dựa trên mẫu để đưa ra suy đoán cho tổng thể, do đó,
thường gặp các sai lầm:
-
Bác bỏ giả thuyết Ho khi Ho đúng, xác suất mắc sai lầm loại I gọi là mức ý
nghĩa α. Ngược lại với xác xác suất này gọi là độ tin cậy 1-α, là xác suất
khi không bác bỏ Ho khi Ho đúng.
-
Bác bỏ giả thuyết Ho khi Ho sai, xác suất này được gọi là dộ giá trị của kiểm
định 1-β. Ngược lại thì ta có xác suất mắc sai lầm II là β, chấp nhận Ho
khi Ho sai.
Vậy
có mối liên hệ nào giữa 2 loại sai lầm này không ? Nếu biết được giá trị xác
suất của một loại sai lầm, ta có thể tim được giá trị xác suất của loại sai lầm
còn lại không ? Tôi rất muốn biết điều này. Điều làm tôi thấy có thể tìm được
là vì một quan sát : khi α tăng thì xác suất bác bỏ Ho đúng càng cao dễ
dẫn đến chấp nhận Ho khi Ho sai càng cao, hay β cũng tăng.
Chúng
ta sẽ đi từ một ví dụ đơn giản để kiểm tra điều này.
Ví
dụ: Một hiệu trưởng trường Đại học muốn biết điểm trung bình trong năm học vừa
rồi của sinh viên có cao hơn năm ngoái hay không đã tiến hành một cuộc điều tra
trên mẫu 100 sinh viên. Giả sử rằng trong quá trình điều tra thì độ lệch tiêu
chuẩn xác định là 0,5 điểm và điểm trung bình của năm ngoái là 5,3. Cho mức ý
nghĩa là 10%.
Khi
giải bài toán này, ta hãy hình dung xem, điểm trung bình của mẫu khảo sát này
phải là bao nhiêu thì năm học này có kết quả tốt hơn so với năm ngoái.
Đặt giả
thuyết:
H0:
µ ≤ 5,3
H1:
µ > 5,3
Dựa vào
công thức tính Zo, ta có:
Zo = (Xtb
- 5,3)*(n^1/2)/σ
=> Xtb
= Zo*σ/(n^1/2) + 5,3
Ta sẽ bác
bỏ Ho nếu giá trị kiểm định Zo > 1,645 (độ tin cậy là 90%)
=> Xtb
= 5,38225 (điểm). Ho sẽ bị bác bỏ nếu giá trị trung bình trong cuôc điều tra
Xtb > 5,38225 điểm, hay năm học này "có vẻ" tốt hơn so với năm
ngoái.
Hãy cho
một vài giá trị trung bình cụ thể, ta sẽ đi tìm độ giá trị của phép kiểm định.
1.Giả sử
điểm trung bình điểu tra được là 5,4 điểm
Ta tính
được:
Zo = (
5,4 - 5,3)*(100^1/2)/0,5 = 2 .
Rõ ràng
với giá trị Zo = 2 thì giả thuyết Ho sẽ bị bác bỏ vì sai, nhưng xác suất Ho sẽ bị bác
bỏ trong trường hợp này là bao nhiêu (ta nên nhớ rằng có xác suất mắc sai lầm
chấp nhận Ho khi Ho sai).
Ta có: Z
= (5,38225 - 5,4)*(100^1/2)/0,5 = - 0,355, vậy để bác bỏ Ho thì xác suất
sẽ là :
P(Z ≥
- 0,355) = 0,5 + 0,1387 = 0,6387 (63,87%)
Phần diện
tích hình nón chụp từ phía bên phải của giá trị -0,355 là vùng bác bỏ Ho.
Vậy độ
giá trị trong trường hợp này là 0,6387, nghĩa là xác suất bác bỏ Ho trong trường hợp này là 63,87%.
Và xác
suất mắc sai lầm loại II là 1-0,6387 = 0,3613.
2.Giả sử
điểm trung bình điểu tra được là 5,1 điểm
Ta cũng
có:
Z =
(5,38225 - 5,1)*(100^1/2)/0,5 = 5,645.
Ta đã
biết trong bảng Laplace thì với giá trị Z = 5,645 gần như P (Z ≥ 5,645) =
0 (0,0000006), hay nói cách khác, giả thuyết Ho sẽ không bị bác bác bỏ trong
trường hợp này.
3.Quay
trở lại trường hợp điểm trung bình điểu tra được là 5,4 điểm, ta thay đổi dữ
kiện mức ý nghĩa α = 5%.
Với α=5%,
ta có giá trị Xtb = 1,96*(100^1/2)/0,5 + 5,3 = 5,398 (điểm)
và
Z =
(5,398 - 5,4)*100/0,5 = -0,04
P(Z ≥
-0,04) = 0,5 + 0.16 = 0,66 (66%)
Xác suất
mắc sai lầm loại II là 1 - 0,66 = 0,34
Như vậy
khi giá trị mức ý nghĩa tăng thì xác suất mắc sai lầm loại II cũng tăng, đúng
như ban đầu tôi đã kì vọng.
Không có nhận xét nào:
Đăng nhận xét