Thứ Hai, 4 tháng 3, 2013

Mức ý nghĩa và độ giá trị trong bài toán kiểm định.

Ngày 5/3/2013

Lẽ ra bài này phải được viết vào tối hôm qua, nhưng do mải chơi DotA nên giờ tôi mới có thời gian để viết vậy.
Tôi bắt đầu công việc trợ giảng với môn Nguyên lý thống kê và Dự báo trong kinh doanh, dĩ nhiên lúc học thì một đằng còn đi giảng lại là một đằng khác. Do đó tôi phải đọc lại sách để hiểu kĩ hơn các khái niệm - một thời mình từng bỏ qua vì chỉ học cho qua chứ chả biết kiến thức đó dùng để làm gì.
Trong những khái niệm cơ bản ban đầu của 2 môn học định lượng này, tôi có sự chú ý tới hai giá trị sau: mức ý nghĩa α - alpha và độ giá trị - 1-β. Về vấn đề này tôi cũng có trao đổi với 2 người thầy của tôi là thầy Trần Bá Nhẫn (Đại học Kinh tế TP. Hồ Chí Minh) và thấy Trần Kim Ngọc (Đại học Công nghệ Sài Gòn) do đó đã hiểu được chút it. Tôi viết lại vừa nhằm để ôn lại kiến thức, vừa để tìm cho mình một lối hành văn dễ nhớ, đặng sau này có quên thì coi lại vẫn tốt hơn.
Nếu đã từng học ( hoặc đang học) các môn phân tích định lượng thì chắc không ai không biết tới giá trị α và β:
Ở đây tôi chỉ đề cập tới phương diện kiểm định giả thuyết. Trong kiểm định giả thuyết, người ta thường dựa trên mẫu để đưa ra suy đoán cho tổng thể, do đó, thường gặp các sai lầm:
- Bác bỏ giả thuyết Ho khi Ho đúng, xác suất mắc sai lầm loại I gọi là mức ý nghĩa α. Ngược lại với xác xác suất này gọi là độ tin cậy 1-α, là xác suất khi không bác bỏ Ho khi Ho đúng.
- Bác bỏ giả thuyết Ho khi Ho sai, xác suất này được gọi là dộ giá trị của kiểm định 1-β. Ngược lại thì ta có xác suất mắc sai lầm II là β, chấp nhận Ho khi Ho sai.
Vậy có mối liên hệ nào giữa 2 loại sai lầm này không ? Nếu biết được giá trị xác suất của một loại sai lầm, ta có thể tim được giá trị xác suất của loại sai lầm còn lại không ? Tôi rất muốn biết điều này. Điều làm tôi thấy có thể tìm được là vì một quan sát : khi α tăng thì xác suất bác bỏ Ho đúng càng cao dễ dẫn đến chấp nhận Ho khi Ho sai càng cao, hay β cũng tăng.
Chúng ta sẽ đi từ một ví dụ đơn giản để kiểm tra điều này.
Ví dụ: Một hiệu trưởng trường Đại học muốn biết điểm trung bình trong năm học vừa rồi của sinh viên có cao hơn năm ngoái hay không đã tiến hành một cuộc điều tra trên mẫu 100 sinh viên. Giả sử rằng trong quá trình điều tra thì độ lệch tiêu chuẩn xác định là 0,5 điểm và điểm trung bình của năm ngoái là 5,3. Cho mức ý nghĩa là 10%.
Khi giải bài toán này, ta hãy hình dung xem, điểm trung bình của mẫu khảo sát này phải là bao nhiêu thì năm học này có kết quả tốt hơn so với năm ngoái. 
Đặt giả thuyết:
H0: µ ≤ 5,3
H1: µ > 5,3
Dựa vào công thức tính Zo, ta có:
Zo = (Xtb - 5,3)*(n^1/2)/σ
=> Xtb = Zo*σ/(n^1/2) + 5,3
Ta sẽ bác bỏ Ho nếu giá trị kiểm định Zo > 1,645 (độ tin cậy là 90%)
=> Xtb = 5,38225 (điểm). Ho sẽ bị bác bỏ nếu giá trị trung bình trong cuôc điều tra Xtb > 5,38225 điểm, hay năm học này "có vẻ" tốt hơn so với năm ngoái.
Hãy cho một vài giá trị trung bình cụ thể, ta sẽ đi tìm độ giá trị của phép kiểm định.
1.Giả sử điểm trung bình điểu tra được là 5,4 điểm
Ta tính được:
Zo = ( 5,4 - 5,3)*(100^1/2)/0,5 = 2 .
Rõ ràng với giá trị Zo = 2 thì giả thuyết Ho sẽ bị bác bỏ vì sai, nhưng xác suất Ho sẽ bị bác bỏ trong trường hợp này là bao nhiêu (ta nên nhớ rằng có xác suất mắc sai lầm chấp nhận Ho khi Ho sai).
Ta có: Z = (5,38225 - 5,4)*(100^1/2)/0,5 = - 0,355, vậy để bác bỏ Ho thì xác suất sẽ là :
P(Z ≥ - 0,355) = 0,5 + 0,1387 = 0,6387 (63,87%)


Phần diện tích hình nón chụp từ phía bên phải của giá trị -0,355 là vùng bác bỏ Ho.
Vậy độ giá trị trong trường hợp này là 0,6387, nghĩa là xác suất bác bỏ Ho trong trường hợp này là 63,87%.
Và xác suất mắc sai lầm loại II là 1-0,6387 = 0,3613.
2.Giả sử điểm trung bình điểu tra được là 5,1 điểm
Ta cũng có:
Z = (5,38225 - 5,1)*(100^1/2)/0,5 = 5,645.
Ta đã biết trong bảng Laplace thì với giá trị Z = 5,645 gần như P (Z ≥ 5,645) = 0 (0,0000006), hay nói cách khác, giả thuyết Ho sẽ không bị bác bác bỏ trong trường hợp này.
3.Quay trở lại trường hợp điểm trung bình điểu tra được là 5,4 điểm, ta thay đổi dữ kiện mức ý nghĩa α = 5%.
Với α=5%, ta có giá trị Xtb = 1,96*(100^1/2)/0,5 + 5,3 = 5,398 (điểm)
Z = (5,398 - 5,4)*100/0,5 = -0,04
P(Z ≥ -0,04) = 0,5 + 0.16 = 0,66 (66%)
Xác suất mắc sai lầm loại II là 1 - 0,66 = 0,34
Như vậy khi giá trị mức ý nghĩa tăng thì xác suất mắc sai lầm loại II cũng tăng, đúng như ban đầu tôi đã kì vọng.

Không có nhận xét nào:

Đăng nhận xét