Ước lượng tham số của tổng thể

(Nội dung phần này được trích từ giáo trình XSTK của Dự án Đào tạo giáo viên THCS – tác giả Nguyễn Đình Hiển – NXB Đại học Sư Phạm Hà Nội)

Sau khi lấy mẫu và tính một số thống kê ta phải dùng các thống kê để ước lượng các tham số của tổng thể. Có 2 cách tiếp cận:

1. Ước lượng điểm: Giả sử tổng thể có tham số Θ, sau khi khảo sát mẫu ta tính được các thống kê, dựa vào các thống kê để đưa ra 1 số T thay thế Θ gọi là ước lượng điểm của Θ.

  • Không chệch: hiểu 1 cách đơn giản là ước lượng không chứa sai số hệ thống, tức là không thiên về phía đưa ra các giá trị bé hơn Θ hoặc không thiên về phía đưa ra các giá trị lớn hơn Θ.
  • Hiệu quả: trong các ước lượng có cùng tính chất, chọn ước lượng có phương sai nhỏ nhất.
  • Vững: khi tăng dung lượng mẫu n lên vô hạn thì ước lượng sẽ dần đến Θ (dần đến theo xác suất).
  • Chắc hay bền: không thay đổi nhiều khi trong mẫu có các số liệu quá nhỏ hay quá lớn.

Nếu không thể chọn ước lượng tốt trên mọi phương diện thì, tùy theo mục đích, có thể chọn ước lượng thỏa mãn 1 số tiêu chuẩn trong rất nhiều tiêu chuẩn đưa ra.

Ví dụ:

  • Khi có phân phối chuẩn N(μ;σ2) thì ước lượng trên nhiều mặt là trung bình cộng và phương sai mẫu σ2
  • Khi có phân phối nhị thức B(n,p) thì ước lượng tốt của tham số p là tần suất.

2. Ước lượng khoảng: Đây là cách tiếp cận có nhiều ứng dụng trong các ngành khoa học đòi hỏi phải thường xuyên xử lí số liệu như sinh học, y học, hóa học, kinh tế… Theo cách tiếp cận này sau khi tính các thống kê của mẫu quan sát, ta đưa ra khoảng [a;b] chứa tham số Θ . Cận dưới a và cận trên b tính theo 1 quy tắc cụ thể dựa trên các thống kê và dựa trên mức độ tin cậy P.

Sau khi chọn mẫu, ta đưa ra khoảng tin cậy [a; b], nếu Θ ở trong [a; b] thì khoảng tin cậy đưa ra đúng, nếu Θ  ở ngoài khoảng [a; b], thì khoảng tin cậy đưa ra sai. Như vậy mỗi khoảng tin cậy chỉ có thể đúng hoặc sai, xác suất đúng là P, xác suất sai a = 1 – P, hiểu đơn giản là nếu tính khoảng tin cậy theo quy tắc đã đưa ra thì trung bình trong 100 trường hợp, P.100 trường hợp có khoảng tin cậy đúng.

Không đi sâu vào lý thuyết, ta đưa ra quy tắc ước lượng tham số cho ba trường hợp:

2.1. Ước lượng kỳ vọng μ của phân phối chuẩn khi biết phương sai σ2

Các bước cần làm để ước lượng μ:

+ Chọn mẫu kích thước n, tính trung bình cộng \overline{x} . Chọn mức tin cậy γ (α = 1 - γ gọi là mức sai cho phép hay mức ý nghĩa).

+ Dùng bảng tích phân hàm Laplace \varphi (x) = \dfrac{1}{{\sqrt {2\pi } }}\int\limits_0^x {e^{ - \dfrac{{t^2 }}{2}} dt} để tính giá trị tới hạn u \left( \dfrac{\gamma}{2} \right) , tức là giá trị u sao cho:\varphi(u) = { \dfrac{\gamma}{2}}

+ Ước lượng m theo bất đẳng thức kép:

\overline{x} - u \left( { \dfrac{\gamma}{2}} \right) { \dfrac{\sigma}{\sqrt{n}}} \le \mu \le \overline{x} + u \left( { \dfrac{\gamma}{2}} \right) { \dfrac{\sigma}{\sqrt{n}}}   (1)

Lưu ý: nếu hàm phân phối chuẩn là \varphi (x) = \dfrac{1}{{\sqrt {2\pi } }}\int\limits_{\infty}^x {e^{ - \dfrac{{t^2 }}{2}} dt} thì tính u \left( \dfrac{\alpha}{2} \right) , tức là giá trị u sao cho: \varphi(u) = 1- { \dfrac{\alpha}{2}}   . Giá trị này ở 1 số sách còn được cho bởi bảng phân vị chuẩn u_{\gamma}

Ví dụ: Cân 36 con gà được trọng lượng trung bình \overline{x} = 2,6 kg . Hãy ước lượng kỳ vọng μ ở mức tin cậy 99% nếu trọng lượng gà phân phối chuẩn N(μ; 0,09)

Giải:

Với mức tin cậy 99%: { \dfrac{\gamma}{2}} = 0,495; u(0,495) = 2,575 \left( \varphi(2,575) = 0,495 \right); \mu = 0,3

(Hoặc: \gamma = 0,99 \Rightarrow \dfrac{\alpha}{2} = 0,005; Tra bảng phân vị chuẩn u_{\gamma}: u(0,995) = 2.575

Ta có khoảng ước lượng trung bình:

2,6 - 2,575{ \dfrac{0,3}{\sqrt{36}}} \le \mu \le 2,6 + 2,575{ \dfrac{0,3}{\sqrt{36}}}

Hay:2,471 \le \mu \le 2,729

Ví dụ 2: Phân tích vitamin C của 17 mẫu được \overline{x} = 20mg . Với mức tin cậy 95%, hạy ước lượng kỳ vọng μ nếu lượng vitamin phân phối chuẩn N(μ;σ2) với σ = 3,98 mg

Với mức tin cậy 95%:

\dfrac{\gamma}{2} = 0,475; u(0,475) = 1,96 \left( \varphi(1,96) = 0,475 \right ); \mu = 3,98

(Hoặc: \gamma = 0,95 \Rightarrow \dfrac{\alpha}{2} = 0,025 Tra bảng phân vị chuẩn u_{\gamma}: u(0,025) = 1.96

Khi đó khoảng ước lượng hàm lượng vitamin trung bình là:

20 - 1,96{ \dfrac{3,98}{\sqrt{17}}} \le \mu \le 20 + 1,96{ \dfrac{3,98}{\sqrt {17}}}

Hay:18,110 \le \mu \le 21,892

2. Ước lượng kỳ vọng của phân phối chuẩn khi không biết phương sai:

TH1: Khi n đủ lớn (n > 30): thay σ ở công thức (1) bằng độ lệch chuẩn hiệu chỉnh s.

TH2: Khi n < 30

Các bước cần làm để ước lượng m:

+ Chọn mẫu kích thước n, tính trung bình cộng \overline{x} . Tính phương sai mẫu \hat{s}^2

+ Dùng bảng phân phối Student, tính giá trị tới hạn t(n-1; \alpha) , tức là giá trị t ở cột α, dòng n – 1

+ Ước lượng m theo bất đẳng thức kép:

\overline{x} - t(n-1; \alpha){ \dfrac{\hat{s}}{\sqrt{n}}} \le \mu \le \overline{x} + t(n-1; \alpha){ \dfrac{\hat{s}}{\sqrt{n}}} (2)

Ví dụ: Để ước lượng năng suất một giống ngô, người ta theo dõi 25 mảnh ruộng. Sau khi thu hoạch được \overline{x} = 10,6; \hat{s} = 2,082 (đơn vị tạ/ha). Giả thiết năng suất ngô phân phối chuẩn. Mức tin cậy P = 0,95.

Ta có: \alpha = 0,05 ; n -1 = 24 . Tra bảng phân phối Student ta được: t(24; 0,05) = 2,064

Vậy khoảng ước lượng năng suất trung bình của giống ngô:

10,6 - 2,064{ \dfrac{2,082}{\sqrt{25}}} \le \mu \le 10,6 + 2,064{ \dfrac{2,082}{\sqrt{25}}}

Hay:9,741 \le \mu \le 11,459

3. Ước lượng xác suất p của phân phối nhị thức:

Một tổng thể gồm 2 loại cá thể A , \overline{A} với số lượng rất lớn, tỉ lệ loại A là p (chưa biết). Lấy ngẫu nhiên 1 cá thể, có thể coi xác suất được các thể loại A là p. Lấy ngẫu nhiên n cá thể, trong đó có m cá thể loại A.

Nếu n lớn (n > 100):

+ Lấy mẫu kích thước n, đếm tần số (m) xuất hiện cá thể loại A, tính tần suất f = \dfrac{m}{n}

+ Dùng bảng tích phân hàm Laplace \varphi (x) = \dfrac{1}{{\sqrt {2\pi } }}\int\limits_0^x {e^{ - \dfrac{{t^2 }}{2}} dt} để tính giá trị tới hạn u \left( \dfrac{\gamma}{2} \right) , tức là giá trị u sao cho:\varphi(u) = { \dfrac{\gamma}{2}}

+ Ước lượng m theo bất đẳng thức kép:

\overline{x} - u \left( { \dfrac{\gamma}{2}} \right) {\sqrt{ \dfrac{f(1-f)}{n}}} \le \mu \le \overline{x} + u \left( { \dfrac{\gamma}{2}} \right) {\sqrt{ \dfrac{f(1-f)}{n}}} (3)

4. Tính kích thước mẫu khi ước lượng trung bình:

Theo (1), nửa chiều dài khoảng ước lượng:L = u \left( { \dfrac{\gamma}{2}} \right) { \dfrac{\sigma}{\sqrt{n}}} . Nếu muốn ước lượng đạt độ chính xác ε thì phải lấy L ≤ ε. Từ đó:n \ge u^2 \left( { \dfrac{\gamma}{2}} \right) { \dfrac{{\sigma}^2}{{\epsilon}^2}}

5. Tính kích thước mẫu khi ước lượng xác suất p:

Theo (3), nửa chiều dài khoảng ước lượng  L = u \left( { \dfrac{\gamma}{2}} \right) {\sqrt{ \dfrac{f(1-f)}{n}}} . Từ đó: n \ge u^2 \left( { \dfrac{\gamma}{2}} \right) { \dfrac{f(1-f)}{{\epsilon}^2}} . Hay: n \ge u^2 \left( { \dfrac{\gamma}{2}} \right) { \dfrac{1}{4{\epsilon}^2}} dof(1-f) \le \dfrac{1}{4}

Thảo luận

21 thoughts on “Ước lượng tham số của tổng thể

  1. nho cac bac giai giup toi bai nay voi:de xac dinh ty le nhiem H5N1 o ga tai 1 dia ph­uong vao thoi diem thang 4/2008 nguoi ta kiem tra ngau nhien 500 con ga tai dia phuong va thay co 50 con bi nhiem H5N1.voi do tin cay 95%
    1. hay uoc luong ty le so ga bi nhiem H5n1 bang khoang tin cay doi xung.
    2. gia su so ga tai dia phuong tren la 10.000 con. Hay cho biet thoi diem thang 4/2008, tai dia phuong tren co khoang bao nhieu co ga bi nhiem H5N1
    3. Theo so leu thang 11/2007 thi ty le nhiem virus H5N1 la 12%.theo ban ty le nay vao thang 4/2008 co giam di khong
    cho biet t(0.95) = 1.96 ; t(0.975) = 1.645

    Like

    Posted by khoi | 17/08/2010, 15:09
  2. ngán quá:(, sao mấy công thức k xem được thế này:((, toàn bị lỗi thôi, chờ mãi mà chẳng thấy hiện ra gì cả:(, làm sao mà học được đây:-?

    Like

    Posted by hoanguyen | 30/05/2010, 09:43
  3. Thầy làm giúp bài nì với (đề thi cuối kì của em đó!)
    Theo dõi việc điều trị những bệnh nhân cùng mắc 1 loại bệnh ta thấy: trong số 1000 người điều trị = thuốc A thì có 850 nguwoif khỏi, trong số 900 người ddieefuf trị = thuốc B có 810 người khỏi. Với mức ý nghĩa 0,05 có thế nói thuốc B điều trị hiệu quả hơn thuốc A đc ko?
    Thanks thầy ạ!

    Like

    Posted by hoang | 02/05/2010, 23:57
  4. Thứ 4 này nình thi, xin mấy bạn giúp mình giải bài này

    Điều tra số lượng hàng xuất nhập khẩu hằng ngày X (Tấn) ở 1 cảng. Ghi chép số liệu trong 1 số ngày ta được bảng

    Xi 30 40 50 60 70

    Ni 10 20 30 25 15

    1>. Ước lượng số lượng hàng xuất nhập trong cảng với độ tin cậy 95%

    2>. Ước lượng tỉ lệ ngày cao điểm (X=55 Tấn) ở cảng đó với độ tin cậy 99%

    cho:
    @(1.96)=0.475
    @(2.58)=0.495

    Like

    Posted by Thanh | 11/01/2010, 12:42
  5. Thầy ơi. Cho em hoi về phần dự toán lý thuyết trong môn học xstk. Em được thầy giáo giao cho làm đề tài phần đó nhưng em không kiếm thấy tài liệu nào? Thầy có cho em xin dùm.

    Like

    Posted by Huou Cao Co | 29/12/2009, 01:13
  6. các bạn và thầy cho mình hỏi cái này một xíu khi nào mình dùng bảng laplat và khi nào dùng student,bài tập mình làm cứ tréo nghoe ở chổ đó hoài àh”thank các bạn

    Like

    Posted by võ thành luân | 22/12/2009, 15:59
  7. 1. Một máy sản xuất với tỷ lệ phế phẩm 5%. Một lô sản phẩm gồm 10 sản phẩm với tỷ lệ phế phẩm 30%. Cho máy sản xuất 3 sản phẩm và từ lô lấy thêm 3 sản phẩm. X là số sản phẩm tốt trong 6 sản phẩm này.
    a. Lập bảng phân phối của X.
    b. Không dùng bảng phân phối của X, tính M(X) và D(X).
    thầy xem giùm em nhé thầy………

    Like

    Posted by võ thành luân | 22/12/2009, 15:53

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

Translators & RSS

English French RussiaMaths 4 Physics (M4Ps)


Bạn hãy nhập địa chỉ email của mình để đăng ký theo dõi tin tức từ blog này và nhận những bài viết mới nhất qua địa chỉ email.

Join 2 009 other followers

Đôi lời

Bạn có thể theo dõi các lời bình liên quan đến lời bình của mình qua email bằng cách chọn dòng thông báo Báo cho bạn khi có người bình luận tiếp theo đề tài này bằng điện thư mỗi khi viết 1 lời bình.


Rất mong các bạn viết lời nhắn bằng tiếng việt có dấu nhé.

Để viết tiếng việt có dấu bạn dùng font chữ Unicode và bảng mã là Unicode UTF-8.


Để biết cách gõ công thức Toán học trong các lời nhắn ở trang web này, mời bạn đọc bài hướng dẫn tại đây hoặc bạn có thể xem bài hướng dẫn dùng MathType tại đây và bài tạo công thức trực tuyến tại đây


Get Well

Lời nhắn mới nhất

Thanh Ly on Dạ thưa cô, 10 ạ!
Theo dõi

Get every new post delivered to your Inbox.

Join 2 009 other followers

%d bloggers like this: