Hồi quy biến giới hạn Tobit + Poisson

Hồi quy biến giới hạn Tobit + Poisson; Đây là 2 phương pháp ước lượng hồi quy thông dụng về việc giới hạn của biến phụ thuộc, điều này làm cho kết quả hồi quy có độ chính xác cao hơn. Nếu bạn biết vận dụng kiến thức thống kê thì việc kết quả nghiên cứu của bạn tăng độ tin cậy.

Hồi quy biến giới hạn

Mô hình hồi quy Tobit là gì ?

Trong thống kê, mô hình tobit là bất kỳ loại mô hình hồi quy nào trong đó phạm vi quan sát của biến phụ thuộc được kiểm duyệt theo một cách nào đó. Thuật ngữ này được đặt ra bởi Arthur Goldberger liên quan đến James Tobin ,  [a] người đã phát triển mô hình vào năm 1958 để giảm thiểu vấn đề về dữ liệu bị thổi phồng bằng không cho các quan sát về chi tiêu của hộ gia đình đối với hàng hóa lâu bền .

Bởi vì phương pháp của Tobin có thể dễ dàng mở rộng để xử lý các mẫu bị cắt ngắn và không được chọn ngẫu nhiên khác, [c]một số tác giả áp dụng một định nghĩa rộng hơn về mô hình tobit bao gồm những trường hợp này.

Ý tưởng của Tobin là sửa đổi hàm khả năng để nó phản ánh xác suất lấy mẫu không bằng nhau cho mỗi lần quan sát tùy thuộc vào việc biến phụ thuộc tiềm ẩn nằm trên hay dưới ngưỡng đã xác định.  Đối với một mẫu, như trong trường hợp ban đầu của Tobin, đã được kiểm duyệt từ bên dưới bằng 0, xác suất lấy mẫu cho mỗi lần quan sát không giới hạn chỉ đơn giản là chiều cao của hàm mật độ thích hợp .

Đối với bất kỳ quan sát giới hạn nào, nó là phân phối tích lũy, tức là tích phân dưới 0 của hàm mật độ thích hợp. Do đó, hàm khả năng Tobit là một hỗn hợp của mật độ và hàm phân phối tích lũy

Mô hình ước lượng Poisson là gì ?

Trong thống kê , hồi quy Poisson là một dạng mô hình tuyến tính tổng quát của phân tích hồi quy được sử dụng để lập mô hình dữ liệu đếm và bảng dự phòng . Hồi quy Poisson giả định biến phản hồi Y có phân phối Poisson và giả sử lôgarit của giá trị kỳ vọng của nó có thể được mô hình hóa bằng sự kết hợp tuyến tính của các tham số chưa biết . Mô hình hồi quy Poisson đôi khi được gọi là mô hình log-tuyến tính , đặc biệt khi được sử dụng để lập mô hình các bảng dự phòng.

Hồi quy nhị thức phủ định là một cách tổng quát hóa phổ biến của hồi quy Poisson vì nó nới lỏng giả định có tính hạn chế cao rằng phương sai bằng với giá trị trung bình của mô hình Poisson. Mô hình hồi quy nhị thức âm truyền thống dựa trên phân phối hỗn hợp Poisson-gamma. Mô hình này phổ biến vì nó mô hình hóa tính không đồng nhất Poisson với phân bố gamma.

Mô hình hồi quy Poisson là mô hình tuyến tính tổng quát với logarit là hàm liên kết (chính tắc) và hàm phân phối Poisson là phân phối xác suất giả định của phản hồi.

Sự phân tán quá mức

Một đặc điểm của phân phối Poisson là giá trị trung bình của nó bằng với phương sai của nó. Trong một số trường hợp nhất định, sẽ thấy rằng phương sai quan sát được lớn hơn giá trị trung bình; điều này được gọi là phân tán quá mức và chỉ ra rằng mô hình không phù hợp. Một lý do phổ biến là việc bỏ sót các biến giải thích có liên quan hoặc các quan sát phụ thuộc. Trong một số trường hợp, vấn đề phân tán quá mức có thể được giải quyết bằng cách sử dụng ước tính gần khả năng hoặc phân phối nhị thức âm để thay thế.

Ver Hoef và Boveng đã mô tả sự khác biệt giữa chuẩn tính Poisson (còn được gọi là phân tán quá mức với gần khả năng xảy ra) và nhị thức âm (tương đương với gamma-Poisson) như sau: Nếu E ( Y ) = μ , mô hình gần như Poisson giả định var ( Y ) = θ μ trong khi gamma-Poisson giả sử var ( Y ) = μ (1 + κμ ), trong đó θ là tham số phân tán gần như Poisson và κ là tham số hình dạng của phân phối nhị thức âm .

Đối với cả hai mô hình, các tham số được ước tính bằng cách sử dụng các bình phương nhỏ nhất được gia tăng trọng số theo cách lặp lại. Đối với quasi-Poisson, trọng số là μ / θ . Đối với nhị thức âm, trọng số là μ / (1 + κμ ). Với μ lớn và biến thể phụ Poisson đáng kể, trọng số của nhị thức âm được giới hạn ở 1 / κ . Ver Hoef và Boveng đã thảo luận về một ví dụ trong đó họ chọn giữa hai bằng cách vẽ biểu đồ phần dư bình phương trung bình so với giá trị trung bình.

Một vấn đề phổ biến khác với hồi quy Poisson là thừa số không: nếu có hai quy trình đang hoạt động, một quy trình xác định xem không có sự kiện nào hoặc bất kỳ sự kiện nào và quy trình Poisson xác định có bao nhiêu sự kiện, sẽ có nhiều số không hơn hồi quy Poisson. dự đoán. Một ví dụ sẽ là việc phân phối thuốc lá hút trong một giờ của các thành viên của một nhóm mà một số cá nhân không hút thuốc.

Các mô hình tuyến tính tổng quát hóa khác như mô hình nhị thức phủ định hoặc mô hình thổi phồng bằng không có thể hoạt động tốt hơn trong những trường hợp này.

Ngược lại, sự phân tán dưới mức có thể gây ra vấn đề cho việc ước lượng tham số.

Thực hành ước lượng hồi quy biến giới hạn.

Chúng tôi thực hành trên phần mềm Stata

Hồi quy biến giới bạn Tobit

Stata code: tobit MUAHANG LUONG THUONG SOCON CPHI TKIEM, ll(0)

Tobit regression Number of obs = 200
Uncensored = 200
Limits: lower = 0 Left-censored = 0
upper = +inf Right-censored = 0
LR chi2(5) = 300.11
Prob > chi2 = 0.0000
Log likelihood = -95.865234 Pseudo R2 = 0.6102
MUAHANG Coef. Std. Err. t P>t [95% Conf. Interval]
LUONG .0381389 .0074983 5.09 0.000 .0233506 .0529272
THUONG .0510617 .0085203 5.99 0.000 .0342579 .0678655
SOCON .3142458 .0439669 7.15 0.000 .2275341 .4009574
CPHI .0532614 .0068991 7.72 0.000 .0396549 .0668679
TKIEM .0504835 .0137847 3.66 0.000 .0232973 .0776698
_cons -1.281291 .137234 -9.34 0.000 -1.551944 -1.010638
var(e.MUAHANG) .1527085 .0152708 .1253751 .1860008

Kết quả hồi quy Tobit cho ta kết quả tương đối đẹp

Ước lượng biến điều kiện Poisson

Stata code: poisson MUAHANG LUONG THUONG SOCON CPHI TKIEM

Được được kết quả hồi quy:

Poisson regression Number of obs = 200
LR chi2(5) = 53.59
Prob > chi2 = 0.0000
Log likelihood = -262.94451 Pseudo R2 = 0.0925
MUAHANG Coef. Std. Err. z P>z [95% Conf. Interval]
LUONG .018305 .0130299 1.40 0.160 -.0072332 .0438432
THUONG .0261509 .0152926 1.71 0.087 -.003822 .0561238
SOCON .1673873 .0804886 2.08 0.038 .0096326 .325142
CPHI .0263804 .0122856 2.15 0.032 .0023011 .0504597
TKIEM .0280932 .0249105 1.13 0.259 -.0207305 .076917
_cons -1.055779 .2740912 -3.85 0.000 -1.592988 -.5185702

Lức này lượng biến có ý nghĩa thống kê đã giảm.

Tổng hợp kết quả nghiên cứu

Bây giờ chúng ta tổng hợp lại xem kết quả nghiên cứu của 3 mô hình định lượng hồi quy ols + hồi quy tobit + hồi quy poisson. Cái nào cho ra kết quả tốt hơn.

Variable ols Tobit Poisson
_
LUONG .03813889***
THUONG .05106172***
SOCON .31424578***
CPHI .05326138***
TKIEM .05048353***
_cons -1.2812911***
MUAHANG
LUONG .03813889*** .01830497
THUONG .05106172*** .0261509*
SOCON .31424578*** .16738731**
CPHI .05326138*** .02638036**
TKIEM .05048353*** .02809321
_cons -1.2812911*** -1.0557791***
var(e.MUAH~G) .15270845***
legend: * p<.1; ** p<.05; *** p<.01

Trong trường hợp này kết quả OLS trùng với hồi quy Tobit.

Kết luận hồi quy biến giới hạn Tobit + Poisson

Trong việc hồi quy biến rời rạc như: hồi quy thư tự ordinal, hồi quy biến giới hạn Tobit… Các bạn gặp bất cứ khó khăn nào như:

Nếu gặp những trường hợp trên, các bạn đừng ngần ngại hãy liên hệ ngay với chúng tôi để được tư vấn và hỗ trợ kịp thời.

Bài viết mới

Có thể bạn thích bài viết này:

Trả lời

Email của bạn sẽ không được hiển thị công khai.