Cách hồi quy dữ liệu bảng: Pooled OLS FEM REM cực dễ

Cách hồi quy dữ liệu bảng Pooled OLS FEM REM cực dễ; Thông thường để hồi quy panel chúng ta thường sử dụng hồi quy trên các phần mềm như Stata, R, Eviews … Nhưng trong ví dụ này chúng tôi muốn giới thiệu đến các bạn hồi quy dữ liệu bảng cực dễ trên phần mềm Grelt (download Grelt), và đây là phần mềm miễn phí mà giao diện đồ hoạ nên việc sử dụng tương đối đơn giản mà hiệu quả.

HỒI QUY DỮ LIỆU BẢNG

Phân tích dữ liệu bảng là một phương pháp thống kê, được sử dụng rộng rãi trong khoa học xã hội , dịch tễ học và kinh tế lượng để phân tích dữ liệu bảng hai chiều (thường là mặt cắt ngang và dọc) . Dữ liệu thường được thu thập theo thời gian và trên các cá nhân giống nhau và sau đó một hồi quy được chạy trên hai chiều này. Phân tích đa chiều là một phương pháp kinh tế lượng trong đó dữ liệu được thu thập qua nhiều hơn hai chiều (thông thường, thời gian, cá nhân và một số chiều thứ ba).

Yit = Xit + ei + uit

  • Yit : Biến phụ thuộc
  • Xit: Biến độc lập
  • ei: Giá trị bất biến theo thời gian
  • uit: Phần sai số

Hồi quy Pooled OLS là gì ?

Đây chính là hồi quy tuyến tính OLS bình thường, khi ta hồi quy vấn đề này chúng ta không quan tâm đến dữ liệu thời gian hay dữ liệu phân nhóm.

Hồi quy FEM ( Fixed Effect Model) là gì ?

Trong thống kê , mô hình tác động cố định là mô hình thống kê trong đó các tham số của mô hình là các đại lượng cố định hoặc không ngẫu nhiên. Điều này trái ngược với mô hình tác động ngẫu nhiên và mô hình hỗn hợp trong đó tất cả hoặc một số tham số của mô hình là biến ngẫu nhiên.

Trong nhiều ứng dụng bao gồm kinh tế lượng  và thống kê sinh học , một mô hình hiệu ứng cố định đề cập đến một mô hình hồi quy trong đó nhóm phương tiện là cố định (không ngẫu nhiên) trái ngược với mô hình tác động ngẫu nhiên trong đó nhóm có nghĩa là một mẫu ngẫu nhiên từ một quần thể. Nói chung, dữ liệu có thể được nhóm theo một số yếu tố quan sát được.

Các phương tiện nhóm có thể được mô hình hóa dưới dạng các hiệu ứng cố định hoặc ngẫu nhiên cho mỗi nhóm. Trong một mô hình tác động cố định, mỗi trung bình của nhóm là một đại lượng cố định dành riêng cho nhóm.

Trong dữ liệu bảng nơi tồn tại các quan sát dọc cho cùng một đối tượng, các hiệu ứng cố định thể hiện các phương tiện cụ thể cho đối tượng. Trong phân tích dữ liệu bảng , thuật ngữ ước tính tác động cố định (còn được gọi là công cụ ước lượng bên trong ) được sử dụng để chỉ một công cụ ước tính cho các hệ số trong mô hình hồi quy bao gồm cả những tác động cố định đó (một thời gian bất biến cho mỗi đối tượng).

Hồi quy REM ( Random Effect Model) là gì ?

Trong thống kê , mô hình tác động ngẫu nhiên , còn được gọi là mô hình thành phần phương sai , là một mô hình thống kê trong đó các tham số của mô hình là các biến ngẫu nhiên . Đây là một loại mô hình tuyến tính phân cấp , giả định rằng dữ liệu đang được phân tích được rút ra từ một hệ thống phân cấp của các nhóm dân số khác nhau có sự khác biệt liên quan đến hệ thống phân cấp đó.

Trong kinh tế lượng , các mô hình hiệu ứng ngẫu nhiên được sử dụng trong phân tích bảng dữ liệu phân cấp hoặc bảng khi giả định không có tác động cố định (nó cho phép các tác động riêng lẻ). Mô hình hiệu ứng ngẫu nhiên là một trường hợp đặc biệt của mô hình hỗn hợp .

Đối lập điều này với các định nghĩa về thống kê sinh học, vì các nhà thống kê sinh học sử dụng các hiệu ứng “cố định” và “ngẫu nhiên” để lần lượt đề cập đến các hiệu ứng trung bình dân số và đối tượng cụ thể (và trong đó sau này thường được giả định là các biến tiềm ẩn , không xác định ).

Hướng dẫn hồi quy dữ liệu bảng

Quan trọng nhất trong việc sử dụng hồi quy panel trong phần mềm Grelt là việc các bạn phải thiết lập được dữ liệu bảng cho phần mềm; Đây là điều quan trọng nhất.

Thiết lập dữ liệu

Bạn mỡ dữ liệu bằng file excel bình thường, khi xuất hiện hộp thoại như trong hình các bạn chọn như sau:

Hồi quy dữ liệu bảng trên Grelt
Cấu hình dữ liệu bảng trong Grelt
  • Bước 1: Nếu bạn thiết kế dữ liệu chuẩn theo file excel thì bạn chọn OK, nếu bạn có những hàng hay cột rỗng thì bạn chọn thứ tự khác trong hình.
  • Bước 2: Hộp thoại 2 xuất hiện, hỏi bạn có thiết lập dữ liệu bảng không ? bạn chọn YES
  • Bước 3: Bạn chọn Panel như trong hình và bấm FORWARD
  • Bước 4: Bạn chọn Use index Variables để chỉ định biến làm dữ liệu bảng
  • Bước 5: Chỉ định biến Unit và Time vào, để tạo dữ liệu bảng

Sau khi đã thiết lập được dữ liệu bảng, việc bây giờ chỉ chạy hồi quy thôi. ( Viết và thiết kế hình ảnh cho bạn thì lâu, chỉ cần bạn biết 1 tí tiếng anh thì việc chọn rất nhanh)

Chạy hồi quy OLS

Model > OLS

  • Dependent: Bạn cho biến phụ thuộc vào
  • Regressor: Cho tất cả biến độc lập vào
  • Bấm OK có kết quả hồi quy
Hồi quy tuyến tính
Hồi quy OLS trên Grelt

Trong menu TEST có đầy đủ các kiểm định cần thiết khi hồi quy OLS nha các bạn

Hồi quy FEM

Model > Panel > Fixed and Radom Effect ( Chọn Fixed Effect)

Ta được kết quả:

Model 3: Fixed-effects, using 120 observations

Included 17 cross-sectional units

Time-series length: minimum 1, maximum 11

Dependent variable: ROA

  Coefficient Std. Error t-ratio p-value
const −2.47380 2.94356 −0.8404 0.4028
CAP 0.0634607 0.0260830 2.433 0.0168 **
SIZE −0.110595 0.148736 −0.7436 0.4590
VON 0.225896 0.103177 2.189 0.0310 **
LLP 0.535578 0.462374 1.158 0.2496
FEE 0.488011 0.100742 4.844 <0.0001 ***
RES −0.0172592 0.00359064 −4.807 <0.0001 ***
CR −0.261549 0.273064 −0.9578 0.3406
OC −0.0935695 0.102629 −0.9117 0.3642
Mean dependent var  0.959083 S.D. dependent var  0.626630
Sum squared resid  6.217879 S.E. of regression  0.255835
LSDV R-squared  0.866932 Within R-squared  0.523707
LSDV F(24, 95)  25.78844 P-value(F)  1.35e-31
Log-likelihood  7.331150 Akaike criterion  35.33770
Schwarz criterion  105.0250 Hannan-Quinn  63.63803
rho  0.325269 Durbin-Watson  1.146788

Joint test on named regressors -

 Test statistic: F(8, 95) = 13.0571

 with p-value = P(F(8, 95) > 13.0571) = 1.53609e-012

Test for differing group intercepts -

 Null hypothesis: The groups have a common intercept

 Test statistic: F(16, 95) = 6.44424

 with p-value = P(F(16, 95) > 6.44424) = 1.5564e-009

Hồi quy REM

Model > Panel > Fixed and Radom Effect ( Chọn Random Effect)

Model 4: Random-effects (GLS), using 120 observations

Included 17 cross-sectional units

Time-series length: minimum 1, maximum 11

Dependent variable: ROA

  Coefficient Std. Error z p-value
const −2.77038 2.20719 −1.255 0.2094
CAP 0.0593819 0.0218663 2.716 0.0066 ***
SIZE −0.0918454 0.129388 −0.7098 0.4778
VON 0.219686 0.0937576 2.343 0.0191 **
LLP 0.474522 0.397863 1.193 0.2330
FEE 0.492844 0.0919838 5.358 <0.0001 ***
RES −0.0178754 0.00331545 −5.392 <0.0001 ***
CR −0.232128 0.228377 −1.016 0.3094
OC −0.0368934 0.0909774 −0.4055 0.6851
Mean dependent var  0.959083 S.D. dependent var  0.626630
Sum squared resid  14.60491 S.E. of regression  0.361111
Log-likelihood −43.90458 Akaike criterion  105.8092
Schwarz criterion  130.8966 Hannan-Quinn  115.9973
rho  0.325269 Durbin-Watson  1.146788

            ‘Between’ variance = 0.106638

            ‘Within’ variance = 0.0654514

            mean theta = 0.679669

Joint test on named regressors -

 Asymptotic test statistic: Chi-square(8) = 153.122

 with p-value = 4.37601e-029

Breusch-Pagan test -

 Null hypothesis: Variance of the unit-specific error = 0

 Asymptotic test statistic: Chi-square(1) = 48.6802

 with p-value = 3.01295e-012

Hausman test -

 Null hypothesis: GLS estimates are consistent

 Asymptotic test statistic: Chi-square(8) = 5.48866

 with p-value = 0.704296

Lựa chọn model tốt

OLS vs FEM

Để lựa chọn mô hình FEM với OLS ta chọn kiểm định F trong hồi quy FEM

  • H0: Mô hình OLS tốt hơn mô hình FEM
  • H1: Mô hình OLS không tốt bằng mô hình FEM

Ta có, Pvalue < 0.05 = > Mô hình FEM là tốt hơn

OLS vs REM

Để lựa chọn giữa mô hình REM với mô hình OLS ta dùng kiểm định Breusch-Pagan test

  • H0: Mô hình OLS tốt hơn mô hình REM
  • H1: Mô hình OLS không tốt bằng mô hình REM

Ta có, P-value < 0.05 = > Mô hình REM tốt hơn

FEM vs REM

Để lựa chọn mô hình FEM với REM chúng ta sử dụng kiểm định Hausman test

  • H0: Mô hình REM  tốt hơn mô hình FEM
  • H1: Mô hình REM không tốt bằng mô hình FEM

Ta có, P-value  > 0.05 => Mô hình REM tốt hơn.

Từ 3 kiểm định trên ta khằng định mô hình REM là phù hợp nhất.

Kiểm định giả định hồi quy.

Trong mô mình hồi quy panel bạn cần kiểm định các giả định của hồi quy đầy đủ.

Dịch vụ hỗ trợ hồi quy dữ liệu bảng

Nếu trong vấn đề chạy định lượng hồi quy panel như:

  • Không có dữ liệu
  • Biến không có ý nghĩa thống kê
  • Bị sai phạm hồi quy

Các bạn hãy liên hệ chúng tôi để được tư vấn và hỗ trợ khắc phục kịp thời.

Bài viết mới

Có thể bạn thích bài viết này:

Trả lời

Email của bạn sẽ không được hiển thị công khai.