Cách hồi quy dữ liệu bảng Pooled OLS FEM REM cực dễ; Thông thường để hồi quy panel chúng ta thường sử dụng hồi quy trên các phần mềm như Stata, R, Eviews … Nhưng trong ví dụ này chúng tôi muốn giới thiệu đến các bạn hồi quy dữ liệu bảng cực dễ trên phần mềm Grelt (download Grelt), và đây là phần mềm miễn phí mà giao diện đồ hoạ nên việc sử dụng tương đối đơn giản mà hiệu quả.
HỒI QUY DỮ LIỆU BẢNG
Phân tích dữ liệu bảng là một phương pháp thống kê, được sử dụng rộng rãi trong khoa học xã hội , dịch tễ học và kinh tế lượng để phân tích dữ liệu bảng hai chiều (thường là mặt cắt ngang và dọc) . Dữ liệu thường được thu thập theo thời gian và trên các cá nhân giống nhau và sau đó một hồi quy được chạy trên hai chiều này. Phân tích đa chiều là một phương pháp kinh tế lượng trong đó dữ liệu được thu thập qua nhiều hơn hai chiều (thông thường, thời gian, cá nhân và một số chiều thứ ba).
Yit = Xit + ei + uit
- Yit : Biến phụ thuộc
- Xit: Biến độc lập
- ei: Giá trị bất biến theo thời gian
- uit: Phần sai số
Hồi quy Pooled OLS là gì ?
Đây chính là hồi quy tuyến tính OLS bình thường, khi ta hồi quy vấn đề này chúng ta không quan tâm đến dữ liệu thời gian hay dữ liệu phân nhóm.
Hồi quy FEM ( Fixed Effect Model) là gì ?
Trong thống kê , mô hình tác động cố định là mô hình thống kê trong đó các tham số của mô hình là các đại lượng cố định hoặc không ngẫu nhiên. Điều này trái ngược với mô hình tác động ngẫu nhiên và mô hình hỗn hợp trong đó tất cả hoặc một số tham số của mô hình là biến ngẫu nhiên.
Trong nhiều ứng dụng bao gồm kinh tế lượng và thống kê sinh học , một mô hình hiệu ứng cố định đề cập đến một mô hình hồi quy trong đó nhóm phương tiện là cố định (không ngẫu nhiên) trái ngược với mô hình tác động ngẫu nhiên trong đó nhóm có nghĩa là một mẫu ngẫu nhiên từ một quần thể. Nói chung, dữ liệu có thể được nhóm theo một số yếu tố quan sát được.
Các phương tiện nhóm có thể được mô hình hóa dưới dạng các hiệu ứng cố định hoặc ngẫu nhiên cho mỗi nhóm. Trong một mô hình tác động cố định, mỗi trung bình của nhóm là một đại lượng cố định dành riêng cho nhóm.
Trong dữ liệu bảng nơi tồn tại các quan sát dọc cho cùng một đối tượng, các hiệu ứng cố định thể hiện các phương tiện cụ thể cho đối tượng. Trong phân tích dữ liệu bảng , thuật ngữ ước tính tác động cố định (còn được gọi là công cụ ước lượng bên trong ) được sử dụng để chỉ một công cụ ước tính cho các hệ số trong mô hình hồi quy bao gồm cả những tác động cố định đó (một thời gian bất biến cho mỗi đối tượng).
Hồi quy REM ( Random Effect Model) là gì ?
Trong thống kê , mô hình tác động ngẫu nhiên , còn được gọi là mô hình thành phần phương sai , là một mô hình thống kê trong đó các tham số của mô hình là các biến ngẫu nhiên . Đây là một loại mô hình tuyến tính phân cấp , giả định rằng dữ liệu đang được phân tích được rút ra từ một hệ thống phân cấp của các nhóm dân số khác nhau có sự khác biệt liên quan đến hệ thống phân cấp đó.
Trong kinh tế lượng , các mô hình hiệu ứng ngẫu nhiên được sử dụng trong phân tích bảng dữ liệu phân cấp hoặc bảng khi giả định không có tác động cố định (nó cho phép các tác động riêng lẻ). Mô hình hiệu ứng ngẫu nhiên là một trường hợp đặc biệt của mô hình hỗn hợp .
Đối lập điều này với các định nghĩa về thống kê sinh học, vì các nhà thống kê sinh học sử dụng các hiệu ứng “cố định” và “ngẫu nhiên” để lần lượt đề cập đến các hiệu ứng trung bình dân số và đối tượng cụ thể (và trong đó sau này thường được giả định là các biến tiềm ẩn , không xác định ).
Hướng dẫn hồi quy dữ liệu bảng
Quan trọng nhất trong việc sử dụng hồi quy panel trong phần mềm Grelt là việc các bạn phải thiết lập được dữ liệu bảng cho phần mềm; Đây là điều quan trọng nhất.
Thiết lập dữ liệu
Bạn mỡ dữ liệu bằng file excel bình thường, khi xuất hiện hộp thoại như trong hình các bạn chọn như sau:
- Bước 1: Nếu bạn thiết kế dữ liệu chuẩn theo file excel thì bạn chọn OK, nếu bạn có những hàng hay cột rỗng thì bạn chọn thứ tự khác trong hình.
- Bước 2: Hộp thoại 2 xuất hiện, hỏi bạn có thiết lập dữ liệu bảng không ? bạn chọn YES
- Bước 3: Bạn chọn Panel như trong hình và bấm FORWARD
- Bước 4: Bạn chọn Use index Variables để chỉ định biến làm dữ liệu bảng
- Bước 5: Chỉ định biến Unit và Time vào, để tạo dữ liệu bảng
Sau khi đã thiết lập được dữ liệu bảng, việc bây giờ chỉ chạy hồi quy thôi. ( Viết và thiết kế hình ảnh cho bạn thì lâu, chỉ cần bạn biết 1 tí tiếng anh thì việc chọn rất nhanh)
Chạy hồi quy OLS
Model > OLS
- Dependent: Bạn cho biến phụ thuộc vào
- Regressor: Cho tất cả biến độc lập vào
- Bấm OK có kết quả hồi quy
Trong menu TEST có đầy đủ các kiểm định cần thiết khi hồi quy OLS nha các bạn
Hồi quy FEM
Model > Panel > Fixed and Radom Effect ( Chọn Fixed Effect)
Ta được kết quả:
Model 3: Fixed-effects, using 120 observations
Included 17 cross-sectional units
Time-series length: minimum 1, maximum 11
Dependent variable: ROA
Coefficient | Std. Error | t-ratio | p-value | ||
const | −2.47380 | 2.94356 | −0.8404 | 0.4028 | |
CAP | 0.0634607 | 0.0260830 | 2.433 | 0.0168 | ** |
SIZE | −0.110595 | 0.148736 | −0.7436 | 0.4590 | |
VON | 0.225896 | 0.103177 | 2.189 | 0.0310 | ** |
LLP | 0.535578 | 0.462374 | 1.158 | 0.2496 | |
FEE | 0.488011 | 0.100742 | 4.844 | <0.0001 | *** |
RES | −0.0172592 | 0.00359064 | −4.807 | <0.0001 | *** |
CR | −0.261549 | 0.273064 | −0.9578 | 0.3406 | |
OC | −0.0935695 | 0.102629 | −0.9117 | 0.3642 |
Mean dependent var | 0.959083 | S.D. dependent var | 0.626630 | |
Sum squared resid | 6.217879 | S.E. of regression | 0.255835 | |
LSDV R-squared | 0.866932 | Within R-squared | 0.523707 | |
LSDV F(24, 95) | 25.78844 | P-value(F) | 1.35e-31 | |
Log-likelihood | 7.331150 | Akaike criterion | 35.33770 | |
Schwarz criterion | 105.0250 | Hannan-Quinn | 63.63803 | |
rho | 0.325269 | Durbin-Watson | 1.146788 |
Joint test on named regressors -
Test statistic: F(8, 95) = 13.0571
with p-value = P(F(8, 95) > 13.0571) = 1.53609e-012
Test for differing group intercepts -
Null hypothesis: The groups have a common intercept
Test statistic: F(16, 95) = 6.44424
with p-value = P(F(16, 95) > 6.44424) = 1.5564e-009
Hồi quy REM
Model > Panel > Fixed and Radom Effect ( Chọn Random Effect)
Model 4: Random-effects (GLS), using 120 observations
Included 17 cross-sectional units
Time-series length: minimum 1, maximum 11
Dependent variable: ROA
Coefficient | Std. Error | z | p-value | ||
const | −2.77038 | 2.20719 | −1.255 | 0.2094 | |
CAP | 0.0593819 | 0.0218663 | 2.716 | 0.0066 | *** |
SIZE | −0.0918454 | 0.129388 | −0.7098 | 0.4778 | |
VON | 0.219686 | 0.0937576 | 2.343 | 0.0191 | ** |
LLP | 0.474522 | 0.397863 | 1.193 | 0.2330 | |
FEE | 0.492844 | 0.0919838 | 5.358 | <0.0001 | *** |
RES | −0.0178754 | 0.00331545 | −5.392 | <0.0001 | *** |
CR | −0.232128 | 0.228377 | −1.016 | 0.3094 | |
OC | −0.0368934 | 0.0909774 | −0.4055 | 0.6851 |
Mean dependent var | 0.959083 | S.D. dependent var | 0.626630 | |
Sum squared resid | 14.60491 | S.E. of regression | 0.361111 | |
Log-likelihood | −43.90458 | Akaike criterion | 105.8092 | |
Schwarz criterion | 130.8966 | Hannan-Quinn | 115.9973 | |
rho | 0.325269 | Durbin-Watson | 1.146788 |
‘Between’ variance = 0.106638
‘Within’ variance = 0.0654514
mean theta = 0.679669
Joint test on named regressors -
Asymptotic test statistic: Chi-square(8) = 153.122
with p-value = 4.37601e-029
Breusch-Pagan test -
Null hypothesis: Variance of the unit-specific error = 0
Asymptotic test statistic: Chi-square(1) = 48.6802
with p-value = 3.01295e-012
Hausman test -
Null hypothesis: GLS estimates are consistent
Asymptotic test statistic: Chi-square(8) = 5.48866
with p-value = 0.704296
Lựa chọn model tốt
OLS vs FEM
Để lựa chọn mô hình FEM với OLS ta chọn kiểm định F trong hồi quy FEM
- H0: Mô hình OLS tốt hơn mô hình FEM
- H1: Mô hình OLS không tốt bằng mô hình FEM
Ta có, Pvalue < 0.05 = > Mô hình FEM là tốt hơn
OLS vs REM
Để lựa chọn giữa mô hình REM với mô hình OLS ta dùng kiểm định Breusch-Pagan test
- H0: Mô hình OLS tốt hơn mô hình REM
- H1: Mô hình OLS không tốt bằng mô hình REM
Ta có, P-value < 0.05 = > Mô hình REM tốt hơn
FEM vs REM
Để lựa chọn mô hình FEM với REM chúng ta sử dụng kiểm định Hausman test
- H0: Mô hình REM tốt hơn mô hình FEM
- H1: Mô hình REM không tốt bằng mô hình FEM
Ta có, P-value > 0.05 => Mô hình REM tốt hơn.
Từ 3 kiểm định trên ta khằng định mô hình REM là phù hợp nhất.
Kiểm định giả định hồi quy.
Trong mô mình hồi quy panel bạn cần kiểm định các giả định của hồi quy đầy đủ.
- Đa cộng tuyến
- Phương sai thay đổi
- Tương quan chuỗi
- Dữ liệu cắt ngang
- Sai số phân phối chuẩn
Dịch vụ hỗ trợ hồi quy dữ liệu bảng
Nếu trong vấn đề chạy định lượng hồi quy panel như:
- Không có dữ liệu
- Biến không có ý nghĩa thống kê
- Bị sai phạm hồi quy
Các bạn hãy liên hệ chúng tôi để được tư vấn và hỗ trợ khắc phục kịp thời.
Có thể bạn thích bài viết này:
Micom test trong phân tích đa nhóm Multigroup Analysis (MGA)
Micom test trong phân tích đa nhóm của SmartPLS (Partial Least Squares Structural Equation Modeling), [...]
Th9
2 Lý do chọn đề tài: tính cấp thiết & ý nghĩa khoa học
Lý do chọn đề tài: tính cấp thiết & ý nghĩa khoa học, Viết phần [...]
Th9
Số liệu biến rời rạc Có thể bạn chưa biết
Biến rời rạc là loại biến số trong thống kê chỉ có thể nhận một [...]
Th9
Báo giá Phiếu khảo sát doanh nghiệp: online + trực tiếp
Báo giá, phiếu khảo sát doanh nghiệp. Khảo sát doanh nghiệp, còn gọi là “business [...]
Th9
Mô hình phân tích tài chính Fama & French 5 yếu tố
Mô hình phân tích tài chính Fama & French 5 yếu tố, sau khi mô [...]
Th9
gấp: Làm đẹp số liệu thứ cấp – Xử lý dữ liệu sơ cấp lấy liền
Chúng tôi https://chaydinhluong.com giới thiệu đến quý khách hàng dịch vụ làm đẹp số liệu [...]
Th9
[Đào tạo] khoá học xử lý số liệu & phân tích định lượng Stata SmartPLS SPSS R-Studio
Khoá học xử lý số liệu & phân tích định lượng Stata SmartPLS SPSS R-Studio [...]
Th5
Chỉnh sửa định dạng văn bản in ấn tài liệu lưu hành nội bộ Thủ Đức TpHCM
Chỉnh sửa định dạng văn bản in ấn tài liệu lưu hành nội bộ Thủ [...]
Th4