Khắc phục nội sinh: Hồi quy GMM

Khắc phục nội sinh hồi quy GMM (Generalized method of moment); Trong vấn đề kinh tế, hiện tượng nội sinh thường xuyên xảy ra, để khắc phục hiện tượng này thông thường chúng ta sẽ hồi quy 2 giai đoạn (2sls), hồi quy 3 giai đoạn (3sls) và cuối cũng là hồi quy GMM; Thực chất ra chúng ta chia thành 2 loại: (1) biến công cụ tĩnh ( 2SLS + 3SLS), (2) biến công cụ động (GMM).

Trong ví dụ này chúng tôi hướng dẫn các bạn khắc phụ nội sinh bằng phương pháp hồi quy GMM cho dữ liệu bảng và biến công cụ là động.

Hồi quy GMM

Hồi quy GMM là gì ?

Trong kinh tế lượng và thống kê , phương pháp tổng quát thời điểm ( GMM ) là một phương pháp chung để ước lượng các tham số trong mô hình thống kê . Thông thường, nó được áp dụng trong bối cảnh mô hình bán tham số, trong đó tham số quan tâm là hữu hạn chiều, trong khi hình dạng đầy đủ của hàm phân phối dữ liệu có thể không được biết và do đó không thể áp dụng ước tính khả năng tối đa .

Phương pháp này yêu cầu một số điều kiện thời điểm nhất định phải được chỉ định cho mô hình. Các điều kiện thời điểm này là các hàm của các tham số mô hình và dữ liệu, sao cho kỳ vọng của chúng bằng không tại các giá trị thực của tham số. Sau đó, phương pháp GMM giảm thiểu một tiêu chuẩn nhất định của giá trị trung bình mẫu của các điều kiện thời điểm, và do đó có thể được coi như một trường hợp đặc biệt của ước lượng khoảng cách tối thiểu .

Các công cụ ước tính GMM được biết là nhất quán , tiệm cận bình thường và hiệu quả trong nhóm tất cả các công cụ ước tính không sử dụng bất kỳ thông tin bổ sung nào ngoài thông tin có trong các điều kiện thời điểm. GMM được Lars Peter Hansen ủng hộ vào năm 1982 như một sự tổng quát hóa của phương pháp khoảnh khắc ,  được Karl Pearson giới thiệu vào năm 1894. Tuy nhiên, những ước lượng này tương đương về mặt toán học với những ước lượng dựa trên “điều kiện trực giao” (Sargan, 1958, 1959) hoặc “các phương trình ước lượng không chệch hướng” (Huber, 1967; Wang và cộng sự, 1997).

Có 2 loại hồi quy GMM

  • Hồi quy D-GMM ( Difference )

DGMM > SGMM <=> Time > Group 

  • Hồi quy S-GMM ( System GMM)

DGMM < SGMM <=> Time < Group

3 Kiểm định cần thiết.

Đây là một vấn đề quan trọng, nhưng rất nhiều bạn đã bỏ quan kiểm định này.

Nhiều biến công cụ

Bowsher 2002). Thật vậy, Sargan (1958) đã xác định mà không cần sự hỗ trợ của máy tính hiện đại rằng sai số trong thử nghiệm của ông là “tỷ lệ thuận với số lượng các biến công cụ, do đó, nếu muốn sử dụng các xấp xỉ tiệm cận thì con số này phải nhỏ ”.

Thật không may, dường như có rất ít hướng dẫn từ các tài liệu về số lượng biến công cụ là “quá nhiều” (Ruud 2000, 515), một phần vì sự thiên vị vẫn xuất hiện ở một mức độ nào đó ngay cả khi số lượng nhạc cụ rất ít. Trong một mô phỏng về sự khác biệt GMM trên bảng điều khiển 8 × 100, Windmeijer (2005) báo cáo rằng việc cắt số lượng thiết bị từ 28 xuống 13 đã làm giảm độ chệch trung bình trong ước tính hai bước của tham số quan tâm xuống 40%. Mô phỏng các tấm có kích thước khác nhau trong Roodman (2009) cho kết quả tương tự.

Ví dụ: việc tăng số lượng công cụ từ 5 lên chỉ 10 trong hồi quy GMM hệ thống trên bảng điều khiển 5 × 100 sẽ làm tăng ước tính của một tham số có giá trị thực là 0,80 từ 0,80 lên 0,86.

Nhiều biến công cụ thì làm cho sai lệch tăng cao.

Tự tương quan

Arellano–Bond test for autocorrelation

(abar) Để hiện kiểm định Arellano-Bond (1991) cho tự tương quan. Thử nghiệm ban đầu được đề xuất cho một công cụ ước tính dữ liệu bảng điều khiển động Phương pháp tổng quát tuyến tính cụ thể, nhưng khá chung chung về khả năng ứng dụng của nó – tổng quát hơn dwstat, durbina, bgodfrey và xtserial.

Nó có thể được áp dụng cho các hồi quy GMM tuyến tính nói chung và do đó cho các hồi quy bình phương nhỏ nhất thông thường (OLS) và bình phương nhỏ nhất hai giai đoạn (2SLS), có thể được coi là các trường hợp đặc biệt của GMM tuyến tính. Nó thích hợp cho cả hồi quy chuỗi thời gian và chuỗi thời gian cắt ngang (bảng điều khiển). Nó cũng có thể được thực hiện nhất quán khi có nhiều mẫu hiệp phương sai khác nhau.

Cụ thể, chúng ta sẽ chạy sau hồi quy, ivreg, ivreg2 và ivreg2, gmm trong các biến thể “đồng dạng” (homoskedastic), mạnh mẽ và cụm của chúng. Nó cũng sẽ chạy sau newey và newey2. Trong bối cảnh hồi quy Arellano-Bond GMM, được chạy trên những điểm khác biệt đầu tiên, AR (1) sẽ được mong đợi và do đó kết quả kiểm tra Arellano-Bond AR (1) thường bị bỏ qua trong bối cảnh đó. Kiểm tra AR (2) về phần dư trong các khác biệt đầu tiên được sử dụng để phát hiện AR (1) trong các biến mức cơ bản.

Nhưng trong các bối cảnh khác, chẳng hạn như hồi quy OLS đơn giản ở các cấp, kiểm tra AR (1) có liên quan. Hồi quy có thể không thích hợp cho các hồi quy hiệu ứng cố định cho các mô hình động, giả sử rằng chúng được thực hiện thông qua một phép biến đổi độ lệch trung bình. Điều này là do kiểm định Arellano-Bond AR () giả định rằng các biến bên phải không “được xác định sau”, tức là không tương quan với các lỗi trong tương lai. Trong cài đặt động, các giá trị tương lai của bộ hồi quy có thể phụ thuộc vào các lỗi trong tương lai. Và sau khi chuyển đổi sai lệch trung bình/

Cho rằng, dữ liệu sẽ chính xác nếu mô hình không tương quan ở bậc 2

  • H0: Mô hình không bị tự tương quan ở bậc 2
  • H1: Mô hình bị tự tương quan ở bậc 2

Biến công cụ yếu

Bài kiểm tra Sargan – Hansen hoặc Sargan’s J kiểm tra là một kiểm tra thống kê được sử dụng để kiểm tra các hạn chế xác định quá mức trong một mô hình thống kê . Nó được đề xuất bởi John Denis Sargan vào năm 1958,  và một số biến thể được ông đưa ra vào năm 1975.  Lars Peter Hansen đã làm việc lại thông qua các dẫn xuất và cho thấy rằng nó có thể được mở rộng thành GMM phi tuyến tính chung trong một bối cảnh chuỗi thời gian .

Kiểm tra Sargan dựa trên giả định rằng các tham số mô hình được xác định thông qua các hạn chế tiên nghiệm đối với các hệ số và kiểm tra tính hợp lệ của các hạn chế xác định quá mức. Thống kê kiểm định có thể được tính toán từ phần dư từ hồi quy biến công cụ bằng cách xây dựng dạng bậc hai dựa trên tích chéo của phần dư và các biến ngoại sinh;  : 132–33  Theo giả thuyết rỗng rằng các hạn chế xác định quá mức là hợp lệ, thống kê được phân phối tiệm cận dưới dạng một biến chi- bình phương với(m – k) bậc tự do (ở đâu m là số lượng công cụ và k là số lượng các biến nội sinh).

Nếu dịch tường tiếng anh sang tiếng việt thì chúng ta sẽ gọi là “Kiểm định xác định hạn chế quá mức”, Các bạn thì sao tôi không biết, riêng tôi đọc thì không hiểu gì hết ! Thôi chúng ta đặt giả định theo sự hiểu biết của mình vậy.

Cách 1:

  • H0: Mô hình có hiện tượng nội sinh
  • H1: Mô hình không có hiện tượng nội sinh

Cách 2:  

  • H0: Biến công cụ và biến nội sinh được sử dụng là phù hợp
  • H1: Biến công cụ và biến nội sinh là không phù hợp

Ứng dụng hồi quy GMM trên Stata.

Riêng về hồi quy GMM này, thì không có phần mềm nào mạnh mẽ và cơ động hơn Stata cho tính luôn cả R vào nữa. ( Đây là ý kiến cá nhân của  tôi), nên trong ví dụ này chúng tôi sẽ sử dụng lệnh xtabond2 trên Stata để ước lượng GMM.

Hồi quy S-GMM

xtabond2 ROA l.ROA CAP SIZE FEE RES , gmm(l.ROA) two

Dynamic panel-data estimation, two-step system GMM
Group variable: MA Number of obs = 189
Time variable : Year Number of groups = 19
Number of instruments = 55 Obs per group: min = 9
Wald chi2(5) = 260.79 avg = 9.95
Prob > chi2 = 0.000 max = 10
ROA Coef. Std. Err. z P>z [95% Conf. Interval]
ROA
L1. .2567153 .0228804 11.22 0.000 .2118706 .30156
CAP .0665344 .0068602 9.70 0.000 .0530887 .0799802
SIZE .1699919 .039486 4.31 0.000 .0926009 .247383
FEE .6094969 .0590258 10.33 0.000 .4938084 .7251853
RES -.0178099 .0026651 -6.68 0.000 -.0230334 -.0125864
_cons -3.539841 1.020385 -3.47 0.001 -5.53976 -1.539923

Kiểm định sau GMM

Arellano-Bond test for AR(1) in first differences: z = -1.17 Pr > z = 0.241
Arellano-Bond test for AR(2) in first differences: z = -0.72 Pr > z = 0.475
Sargan test of overid. restrictions: chi2(49) = 23.75 Prob > chi2 = 0.999
(Not robust, but not weakened by many instruments.)
Hansen test of overid. restrictions: chi2(49) = 14.40 Prob > chi2 = 1.000
(Robust, but weakened by many instruments.)

Nhận xét:

  • Biến công cụ trong mô hình là 55 và trong khi Group là 19 = > Sử dụng quá nhiều biến công cụ
  • Arellano-Bond test for AR(2), có P-value >0.05 => Mô hình không bị tự tương quan
  • Hansen test, có P-value > 0.05 => Có hiện tượng nội sinh

Hồi quy D-GMM

xtabond2 ROA l.ROA CAP SIZE FEE RES , gmm(l.ROA) two nol

Dynamic panel-data estimation, two-step difference GMM
Group variable: MA Number of obs = 170
Time variable : Year Number of groups = 19
Number of instruments = 45 Obs per group: min = 8
Wald chi2(5) = 953.65 avg = 8.95
Prob > chi2 = 0.000 max = 9
ROA Coef. Std. Err. z P>z [95% Conf. Interval]
ROA
L1. .1764671 .0136259 12.95 0.000 .1497609 .2031733
CAP .0695161 .0057559 12.08 0.000 .0582348 .0807974
SIZE .3779454 .0700683 5.39 0.000 .2406142 .5152767
FEE .4303263 .0833699 5.16 0.000 .2669244 .5937283
RES -.017629 .0030517 -5.78 0.000 -.0236102 -.0116477

Kiểm định sau hồi quy

Arellano-Bond test for AR(1) in first differences: z = -1.21 Pr > z = 0.228
Arellano-Bond test for AR(2) in first differences: z = -1.92 Pr > z = 0.054
Sargan test of overid. restrictions: chi2(40) = 14.85 Prob > chi2 = 1.000
(Not robust, but not weakened by many instruments.)
Hansen test of overid. restrictions: chi2(40) = 15.54 Prob > chi2 = 1.000
(Robust, but weakened by many instruments.)

Nhận xét:

  • Biến công cụ trong mô hình là 45 và trong khi Group là 19 = > Sử dụng quá nhiều biến công cụ
  • Arellano-Bond test for AR(2), có P-value >0.05 => Mô hình không bị tự tương quan
  • Hansen test, có P-value > 0.05 => Có hiện tượng nội sinh

Dịch vụ hướng dẫn khắc phục nội sinh

  • Nếu mô hình bạn bị nhiều biến công cụ
  • Nếu mô hình của bạn bị tương quan chuỗi
  • Nếu mô hình của bạn không có nội sinh
  • Nếu lượng biến có ý nghĩa thống kê ít
  • Không biết cách chạy câu lệnh xtabond2
  • Không đọc hiểu được output

Nếu các bạn gặp khó khăn như trên, các bạn đừng ngần ngại hãy liên hệ ngay với chúng tôi, để được tư vấn và thực hiện nhanh chóng.

Bài viết mới

Có thể bạn thích bài viết này:

Trả lời

Email của bạn sẽ không được hiển thị công khai.