Kiểm tra tương quan chuỗi & khắc phục tự tương quan; Đây là tên gọi khác nhau nhưng chung một hiện tượng. Đây là giả định thứ 4 trong 7 giả định cơ bản của hồi quy tuyến tính, giả định này có nội dung như sau:” trong hồi quy tuyến tính các sai số của quan sát thì không tương quan với nhau”.
Còn một điều quan trọng trước khi các bạn kiểm định tương quan chuỗi (Serial Correlation) hay tự tương quan (Autocorrelation), đó là hiện tượng này chỉ áp dụng cho mô hình có dữ liệu thời gian, còn ngược lại bạn không cần kiểm tra hiện tượng này.
Tương quan chuỗi
Định nghĩa tương quan chuỗi
Tương quan chuỗi xảy ra trong một chuỗi thời gian khi một biến và một phiên bản trễ của chính nó (ví dụ: một biến tại thời điểm T và tại thời điểm T-1) được quan sát thấy có tương quan với nhau trong các khoảng thời gian.
Các mẫu lặp lại thường cho thấy mối tương quan nối tiếp khi mức độ của một biến ảnh hưởng đến mức độ tương lai của nó. Trong tài chính, mối tương quan này được các nhà phân tích kỹ thuật sử dụng để xác định mức giá trong quá khứ của chứng khoán dự đoán giá tương lai tốt như thế nào.
Tương quan chuỗi tương tự như các khái niệm thống kê về tự tương quan hoặc tương quan trễ.
Đặc điểm của tương quan chuỗi
Tương quan chuỗi (còn gọi là Tự tương quan) là nơi các điều khoản lỗi trong chuỗi thời gian chuyển từ thời kỳ này sang thời kỳ khác. Nói cách khác, sai số trong một khoảng thời gian a tương quan với sai số trong một khoảng thời gian tiếp theo b . Ví dụ: đánh giá thấp lợi nhuận của một quý có thể dẫn đến đánh giá thấp lợi nhuận cho các quý tiếp theo. Điều này có thể dẫn đến vô số vấn đề , bao gồm:
- Ước tính bình phương tối thiểu thông thường không hiệu quả và bất kỳ dự báo nào dựa trên những ước tính đó. Một công cụ ước tính hiệu quả cung cấp cho bạn nhiều thông tin nhất về một mẫu; các công cụ ước tính kém hiệu quả có thể hoạt động tốt, nhưng yêu cầu kích thước mẫu lớn hơn nhiều để làm như vậy.
- Mức độ phù hợp quá mức (đối với chuỗi thời gian có tương quan nối tiếp dương và một biến độc lập phát triển theo thời gian).
- Sai số chuẩn quá nhỏ (đối với chuỗi thời gian có tương quan nối tiếp dương và một biến độc lập phát triển theo thời gian).
- Số liệu thống kê T quá lớn.
- Kết quả dương tính giả đối với các hệ số hồi quy có ý nghĩa . Nói cách khác, hệ số hồi quy dường như có ý nghĩa thống kê khi nó không có ý nghĩa thống kê.
Các loại tự tương quan
Tự tương quan bậc 1: Dạng tự tương quan phổ biến nhất là tương quan nối tiếp bậc nhất , có thể dương hoặc âm.
- Tương quan nối tiếp dương là trường hợp một sai số dương trong một khoảng thời gian được chuyển thành một sai số dương cho kỳ tiếp theo.
- Tương quan nối tiếp âm là trường hợp lỗi âm trong một khoảng thời gian được chuyển thành lỗi âm cho kỳ sau.
Tự tương quan bậc 2: Tương quan nối tiếp bậc hai là nơi một lỗi ảnh hưởng đến dữ liệu trong hai khoảng thời gian sau đó. Điều này có thể xảy ra khi dữ liệu của bạn có tính thời vụ . Đơn đặt hàng cao hơn đơn hàng thứ hai có xảy ra, nhưng chúng rất hiếm.
Các kiểm tra hiện tượng tự tương quan
- Một phần dư âm . Vẽ đồ thị của e t so với t và tìm các cụm phần dư liên tiếp ở một phía của đường 0. Bạn cũng có thể thử thêm dòng Lowess , như trong hình bên dưới.
- Một bài kiểm tra Durbin-Watson .
- Kiểm tra hệ số nhân tử Lagrange.
- Kiểm tra hộp Ljung .
- Một biểu đồ tương quan . Một mẫu trong kết quả là một dấu hiệu cho hiện tượng tự tương quan. Bất kỳ giá trị nào trên 0 nên được xem xét với sự nghi ngờ.
- Thống kê Moran’s I , tương tự như hệ số tương quan .
Ứng dụng thực tế
Kiểm định hiện tượng tự tương quan
Kiểm định Durbin-Watson
Ta có giả định thống kê như sau:
- Ho: Không có hiện tượng tự tương quan bậc 1
- H1: Có hiện tượng tự tương quan quan bậc 1
> dwtest(hoiquy)
Durbin-Watson test
data: hoiquy
DW = 1.0741, p-value = 4.105e-15
alternative hypothesis: true autocorrelation is greater than 0
Tao có P-value < 0.05, Mô hình bị hiện tượng tương quan chuỗi
Đây là kiểm định chính cho các bạn nào liên quan đến hồi quy.
Breusch-Godfrey test
> bgtest(hoiquy)
Breusch-Godfrey test for serial correlation of order up to 1
data: hoiquy
LM test = 62.615, df = 1, p-value = 2.514e-15
Pvalue < 0.05, có hiện tượng tự tương quan
Kiểm định Lagrange Multiplier
Được kiểm tra tương quan sau các mô hình liên quan đến thời gian như: arima, var, vecm …
Kiểm định Ljung Box Test
Kiểm định này cũng liên quan tới mô hình thời gian: arima, arma, arch, grach …
> Box.test(ZCORE, lag = 1, type = "Ljung")
Box-Ljung test
data: ZCORE
X-squared = 182.47, df = 1, p-value < 2.2e-16
Vẽ đồ thị tương quan chuỗi
Khắc phục sai phạm
Để khắc phục hiện tượng này, thì có nhiều phương pháp, mà phương pháp thông dụng và hiệu quả nhất vẫn là Newey West
> coeftest(hoiquy, vcov = NeweyWest(hoiquy))
t test of coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.8496724 3.1752421 2.1572 0.031895 *
AGE -0.1125697 0.0358947 -3.1361 0.001907 **
CS -0.7029181 0.1151894 -6.1023 3.727e-09 ***
TDT -0.0503614 0.0275090 -1.8307 0.068273 .
SIZE -0.1020819 0.0972564 -1.0496 0.294858
EBTDT -0.0108831 0.0021415 -5.0820 7.093e-07 ***
LIQ 1.1194701 0.2297318 4.8729 1.902e-06 ***
—
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Kết luận
Hiện tưởng tương quan chuỗi hay còn gọi là tự tương quan, là một trong những vấn đề phổ biến trong nghiên cứu định lượng, đặc biệt là trong vấn đề kinh tế, nếu bạn có gặp khó khăn gì trong vấn đề khắc phục sai phạm này, các bạn đừng ngần ngại hãy liên hệ ngay với chúng tôi để được tư vấn và hỗ trợ kịp thời
Bài viết mới
[NHẬN] Thiết kế nghiên cứu triển vọng tiến cứu
Thiết kế nghiên cứu triển vọng tiến cứu có nghiên cứu khoa học các cấp, [...]
Th12
Hỗ trợ Nghiên cứu định lượng : cao học thạc sĩ tiến sĩ nghiên cứu viên 2022
Hỗ trợ nghiên cứu định lượng: luận văn cao học, luận văn thạc sĩ, luận [...]
Th6
Thế nào là nghiên cứu cắt ngang cho tiến sĩ
Thế nào là nghiên cứu cắt ngang (Cross-sectional studies) cho tiến sĩ; Chúng bài viết [...]
Th5
Kiểm định t-test với giá trị trung bình SPSS
Kiểm định t-test với giá trị trung bình SPSS, đây là một trường hơp trong [...]
Th9
[Tải Về] Điều tra mức sống hộ gia đình VN VHLSS 2016-2018
[Tải Về] Điều tra mức sống hộ gia đình VN VHLSS 2016-2018; Với bộ dữ [...]
Th9
Bias là gì ? Sự thiên vị nghiên cứu khoa học
Bias là gì ? Sự thiên vị nghiên cứu khoa học; Trong nghiên cứu khoa [...]
Th6
Decision Tree – Thuật toán cây quyết định là gì ?
Decision Tree – Thuật toán cây quyết định là gì ? Đây là một thuật [...]
Th9
[DV] Phân tích dữ liệu với AI (Trí tuệ nhân tạo)
Phân tích dữ liệu với AI (Trí tuệ nhân tạo), Trong thời đại kết nối máy [...]
Th9
Cách dùng thang đo Thurstone
Cách dùng thang do Thurstone; Cũng giống như thang đo likert hay thang đo guttman, [...]
Th6
Có thể bạn thích bài viết này:
[NHẬN] Thiết kế nghiên cứu triển vọng tiến cứu
Thiết kế nghiên cứu triển vọng tiến cứu có nghiên cứu khoa học các cấp, [...]
Th12
Kiểm định t-test với giá trị trung bình SPSS
Kiểm định t-test với giá trị trung bình SPSS, đây là một trường hơp trong [...]
Th9
Nghiên cứu khoa học – Nghiên cứu viên cần biết
Nghiên cứu khoa học – Nghiên cứu viên cần biết, trong bài này chúng ta [...]
Th9
Tìm hiểu về thang đo likert 5 bậc trọn bộ
Tìm hiểu về thang đo likert 5 bậc trọn bộ, trong mức độ khảo sát [...]
Th9
[Tải Về] Điều tra mức sống hộ gia đình VN VHLSS 2016-2018
[Tải Về] Điều tra mức sống hộ gia đình VN VHLSS 2016-2018; Với bộ dữ [...]
Th9
Decision Tree – Thuật toán cây quyết định là gì ?
Decision Tree – Thuật toán cây quyết định là gì ? Đây là một thuật [...]
Th9
[DV] Phân tích dữ liệu với AI (Trí tuệ nhân tạo)
Phân tích dữ liệu với AI (Trí tuệ nhân tạo), Trong thời đại kết nối máy [...]
Th9
Bias là gì ? Sự thiên vị nghiên cứu khoa học
Bias là gì ? Sự thiên vị nghiên cứu khoa học; Trong nghiên cứu khoa [...]
Th6