tháng 2 2014

Từ khóa: hệ phương trình đồng thời, mô hình SEM, phương trình cấu trúc, phương trình thu gọn, tính đồng thời, tác động phản hồi, biến nội sinh, hồi quy gián tiếp, hồi quy hai giai đoạn, ước lượng IV, Simultaneous Equations Models, structural equations, reduced form equations, edogeneity, 2SLS, ILS.
1. Giới thiệu về mô hình tác động đồng thời SEM
Bên cạnh hai vấn đề phổ biến liên quan đến tính nội sinh (endogeneity) của mô hình là bỏ sót biến, sai số trong biến đo lường thì vấn đề về tính đồng thời của biến (Simultaneity) cũng rất được quan tâm. Tính đồng thời của biến thường được phát hiện trong các mô hình về điểm cân bằng thị trường, mô hình tác động tương hỗ giữa các yếu tố (số lượng cảnh sát và tỉ lệ tội phạm, chẳng hạn). Bài toán liên quan đến mô hình này còn được gọi là hệ phương trình đồng thời SEMs (Simultaneous Equations Models). Hệ phương trình đồng thời là tập hợp nhiều biểu thức riêng rẻ, mà mỗi biểu thức được gọi là các phương trình cấu trúc (structural equations). Các phương trình cấu trúc này bao gồm một biến nội sinh (endogenous variable) và nhiều biến ngoại sinh (exogenous variables). Các hệ số ước lượng của các biến trong mỗi phương trình cấu trúc được gọi là các thông số cấu trúc (structural parameters). Ở đây, mỗi biến nội sinh của các phương trình cấu trúc được xác định đồng thời qua các phương trình cấu trúc khác. Do vậy, trong trường hợp này, kỹ thuật hồi quy OLS sẽ không phù hợp cho việc ước lượng hệ phương trình đồng thời này.

Ước lượng mô hình SEM trên Stata: https://vietlod.com/mo-hinh-sems-stata

2. Phương pháp ước lượng mô hình
Có 3 các để ước lượng hệ phương trình đồng thời này: (i) bình phương tối thiểu gián tiếp (ILS); (ii) ước lượng IV thông qua biến công cụ z; (iii) ước lượng hai giai đoạn tối thiểu (2SLS). Tùy vào điều kiện nhận dạng mô hình (hệ phương trình) mà người phân tích áp dụng phương pháp thích hợp. ILS với ước lượng OLS cho các phương trình thu gọn (Reduced form equations) sẽ được sử dụng khi mô hình SEMs được nhận dạng chính xác (exact identified). Ước lượng IV được sử dụng khi có một biến công cụ phù hợp làm công cụ (instrumented) cho biến nội sinh. Cuối cùng, 2SLS sẽ được sử dụng khi mô hình SEMs được nhận dạng chính xác hoặc nhận dạng quá mức (over identified).
Nhắc lại: phương trình thu gọn là phương trình biễu diễn của biến nội sinh theo các biến ngoại sinh và thành phần sai số của phương trình cấu trúc. Phương trình cấu trúc được xác định thông qua phương trình thu gọn (xác định hệ số của phương trình thu gọn, từ đó, xác định các hệ số của phương trình cấu trúc).
Giả sử gọi G là số phương trình cấu trúc có trong hệ phương trình SEMs. So sánh (hạng ma trận của SEMs) số biến loại ra khỏi phương trình cấu trúc (kí hiệu là N) với G – 1 sẽ dẫn đến các vấn đề như (i) nhận dạng quá mức (N lớn hơn G – 1); (ii) nhận dạng chính xác (N = G – 1); (iii) không nhận dạng được (N nhỏ hơn G – 1).

3. Ví dụ minh họa
Giả sử, ước lượng mô hình tham gia lao động của các phụ nữ đã lập gia đình. Hệ phương trình SEMs có dạng như sau:

Mô hình SEM về sự tham gia lao động của các phụ nữ lập gia đình
Mô hình SEM về tham gia lao động cả các phụ nữ đã lập gia đình
Sử dụng file dữ liệu mroz.dta, ước lượng mô hình SEMs trên với phương pháp 2SLS, ta có kết quả như sau:

Ước lượng 2SLS cho hours trong mô hình SEM
Ước lượng 2SLS cho hours trong mô hình SEM

Ước lượng 2SLS cho lwage trong mô hình SEM
Ước lượng 2SLS cho lwage trong mô hình SEM
Các kiểm định liên quan đến SEMs sẽ tùy thuộc vào phương pháp mà mô hình được ước lượng.
Phần trình bày trên mô tả một cách nhìn khái quát về mô hình, cũng như các phương pháp ước lượng SEMs. Một dạng SEMs thường được sử dụng trong nghiên cứu đó là ước lượng SEMs với dữ liệu bảng.

Tham khảo chính: Hồi quy 2 giai đoạn - 2SLS.
Rất nhiều mô hình kinh tế liên quan đến vấn đề biến nội sinh (endogeneity). Biến nội sinh là những biến có sự tương quan với phần dư. Đây là những vấn đề thường gặp cả trong lý thuyết về kinh tế vi mô (hàm cầu tiêu dùng chẳng hạn) và vĩ mô ví như hàm tổng cầu Keynes. Ở góc độ kinh tế lượng, sự xuất hiện biến nội sinh sẽ dẫn đến các trường hợp như bỏ biến, sai số trong biến, hoặc được xác định đồng thời qua các biến giải thích khác. Trong các trường hợp này, OLS không còn phù hợp với những thông số ước lượng tin cậy. Phương pháp tổng quát để giải quyết vấn đề này là ước lượng biến công cụ (Instrumental variables estimator), đặc biệt là ước lượng 2 giai đoạn tối thiểu 2SLS.

1. Giới thiệu phương pháp
Giả sử, tiền lương của người lao động được xác định theo biểu thức sau:
log(wage) = β0 + β1educ + β2exper + β3abil + e (1) 
Biểu thức này không thể ước lượng, bởi vì biến năng khiếu (abil) không có khả năng quan sát được. Nó có thể được ước lượng thông qua một biến đại diện cho abil, như IQ chẳng hạn. Như vậy, hiệu quả của biểu thức được ước lượng khi đó sẽ phụ thuộc vào chất lượng của biến đại diện này. Trường hợp, nếu bỏ qua biến abil thì thành phần abil sẽ được tính vào sai số u của biểu thức (2) hay còn gọi là biểu thức cấu trúc bên dưới. 
log(wage) = β0 + β1educ + β2exper + u                   (2)
Nếu educ là biến ngoại sinh (không có tương quan với phần dư) thì ước lượng OLS sẽ là ước lượng phù hợp. Ngược lại, nếu educ là biến nội sinh thì OLS sẽ bị chệch và cho kết quả không đáng tin cậy. Trường hợp này, nếu hai biến abileduc tương quan với nhau, thì ước lượng OLS sẽ không phù hợp. Khi đó, cần thiết phải có một biến mới z thỏa mãn 2 tính chất: (i) z không tương quan với u; (ii) nhưng z lại có tương quan với educ. Một biến thỏa mãn 2 tính chất trên được gọi là biến công cụ (IV). Biến z, chẳng hạn như học vấn của cha (fatheduc), hoặc nơi sinh sống gần trường đại học (nearc4), trong trường hợp này được gọi là biến công cụ cho educ. Giả sử chọn nearc4  là biến công cụ cho educ, thì biến giải thích educ được biểu diễn như sau (còn được gọi là biểu thức dạng rút gọn) 
educ = π0 + π1exper + π2nearc4 + υ          (3)
Các điều kiện của IV được thể hiện qua hệ phương trình sau:
          E(u)=0
          Cov(nearc4, u)=0
          Cov(exper, u)=0
2. Thực hiện
Giải hệ phương trình trên với các thông số dữ liệu mẫu chính là kết quả của ước lượng IV. Tuy nhiên, bài viết này không đi sâu trình bày các công thức thống kê và phương pháp toán để giải hệ này. Quá trình giải sẽ được thực hiện trên các phần mềm thống kê. Cụ thể, quy trình ước lượng công cụ (instrumental variable estimator) IV trên các phần mềm được thực hiện như sau:
  • Đầu tiên, ước lượng OLS biểu thức (3) và tính giá trị dự đoán educ_hat
  • Sau đó, thay educ ở (2) bằng educ_hat vừa tính và ước lượng OLS cho biểu thức mới này.
Kết quả ước lượng này chính là kết quả ước lượng IV. Ước lượng IV theo cách này (ước lượng thủ công) sẽ cho các hệ số ước lượng đúng, tuy nhiên sai số chuẩn của các hệ số sẽ không chính xác. Điều này sẽ được khắc phục bằng câu lệnh ivreg của STATA.
Ví dụ minh họa cho trường hợp này, Sử dụng file card.dta, xem biến (nearc4) là biến công cụ cho educ. (nearc4) là một biến giả cho thấy rằng một người lớn lên gần hơn học 4 năm đại học. Ước lượng mô hình sau: Log(wage)=β0 + β1(educ) + β2exper + β3exper2 + β3(smsa) + β3(south) + u theo 2 cách OLS và IV.
Kết quả được thể hiện trên phần mềm STATA như sau:
Ước lượng OLS và IV (2SLS) cho mô hình thu nhập của người lao động
Ước lượng OLS và IV (2SLS) cho mô hình thu nhập của người lao động
 Kết quả kiểm định tính tương quan giữa biến công cụ (nearc4) và biến nội sinh (educ)
Kiểm định sự tương quan giữa biến công cụ và biến nội sinh
Kiểm định sự tương quan của nearc4 với educ thông qua ý nghĩa thống kê của hệ số nearc4
Đây là trường hợp ước lượng IV với một biến nội sinh và một biến công cụ. Ngoài ra, còn hai trường hợp IV khác phổ biến hơn là (i) một biến nội sinh - nhiều biến công cụ; và (ii) nhiều biến nội sinh - nhiều biến công cụ. Đối với hai trường hợp còn lại này, ước lượng IV sẽ được thay bằng ước lượng hai giai đoạn tối thiểu 2SLS (2 Stage Least Square). Nguyên tắc cơ bản của hai trường hợp này là một biến nội sinh sẽ cần tối thiểu một biến công cụ. Ngoài ra, ở trường hợp một biến nội sinh - nhiều biến công cụ thì vế phải của phương trình (3) sẽ là tổ hợp tuyến tính tốt nhất của các biến công cụ.
3. Kiểm định
Sử dụng IV sẽ làm khuếch đại (inflate) phương sai của ước lượng, và làm giảm khả năng suy diễn cho ước lượng. Do vậy, việc lựa chọn ước lượng IV cho các mô hình cần đặc biệt quan tâm đến tính hiệu quả của phương pháp. Có 2 vấn đề chính liên quan đến độ tin cậy của ước lượng IV: (i) ràng buộc xác định quá mức (overidentifying restrictions); (ii) tính nội sinh của biến (endogeneity)
  • Thông thường, các biến công cụ ngoại sinh có thể không cần kiểm định. Tuy nhiên, khi số lượng biến công cụ lớn, cần thiết phải kiểm định các biến này. Quá trình kiểm định này được gọi là kiểm định ràng buộc xác định quá mức (overidentifying restrictions). Đối với trường hợp phương sai của mô hình là đồng nhất (homoskedasticity) thì có thể sử dụng thống kê Sargan; ngược lại sử dụng thống kê Hansen khi phương sai thay đổi (heteroskedasticity).
  • Đối với kiểm định tính nội sinh của biến thì nguyên tắc cơ bản của kiểm định là xét sự tương quan giữa sai số u của biểu thức cấu trúc (2) và υ của biểu thức rút gọn (3). Nếu u và υ có tương quan nhau, nghĩa là biến nội sinh trong bài (educ) là biến nội sinh.
  • Ngoài ra, cần lưu ý rằng, kiểm định tính nội sinh là cần thiết nếu các biến công cụ thỏa mãn tính chất của biến công cụ. Vì vậy, kiểm định overidentifying restrictions phải được kiểm tra trước. Nếu thỏa mãn kiểm định này thì mới tiếp tục thực hiện kiểm định tính nội sinh.
Tài liệu tham khảo:
Wooldridge, J.M, (2002); "Econometric Analysis of Cross Section and Panel Data"; The MIT Press. Cambridge; Chapter 6: Additional Single-equation Topics, tại: http://www.ats.ucla.edu/stat/stata/examples/eacspd/chapter6.htm, truy cập ngày 05/02/2014

Author Name

Biểu mẫu liên hệ

Tên

Email *

Thông báo *

Được tạo bởi Blogger.