Ước lượng SUR (Seemingly Unrelated Regression)

Tham khảo chính từ: Ước lượng SUR trên Stata

1. Giới thiệu

Trong các nghiên cứu thực tiễn thường gặp nhiều các hợp hai hay nhiều biểu thức có mối quan hệ với nhau theo một số cách cụ thể. Có 4 dạng hệ thống mà các biểu thức có liên quan với nhau như sau:

Hệ thống biểuthức gần như không liên quan (Seemingly unrelated equation system)
Hệ thống biểuthức đồng thời (Simultaneous equation system)
Hệ thống biểu thức đệ quy (Recursive equation system)
Hệ thống đệ quy Block (Block recursive system)

Bài viết này tập trung trình bày vấn đề về hệ thống các biểu thức gần như không liên quan.

2. Hệ thống biểu thức gần như không liên quan

2.1 Giới thiệu

Trong hệ thống các biểu thức gần như không liên quan, sự liên quan lẫn nhau giữa các biểu thức xảy ra vì các lý do sau:

Thành phần sai số trong các biểu thức khác nhau có mối liên quan với nhau
Điều này xảy ra nếu có những yếu tố chung không quan sát được có tác động ảnh hưởng đến các biến giải thích (độc lập) trong mô hình.
Các tham số trong các biểu thức khác nhau có liên quan với nhau.
Điều này xảy ra nếu một hoặc một số tham số giống nhau cùng xuất hiện ở một số biểu thức, hoặc nếu một hoặc các tham số trong một biểu thức có mối quan hệ tuyến tính hoặc phi tuyến với những tham số khác trong các biểu thức còn lại khác.

Các biểu thức của mô hình này thường gặp trong các vấn đề kinh tế như: (i) Các hàm cầu đầu tư của các doanh nghiệp trong một ngành; (ii) Các hàm cầu cầu tiêu dùng của các nhóm sản phẩm từ hình thành hành vi tối đa hóa hữu dụng; (iii) Các hàm cầu nguyên vật liệu đầu vào hình thành từ vấn đề tối thiểu hóa chi phí hoặc tối đa hóa lợi nhuận...

2.2 Đặc điểm

Xét ví dụ sau về mối liên hệ giữa điểm số phần đọc (read) trong mối quan hệ với các điểm số khác như điểm toán (math), điểm viết (write) và điểm xã hội (socst) trong sự liên hệ của một hệ thống các môn học khác, chẳng hạn môn khoa học. Theo đó, điểm khoa học của một học sinh bị ảnh hưởng bởi giới tính (female), điểm toán (math) của từng học sinh. Hệ thống 2 biểu thức này được thể hiện như sau:

read = b0 + b1*math + b2*write + b_3*socst + e_r
science = g0 + g1*female + g2*math + e_s

Trong đó: b0, b1, b2, và b3 là các hệ số cắt và độ dốc cho read; e_r là phần dư của phương trình cho read; g0, g1, và g2 là các hệ số cắt và độ dốc cho science; e_s là phần dư của phương trình cho science

Giả sử, chúng ta có M biểu thức được xem là có mối quan hệ với nhau (vì thành phần sai số bị tương quan với nhau).

Hệ thống các biểu thức có mối liên hệ với nhau

Một cách tổng quát, hệ thống gồm M biểu thức hồi quy dường như không liên quan này có thể được viết lại dưới dạng ma trận như sau:

Ma trận hệ thống các biểu thức SUR

Trong đó yi là một vectơ cột Tx1 của các quan sát cho biến phụ thuộc thứ i; Xi là một ma trận TxK của các quan sát cho các biến giải thích; bi là vectơ cột Kx1 của các tham số cho biểu thức thứ i; và mi là vectơ cột Tx1 của thành phần sai số cho biểu thức thứ i. T là số quan sát, K là số biến giải thích, M là số phương trình.

Đây là dạng tổng quát của biểu thức ước lượng. Việc kết hợp M biểu thức riêng rẻ vào một biểu thức tổng quát như trên được thực hiện bằng cách xếp chồng các vectơ và ma trận như hình bên dưới:

2.3 Các giả định

Mô hình này được dựa trên các giả định sau:

Dạng hàm của biểu thức tổng quát là dạng tuyến tính theo các tham số:
Thành phần sai số của biểu thức tổng quát có giá trị trung bình bằng 0:
Phân bố của sai số trong biểu thức tổng quát không có dạng phân bố hình cầu (nonspherical) và thỏa mãn các giả định sau: (a) Phương sai sai số của mỗi biểu thức riêng rẻ là không đổi. (b) Phương sai của sai số có thể khác nhau ở các biểu thức riêng rẻ. (c) Các sai số của mỗi biểu thức riêng rẻ là không có tự tương quan. (d) Các sai số giữa các biểu thức khác nhau là có sự tương quan đồng thời.
Thành phần sai số của biểu thức tổng quát có phân phối chuẩn:
Thành phần sai số của biểu thức tổng quát không có tương quan với các biến giải thích trong xác định ma trận phương sai - hiệp phương sai trên.

Ma trận sigma, S, là một ma trận MxM bao gồm phương sai và hiệp phương sai của M biểu thức riêng rẻ; ma trận đơn vị I và tích Kronecker của S và I, được trình bày ở hình sau:

Ma trận phương sai - hiệp phương sai

2.3. Phương pháp ước lượng

Để ước lượng các tham số của mô hình SUR, cần thiết phải lựa chọn một ước lượng thích hợp. Chúng ta xem xét 4 loại ước lượng sau:

Ước lượng bình phương thông thường tối thiểu (OLS): ước lượng OLS là không thiên chệch nhưng không hiệu quả, và không phải là một ước lượng hợp lý cực đại (MLE)
Ước lượng bình phương tổng quát tối thiểu (GLS): Ước lượng GLS là một ước lượng không khả thi, bởi vì các phần tử của ma trận phương sai – hiệp phương sai, W, trong biểu thức tổng quát là chưa được biết.
Ước lượng bình phương tổng quát tổi thiểu khả thi (FGLS) theo phương pháp Zellner hay còn gọi là ước lượng SUR của Zellner hay gọi tắt là ước lượng SUR. Ước lượng FGLS là tiệm cận với ước lượng GLS và cũng là một ước lượng hợp lý tối đa (MLE). Vì vậy, nó cũng có những tính chất tiệm cận với sự không thiên chệch, hiệu quả và nhất quán
Ước lượng bình phương tổng quát tối thiểu khả thi lặp (ITGLS): Một ước lượng khác thay thế ước lượng FGLS là ước lượng lặp FGLS (IFGLS). Ước lượng lặp IFGLS được sử dụng phổ biến nhất được gọi là ước lượng lặp SUR của Zellner hay ITSUR.

Các công thức ước lượng của các phương pháp

Ước lượng ITSUR có tính chất tiệm cận như SUR (FGLS). Tuy nhiên, có những tranh luận vẫn đang tiếp diễn về tính hiệu quả của ước lượng ITSUR hay SUR tốt hơn đối với cở mẫu nhỏ. Đa phần các nhà kinh tế lượng có thiên hướng sử dụng ITSUR nhiều hơn. Mô hình SUR suy biến có thể giải thích cho điều này.

2.4 Kết quả ước lượng

Sử dụng Phần mềm STATA cho số liệu hsb2 bao gồm 200 quan sát là các học sinh về điểm số các môn học/kỹ năng như đọc (read), viết (write), toán (math), khoa học (science), xã hội (socst). Hệ thống 2 biểu thức này được thể hiện như sau:

read = b0 + b1*math + b2*write + b_3*socst + e_r

science = g0 + g1*female + g2*math + e_s

Phương pháp OLS

Kết quả hồi quy OLS cho biểu thức read

Kết quả hồi quy OLS cho biểu thức science

Phương pháp FGLS hay SUR

Ước lượng SUR hay FGLS

Phương pháp ITSUR (đôi khi còn gọi là ISUR hoặc IFGLS)

Ước lượng ITSUR

Xem thêm các mô hình DỮ LIỆU BẢNG

Labels

Layout

Post Style

Technology

Ước lượng SUR (Seemingly Unrelated Regression)

Author Name

Biểu mẫu liên hệ