tháng 3 2019

Các mô hình dữ liệu bảng tuyến tính cổ điển



Các mô hình tác động ngẫu nhiên (REM) hoặc mô hình tác động cố định (FEM) được gọi chung là mô hình dữ liệu bảng tuyến tính cổ điển, hoặc đôi khi còn gọi là mô hình dữ liệu bảng tuyến tính TĨNH. Các đặc tính “cổ điển” hoặc “tĩnh” của mô hình dữ liệu bảng trên sẽ lần lượt được hệ thống lại ở phần trình bày bên dưới.

Đầu tiên, chúng ta bắt đầu ôn lại các giả định của mô hình dữ liệu bảng tuyến tính cổ điển (classic linear panel model). Tiếp đến, từ giả định của mô hình chung chúng ta sẽ lần lượt đi vào từng mô hình cụ thể (Fixed effect, Random effect và Random coefficient) với các phương pháp ước lượng FE (classic FE, LSDV, FD), phương pháp RE và RC.
https://vietlod.com/mo-hinh-du-lieu-bang-tuyen-tinh-co-dien

Các hạn chế của mô hình FEM vs REM


Mô hình FEM vs REM còn được gọi là mô hình dữ liệu bảng tuyến tính cổ điển. Mô hình FEM vs REM là 2 mô hình phổ biến để ước lượng dữ liệu bảng. Tuy nhiên, cả 2 mô hình FEM vs REM đều gặp các vấn đề về tính ngoại sinh ngặt, tính nội sinh của biến, cũng như các vấn đề liên quan đến tính chất động của mô hình dữ liệu bảng. Bài viết sau sẽ làm rõ các hạn chế của 2 mô hình FEM vs REM này
https://vietlod.com/han-che-cua-mo-hinh-fem-rem

Kiểm định tự tương quan và ràng buộc quá mức trong GMM



Kiểm định Sargan/Hansen được sử dụng để kiểm tra sự hợp lý của các biến đại diện sau ước lượng GMM. Ngoài ra, Arellano và Bond phát triển một kiểm định khác để phát hiện các độ trễ không phù hợp của các biện đại diện, gọi là sự tự tương quan trong thành phần sai số đo lường (idiosyncratic disturbance term), εit. Dĩ nhiên sai số chung, εit, của mô hình được giả định tự tương quan bởi vì nó bao gồm các ảnh hưởng cố định, và các ước lượng được xây dựng để loại bỏ các ảnh hưởng này. Nhưng nếu vit tự tương quan với chính nó ở độ trễ bằng 1, chẳng hạn, yi,t–2 thì các biến nội sinh sẽ có tương quan với νi,t–1 trong thành phần sai phân của sai số, Δεit=νit–νi,t–1.
https://vietlod.com/kiem-dinh-tu-tuong-quan-va-rang-buoc-qua-muc

Diễn giải câu lệnh xtabond2 trên Stata



Câu lệnh xtabond2 được sử dụng rất phổ biến trong các nghiên cứu sử dụng ước lượng GMM. Câu lệnh xtabond2 cho phép thực hiện cả lượng S-GMM và D-GMM. Tuy nhiên, việc hiểu và thực hiện được các thiết lập phù hợp cho mô hình ước lượng không phải là điều dễ dàng với nhiều người. Nhất là các thiết lập liên quan đến lựa chọn độ trễ của biến các công cụ dạng sai phân và dạng gốc (level) cũng như dạng phương trình mà chúng cần mô tả. Các thiết lập không đúng có thể dẫn đến các kết quả không phù hợp trong kiểm định Sargan/Hansen... Bài viết bên dưới diễn giải chi tiết ý nghĩa các tùy chọn quan trọng trong câu lệnh xtabond2, việc hiểu các tùy chọn này là điều kiện cần thiết để có một kết quả ước lượng GMM phù hợp.
https://vietlod.com/dien-giai-cau-lenh-xtabond2-trong-uoc-luong-gmm

Tổng hợp các kiểm định quan trọng trong dữ liệu bảng



Trong phân tích dữ liệu bảng, tính dừng của các biến chuỗi cần được xem xét kiểm định đầu tiên. Tiếp đến là kiểm tra các tác động riêng rẻ của mỗi đối tượng hoặc của điểm thời gian là cố định hoặc ngẫu nhiên, dồng thời cũng nên quan tâm đến tính ổn định của hệ số ước lượng theo các nhóm qua kiểm định Chow – Test. Tính nội sinh của biến cũng cần được xem xét khi chúng ta có lý do nghi ngờ tồn tại một/các biến có mối quan hệ chặt với một số biến trong mô hình. Sau khi hoàn tất các kiểm định trên thì mô hình mới được ước lượng. Kết quả ước lượng sau khi thỏa mãn các kiểm định về phương sai thay đổi, sự tự tương quan sẽ được sử dụng để phân tích, suy diễn thống kê. Bài viết này bao gồm 5 mục như sau:


  • Mục 1 sẽ trình bày về kiểm định nghiệm đơn vị;
  • Mục 2: kiểm tra tính ngẫu nhiên của các tác động riêng rẻ để lựa chọn FEM hay REM;
  • Mục 3 sẽ kiểm tra tính ổn định của các hệ số ước lượng qua Chow test;
  • Mục 4: kiểm tra biến nội sinh trong mô hình;
  • Mục 5 sẽ đề cập đến vấn đề phương sai thay đổi và tự tương quan của phần dư trong mô hình.


https://vietlod.com/tong-hop-cac-kiem-dinh-trong-du-lieu-bang

Sử dụng GMM khi nào?


Có 2 vấn đề quan trọng tiềm ẩn liên quan đến thành phần sai số trong một mô hình dữ liệu bảng, đó là:


  1. Sự tương quan giữa các biến giải thích với tác động riêng rẽ;
  2. Sự tương quan giữa các biến giải thích với thành phần sai số nhiễu;

Sự tồn tại của 1 trong 2 (hoặc cả 2) vấn đề này làm cho kết quả ước lượng của OLS sẽ bị chệch hoặc không hiệu quả, đó chính là lí do chọn GMM làm phương pháp ước lượng thay thế.

Thật vậy, để giải quyết 2 vấn đề này, trong mô hình bảng tĩnh tuyến tính chúng ta có thể sử dụng ước lượng tác động cố định (LSDV, FD hoặc FE) để loại bỏ thành phần tác động riêng rẽ (vấn đề 1); hoặc sử dụng ước lượng tác động ngẫu nhiên để kiểm soát vấn đề 2.
https://vietlod.com/van-de-cua-fem-rem-va-li-do-chon-gmm

Cở sở chọn GMM so với ước lượng FE, RE



Mỗi dạng mô hình sẽ có những phương pháp ước lượng phù hợp. Mô hình động sẽ có phương pháp động để ước lượng và ngược lại mô hình tĩnh sẽ có phương pháp tĩnh để ước lượng. Trong trường hợp dữ liệu bảng, phương pháp động được biết đến nhiều nhất chính là GMM (IV-GMM, D-GMM, S-GMM) và phương pháp tĩnh thường được sử dụng là các phương pháp ước lượng bảng tuyến tính cổ điển (LSDV, FE/FD, RE). Việc sử dụng các phương pháp ước lượng không phù hợp cho mô hình đang xét có thể dẫn đến các vấn đề về độ tin cậy (bị chệch), tính hiệu quả của kết quả ước lượng. Sau đây là phần lý do lựa chọn S-GMM so với các phương pháp ước lượng dữ liệu bảng. Nội dung gồm 2 phần: phần đầu là cơ sở lựa chọn giữa GMM với nhóm phương pháp ước lượng bảng tĩnh tuyến tính, tiếp đến là cơ sở lựa chọn S-GMM với D-GMM.
https://vietlod.com/co-so-lua-chon-gmm-vs-ols-fem-rem

Các kiểm định cần thiết cho mô hình GMM



GMM là một phương pháp ước lượng tổng quát. Ước lượng GMM có thể giải quyết các vấn đề liên quan đến tính nội sinh của biến, vấn đề tự tương quan của phần dư, khắc phục sự tương quan giữa các tác động riêng rẻ với các biến giải thích trong mô hình bảng tĩnh tuyến tính. Tuy nhiên, trước khi lựa chọn phương pháp GMM, chúng ta cần thiết phải kiểm tra tính dừng cũng như mối quan hệ đồng kết hợp giữa biến phụ thuộc và các biến giải thích. Nếu các biến này không tồn tại bất kì mối quan hệ đồng kết hợp nào thì ước lượng GMM sẽ là phương pháp phù hợp. Tiếp đến, để đảm bảo tính hiệu quả và độ tin cậy của kết quả ước lượng thì rất cần thiết phải kiểm tra các giả thuyết liên quan như sự tự tương quan của phần dư, biến đại diện yếu, tính vững của hệ số ước lượng. Phần tổng hợp các kiểm định trong GMM sau đây bao gồm 6 kiểm định liên quan, bắt đầu từ kiểm định sự tự tương quan của phần dư, kiểm tra tính phù hợp của mô hình & biến đại diện, kiểm tra tính hợp lý của các biến đại diện sai phân, kiểm tra sự cần thiết của biến giả thời gian, kiểm tra tính vững của hệ số ước lượng và cuối cùng là kiểm tra các biến đại diện yếu.
https://vietlod.com/tong-hop-cac-kiem-dinh-trong-gmm

Kiểm định mối quan hệ đồng tích hợp trong dữ liệu bảng



Tiếp theo bài kiểm tra tính dừng của biến chuỗi thời gian trong mô hình dữ liệu bảng, cần thiết kiểm tra mối quan hệ đồng kết hợp của các biến chuỗi bởi điều này có thể dẫn đến vấn đề hồi quy mơ hồ (spurious regression) khi các biến không có mối quan hệ đồng kết hợp (cointegration). Xác định rõ mối quan hệ đồng kết hợp sẽ tiền đề quan trọng giúp chúng ta lựa chọn phương pháp ước lượng phù hợp. Phần trình bày bên dưới được biên dịch từ tài liệu (Baltagi, 2008 trang 378) phần Cointegration nhằm làm rõ hơn khái niệm đồng kết hợp.
https://vietlod.com/kiem-tra-moi-quan-he-dong-ket-hop

Với ý nghĩa tương tự bộ dữ liệu PCI, bộ dữ liệu chỉ số PAPI cũng được sử dụng để đánh giá hiệu quả quản trị và hành chính công cấp tỉnh theo phương pháp chỉ số liên tục bắt đầu từ năm 2011 cho 63 tỉnh/TP trên cả nước. Do vậy, Bộ dữ liệu chỉ số PAPI cũng rất thích hợp cho các nghiên cứu về mối quan hệ đồng thời giữa tăng trưởng kinh tế, thu hút đầu tư nước ngoài, chất lượng đầu tư cũng như các vấn đề liên quan đến bất bình đẳng, nghèo đói với chất lượng chính phủ thông qua các chỉ tiêu về tính minh bạch, tham nhũng. Tuy nhiên, có sự khác biệt giữa bộ dữ liệu chỉ số PAPI so với bộ dữ liệu PCI ở chổ đối tượng khảo sát của bộ dữ liệu PAPI là người dân sử dụng dịch vụ công còn đối tượng của bộ dữ liệu PCI là các doanh nghiệp đang hoạt động trên địa bàn. Vì lí do này, bộ dữ liệu chỉ số PAPI có thể được sử dụng đối chứng với các vấn đề đã được nêu ở bộ dữ liệu PCI nhằm tăng tính thuyết phục cho phương pháp.

Bộ chỉ số PAPI là tên viết tắt tiếng anh của bộ chỉ số về Hiệu quả Quản trị và Hành chính công cấp tỉnh ở Việt Nam. Chỉ số PAPI là công cụ phản ánh tiếng nói người dân về mức độ hiệu quả điều hành, quản lý nhà nước, thực thi chính sách và cung ứng dịch vụ công của chính quyền các cấp. Tính đến hết năm 2016, Chỉ số PAPI đã được thực hiện qua 8 năm, trong đó 6 năm liên tiếp (2011-2016) khảo sát PAPI được thực hiện trên tất cả 63 tỉnh, thành phố trong cả nước.

Chỉ số PAPI là tấm gương phản chiếu hiệu quả của bộ máy công quyền trong quản trị và hành chính công ở những lĩnh vực người dân quan tâm và tương tác thường xuyên nhất với chính quyền địa phương. PAPI góp phần tạo động lực cho đội ngũ cán bộ, công chức, viên chức ở nhiều ngành, nhiều cấp nâng cao hiệu quả quản trị công, quản lý nhà nước và cung ứng dịch vụ công từ trung ương đến địa phương. Chỉ số PAPI và những phát hiện nghiên cứu hướng tới mục tiêu đóng góp cho những nỗ lực của Việt Nam trong việc xây dựng một hệ thống công vụ phục vụ Nhân dân, liêm chính, hành động quyết liệt, và kiến tạo phát triển. PAPI cũng cung cấp dẫn chứng để đại diện dân cử, báo giới và các tổ chức xã hội sử dụng trong quá trình vận động các cấp chính quyền đưa ra các biện pháp thiết thực nhằm đáp ứng tốt hơn nhu cầu của người dân.

Tham khảo: https://vietlod.com/tai-bo-du-lieu-chi-so-papi-2011-2016

Với việc được định kì xây dựng hàng năm cho 63 tỉnh, bộ dữ liệu chỉ số PCI kết hợp với bộ dữ liệu các chỉ số vĩ mô của tổng cục thống kê trở nên cực kì hữu ích cho các nhà nghiên cứu trong các vấn đề về mối quan hệ đồng thời giữa tăng trưởng kinh tế, thu hút đầu tư nước ngoài, chất lượng đầu tư cũng như các vấn đề liên quan đến bất bình đẳng, nghèo đói với chất lượng chính phủ thông qua các chỉ tiêu về tính minh bạch, tham nhũng… của bộ dữ liệu chỉ số PCI.



Bộ dữ liệu chỉ số PCI (Provincial Competitiveness Index) là bộ dữ liệu về năng lực cạnh tranh cấp tỉnh (PCI). Bộ dữ liệu chỉ số PCI là một sản phẩm của sự hợp tác giưa Phòng Thương mại và Công nghiệp Việt Nam (VCCI) độc lập xây dựng và thực hiện Chỉ số PCI với sự hỗ trợ của Cơ quan Phát triển Quốc tế Hoa Kỳ (USAID). Chỉ số PCI được xây dựng nhằm đánh giá môi trường kinh doanh, chất lượng điều hành kinh tế và nỗ lực cải cách hành chính của chính quyền các tỉnh, thành phố của Việt Nam, qua đó thúc đẩy sự phát triển của khu vực kinh tế tư nhân trong nước.

Tham khảo: https://vietlod.com/tai-bo-du-lieu-chi-pci-2005-2016

Bộ dữ liệu SME là bộ dữ liệu chính thức và rất phù hợp để nghiên cứu về các đặc điểm của các doanh nghiệp vừa và nhỏ (DNVVN) tại Việt Nam.



Khá nhiều các nghiên cứu đã được thực hiện thành công dựa trên bộ dữ liệu này, có thể kể đến như:

  • Phân tích vai trò của xuất khẩu lên năng suất của DNVVN ở Việt Nam
  • Đánh giá sự năng động của các DNNVV Việt Nam về năng suất, quy mô doanh nghiệp, đào tạo
  • Các nhân tố tác động đến sự phát triển của các DNVVN tại Việt Nam
  • Các nhân tố ảnh hưởng tới hoạt động đổi mới và kết quả hoạt động của DNNVV tại Việt Nam
  • Sự tiến triển của các DNVVN ở Việt Nam ảnh hưởng đến phúc lợi của nhân viên như thế nào?
  • Các yếu tố thúc đẩy sự thành lập và đóng ở các DNVVN.
  • Tham nhũng ở cấp công ty ở Việt Nam
  • Khoảng cách lương giữa các DNVVN tại Việt Nam
  • Khoảng cách lương trong khu vực phi chính thức giữa các công ty vi mô Việt Nam
  • Lợi ích của hợp thức hóa: Bằng chứng từ các DNNVV sản xuất ở Việt Nam
  • Tăng trưởng và sự sống còn của DNVVN ở Việt Nam: Sự hỗ trợ của Chính phủ có phải là vấn đề?
  • Tiếp cận tín dụng ở các DNVVN
  • Vốn: Khó khăn đối với DNVVN của Việt Nam


Tham khảo: https://vietlod.com/tai-bo-du-lieu-sme

Tương tự bộ dữ liệu khảo sát mức sống dân cư Việt Nam (VHLSS), bộ dữ liệu VARHS cũng được sử dụng rất rộng rãi trong các nghiên cứu về  bất bình đẳng, nghèo đói, các nghiên cứu phân tích về chi tiêu (giáo dục, y tế, đời sống) của các nông hộ cũng như các yếu tố ảnh hưởng đến thu nhập, tiết kiệm của hộ như kiều hối, di cư… Bộ dữ liệu này cũng đề cập khá chi tiết đến các chiến lược ứng phó với rủi ro trong sản xuất nông nghiệp của người nông dân Việt Nam. Ngoài ra, điểm nổi bật nhất của các bộ dữ liệu VARHS chính là lấy mẫu lặp lại nên rất thuận lợi cho việc phân tích các mối quan hệ dựa trên dữ liệu bảng.



Bộ dữ liệu VARHS là tên viết tắt của Vietnam Access to Resources Household Survey với tên gọi là bộ dữ liệu điều tra tiếp cận nguồn lực hộ gia đình nông thôn Việt Nam – VARHS. Bộ dữ liệu VARHS được thực hiện nhằm tìm hiểu hành vi, các cơ hội và các cản trở mà các hộ nông dân Việt Nam đang phải đối mặt.

Mục đích tổng quát của các cuộc điều tra VARHS là tìm hiểu sâu hơn thực trạng kinh tế của các hộ gia đình tại khu vực nông thôn Việt Nam với trọng tâm tập trung vào việc tiếp cận và sử dụng các nguồn lực sản xuất (vốn vật chất, tài chính, con người và xã hội).

Tham khảo: https://vietlod.com/tai-bo-du-lieu-varhs

Author Name

Biểu mẫu liên hệ

Tên

Email *

Thông báo *

Được tạo bởi Blogger.