Minh họa thực hiện hồi quy khoảng trên Stata
Hồi quy khoảng (Interval Regression) được sử dụng để ước lượng mô hình có các biến phụ thuộc bị kiểm duyệt. Dữ liệu bị kiểm duyệt trong hồi quy khoảng là các kiểm duyệt khoảng. Điều đó có nghĩa chúng ta biết các quan sát nằm trong khoảng giá trị nào nhưng không thể biết chính xác giá cụ thể của mỗi quan sát. Hồi quy khoảng là trường hợp tổng quát của hồi quy kiểm duyệt (censored regression).
Ví dụ: chẳng hạn chúng ta muốn biết thu nhập thực của người lao động (triệu/tháng) theo các mức học vấn, số năm kinh nghiệm cũng như loại hình kinh tế mà người lao động làm việc. Trong trường hợp này, chúng ta không thể biết được giá trị thu thập thực của từng người lao động, nhưng chúng ta có thể biết được giá trị thu nhập thực có thể rơi vào các khoảng như nhỏ hơn 5 triệu, từ 5 triệu đến 10 triệu, từ 10 triệu đến 20 triệu, từ 20 triệu đến 50 triệu và trên 50 triệu. Đối với dữ liệu thu thập này, thì rõ ràng dữ liệu vừa bị kiểm duyệt trái (nhỏ hơn 5 triệu), kiểm duyệt phải (lớn hơn 50 triệu), đồng thời trong mỗi khoảng giá trị của các quan sát bị kiểm duyệt trái và phải đồng thời. Trong trường hợp này, chúng ta không sử dụng mô hình hồi quy kiểm duyệt thông thường, mà phải sử dụng hồi quy kiểm duyệt tổng quát hay còn gọi là hồi quy khoảng.
Tham khảo: https://vietlod.com/hoi-quy-khoang-interval-regression-stata