Minh họa thực hiện hồi quy logit chính xác trên Stata
Hồi quy logit chính xác (Exact logistic regression) được sử dụng để ước lượng mô hình với biến phụ thuộc dạng nhị phân, trong đó, log của odds được giải thích bằng tổ hợp tuyến tính của các biến độc lập. Nó được sử dụng khi cở mẫu nhỏ không đủ để thực hiện hồi quy logit thông thường theo phương pháp ML hoặc trong trường hợp các ô trong bảng tần suất được tạo bởi biến phụ thuộc với biến kết quả trống hoặc rất ít quan sát. Sở dĩ gọi phương pháp hồi quy này là hồi quy chính xác bởi vì nó không phụ thuộc vào các kết quả tiệm cận.
Giả sử chúng ta quan tâm đến các yếu tố ảnh hưởng đến khả năng được xét tuyển của một học sinh PTTH vào các trường đại học. Biến phụ thuộc (admit) ở đây có 2 giá trị là được chọn hoặc không được chọn. Các biến giải thích cho khả năng xét tuyển này bao gồm giới tính (female), có tham gia chương trình tính toán nâng cao (apcalc) ở trường PTTH hay không. Bởi vì biến phụ thuộc là biến nhị phân, do vậy, chúng ta sử dụng mô hình nhị phân để giải quyết vấn đề này. Ngoài ra, bởi vì số lượng học sinh tham gia khảo sát ít, do vậy, chúng ta cần có một phương pháp để ước lượng tập dữ liệu nhỏ này.
Tham khảo: https://vietlod.com/hoi-quy-logit-chinh-xac-stata