Sử dụng các chỉ số dưới _n và _N trên Stata
Các chỉ số dưới _n và _N là các biến hệ thống của Stata. _n cho biết vị trí của quan sát hiện tại trong dữ liệu. Bạn có thể sử dụng _n để tạo một biến số thứ tự cho mỗi quan sát. Trong khi _n cho biết số thứ tự của mỗi quan sát thì _N chính là giá trị lớn nhất của _n. Nếu không có tùy chọn by thì _N chính là giá trị của _n cho quan sát cuối cùng.
Chúng ta cũng có thể sử dụng _n như các chỉ số dưới – vốn được sử dụng rất phổ biến trong các công thức thống kê. Các chỉ số dưới rất hữu ích trong các dữ liệu có cấu trúc phân cấp (hierarchical structures) hoặc các loại dữ liệu bảng hay dữ liệu thời gian.
Việc sử dụng _n và _N giúp cho việc xử lí và trích lọc các biến trên bộ dữ liệu khảo sát mức sống dân cư Việt Nam (VHLSS) trở nên rõ ràng và dễ dàng hơn. Bài viết bên dưới sẽ giới thiệu chi tiết về cách sử dụng các chỉ số dưới để tạo lập các biến liên quan đến mỗi thành viên trong hộ, đặc biệt là chủ hộ và các biến chung cho hộ dựa trên bộ dữ liệu VHLSS 2012.
https://drive.google.com/open?id=1Psa0UFxRZ9n_w4rDRfGT7uPKLDu2QPdy