Xử lí các dữ liệu có định dạng chuỗi trên Stata
Bên cạnh dữ liệu dạng số thì các dữ liệu có định dạng chuỗi và dữ liệu có định dạng thời gian là những định dạng dữ liệu được sử dụng phổ biến trong các phân tích thống kê. Mỗi định dạng dữ liệu khác nhau cần có những kỹ thuật xử lí khác nhau. Bài viết sau sẽ minh họa cách xử lí các dữ liệu có định dạng chuỗi trên Stata.
Ngoài các lệnh encode, egen hoặc destring để chuyển các biến dạng chuỗi thành dạng số để xử lí thì trong nhiều trường hợp chúng ta xử lí trực tiếp trên các biến dạng chuỗi. Ví dụ sau đây sẽ minh họa trường hợp này.
https://drive.google.com/open?id=1QdCrcTzVLGQEMDRZND4vg1Md_ycpSYAa