Điểm dị biệt là gì? Có nên loại bỏ điểm dị biệt?
Các điểm dị biệt (outliers) là những điểm có giá trị khác xa so với phần còn lại của dữ liệu. Việc xác định giá trị của điểm dị biệt là chủ quan. Trong khi đó, có một vài tiêu chuẩn để xác định một điểm có phải là điểm dị biệt hay không.
Có hai loại điểm dị biệt – univariate (tạm dịch là dị biệt đơn lẻ) và multivariate outliers (dị biệt kết hợp).
Các điểm dị biệt được tìm thấy rất nhiều trong các nghiên cứu, nó có thể làm méo mó tính chuẩn hóa của dữ liệu, vậy chúng ta có nên loại bỏ các điểm dị biệt này không?
Tham khảo: https://vietlod.com/diem-di-biet-spss