Để chuyển dữ liệu thành thông tin, thành kiến thức thì chúng ta phải biết đơn giản hóa dữ liệu. Có 2 cách phổ biến để đơn giản hóa dữ liệu, đó là phân tích nhân tố (factor analysis) và phân tích cluster. Khác với phân tích nhân tố là gộp các biến (items) có liên quan thành các nhân tố (factor) thì ở phân tích Cluster là phân nhóm các đối tượng có liên quan vào một nhóm đại diện bởi một biến gọi là cluster. Phân tích Cluster sẽ có hiệu quả cao khi các đối tượng trong cùng một cluster có quan hệ mật thiết (đồng nhất - homogeneous) với nhau và có sự phân biệt (heterogeneous) với các cluster khác. Tham khảo: https://vietlod.com/phuong-phap-phan-tich-cluster
Phân tích cluster được ứng dụng trong rất nhiều lĩnh vực khác nhau như: nghiên cứu hành vi xã hội, tâm lý, địa lý, kinh doanh… Ứng dụng trong nghiên cứu Marketing, phân tích Cluster giúp nhận diện các phân khúc thị trường, tìm hiểu hành vi khách hàng, nhận dạng các cơ hội cho sản phẩm mới hay lựa chọn thị trường để thử nghiệm các chiến lược khác nhau…
Phân tích cluster bao gồm 2 phương pháp phân tích chủ yếu là phương pháp phân tích cluster thứ bậc (Hierarchical clustering) và phương pháp phân tích cluster không thứ bậc (nonhierarchical clustering).