Ứng dụng thuật toán K-mean trên Spark để phân khúc khách hàng

Trong nghiên cứu này, quy trình phân khúc khách hàng được thực hiện bằng cách khám phá dữ liệu lịch sử giao dịch của khách hàng tại công ty bán lẻ trực tuyến, triển khai thuật toán phân cụm K-Means trên Spark cùng với việc áp dụng RFM (Recency: Lần truy cập gần đây, Frequency: Tần suất, Money: Tiền tệ). Để xác định số cụm tối ưu đã sử dụng phương pháp Elbow Method.