0
0
Lập trình
Admin Team
Admin Teamtechmely

Kết nối Tableau với R: Khám Phá Sức Mạnh Từ Dữ Liệu

Đăng vào 7 tháng trước

• 5 phút đọc

Giới thiệu

Tableau là công cụ trực quan hóa dữ liệu hàng đầu hiện nay, trong khi R là ngôn ngữ thống kê mã nguồn mở được sử dụng rộng rãi bởi các nhà phân tích dữ liệu và nhà khoa học dữ liệu. Việc kết nối Tableau với R không chỉ giúp tận dụng sức mạnh phân tích của R mà còn mang lại trải nghiệm trực quan tuyệt vời cho người dùng. Trong bài viết này, chúng ta sẽ tìm hiểu cách kết nối Tableau với R và tạo ra một bảng điều khiển phân khúc khách hàng hiệu quả.

Tại sao nên kết nối Tableau với R?

Việc kết nối Tableau với R mang lại nhiều lợi ích:

  • Giao diện thân thiện với người dùng: Tableau cung cấp giao diện dễ sử dụng, giúp người dùng không chuyên cũng có thể hiểu và sử dụng các phân tích phức tạp.
  • Sức mạnh phân tích: R cho phép thực hiện các mô hình học máy phức tạp, từ đó kết quả có thể được hiển thị trong Tableau một cách dễ hiểu.
  • Tạo giá trị cho doanh nghiệp: Người dùng có thể chạy và phân tích các mô hình phức tạp mà không cần viết mã R.

Cách kết nối Tableau với R

Để kết nối Tableau với R, bạn cần thực hiện các bước sau:

  1. Cài đặt gói Rserve: Mở R console và gõ:

    r Copy
    install.packages("Rserve")
    Rserve()

    Nếu thành công, bạn sẽ thấy thông báo ‘Starting Rserve...’.

  2. Cấu hình Tableau: Mở Tableau, vào Help > Settings & Performance > Manage External Service Connections. Trong hộp thoại, chọn ‘localhost’ cho Server và nhập ‘6311’ cho Port. Nhấn Test Connection để kiểm tra kết nối.

Mục tiêu của bài viết

Mục tiêu của bài viết này là tạo một bảng điều khiển Tableau giúp một nhà quản lý bán buôn phân khúc khách hàng bằng cách sử dụng các thuật toán phân cụm trong R và trực quan hóa kết quả để tìm ra các mô hình hữu ích cho việc ra quyết định.

Datasets sử dụng

Dataset cho bài viết này có thể tải về định dạng CSV từ kho dữ liệu UCI Machine Learning. Bạn có thể tìm thấy liên kết ‘Data Folder’ ở góc trên bên trái của trang.

Thiết kế bảng điều khiển phân khúc khách hàng trong Tableau

Tải dữ liệu vào Tableau

Trong dataset này, mỗi hàng chứa thông tin về một khách hàng của nhà bán buôn, bao gồm kênh, khu vực và số tiền đã chi tiêu cho các danh mục sản phẩm khác nhau. Mở file CSV, thêm một cột tên là ‘Customer ID’ và điền từ 1 đến 440. Sử dụng tùy chọn ‘Text File’ trong Tableau để kết nối với file CSV.

Tạo các tham số

Chúng ta sẽ phân cụm người dùng dựa trên mức chi tiêu bằng thuật toán k-means. Để làm điều này, hãy tạo một tham số trong Tableau:

  1. Nhấp chuột phải vào bảng Measures và chọn ‘Create Parameter’. Điền thông tin như hình ảnh dưới đây và nhấn OK.
  2. Nhấp chuột phải vào tham số ‘Centers’ vừa tạo và chọn ‘Show Parameter Control’, đặt giá trị Centers là 5.
  3. Để đảm bảo kết quả có thể tái tạo, chúng ta cần ‘set seed’ trong R. Tạo thêm một tham số ‘Seed’ như sau:
    • Nhấp chuột phải vào tham số ‘Seed’ và chọn ‘Show Parameter Control’, đặt giá trị seed là 500.

Hàm SCRIPT để nhận dữ liệu từ R

Để phân đoạn khách hàng, chúng ta sẽ truyền dữ liệu đến R, phân cụm và nhận kết quả trở lại trong một Trường Tính toán để sử dụng trong trực quan hóa Tableau. Tableau có bốn hàm SCRIPT liên quan đến loại dữ liệu nhận từ dịch vụ bên ngoài: SCRIPT_REAL, SCRIPT_INT, SCRIPT_BOOL và SCRIPT_STR.

Cú pháp của hàm Script như sau:

r Copy
SCRIPT_XXX (‘code to be executed as string’, argument 1, argument2, ...)

Các tham số được gọi là ‘.arg1’, ‘.arg2’,... Chúng ta sẽ tạo một Trường Tính toán tên là ‘Cluster_kmeans’ với mã như sau:

r Copy
# Code sẽ được viết ở đây

Chúng ta sẽ truyền 8 tham số vào hàm Script, bao gồm seed, Centers và 6 mức chi tiêu cho từng danh mục. Lưu ý rằng các tham số Seed và Centers được truyền dưới dạng vector có chiều dài 440, nhưng chỉ lấy phần tử đầu tiên để tránh lỗi.

Trực quan hóa các cụm được tạo bởi R

Sau khi tạo Trường Tính toán cho các cụm, chúng ta có thể bắt đầu tạo trực quan hóa. Để làm điều này, hãy tắt tính năng Aggregate Measures trong Analysis > Aggregate Measures. Nếu không, Tableau sẽ tổng hợp tất cả mức chi tiêu và gửi một hàng dữ liệu duy nhất đến R, dẫn đến lỗi.

  • Kéo và thả ‘Cluster_kmeans’ vào ‘Columns’ và vào Color.
  • Kéo và thả ‘Fresh’ và ‘Frozen’ vào ‘Rows’.
  • Đặt loại biểu đồ thành ‘Gantt Bar’.
  • Từ tab ‘Analytics’, kéo và thả ‘Box Plot’ vào ‘Cells’ của biểu đồ.
  • Kéo và thả ‘Average Line’ vào ‘Panes’ của biểu đồ.

Tạo bảng điều khiển phân khúc khách hàng

Tạo một bảng điều khiển mới và kéo tất cả ba worksheet vào bảng điều khiển. Sắp xếp các điều khiển tham số và chú giải biểu đồ cho hợp lý.

Các tính năng của bảng điều khiển phân khúc khách hàng

Bảng điều khiển này cho phép người dùng:

  • Thay đổi số lượng cụm một cách dễ dàng.
  • Nhận thấy các biểu đồ tương quan và dễ dàng so sánh giữa các cụm.
  • Tương tác trực tiếp với từng cụm để hiểu rõ hơn về dữ liệu.

Kết luận và hành động

Chúng ta đã xây dựng một bảng điều khiển cho phép người dùng thấy được phân khúc khách hàng và hành vi chi tiêu. Nhờ vào việc kết nối Tableau với R, chúng ta có thể dễ dàng tạo ra những phân tích sâu sắc mà không cần phải là chuyên gia lập trình. Hãy thử nghiệm bảng điều khiển và tạo ra những quyết định kinh doanh thông minh dựa trên dữ liệu.

Câu hỏi thường gặp (FAQ)

Q1: Tôi có thể sử dụng Tableau mà không cần R không?
A1: Có, nhưng việc sử dụng R giúp tăng cường khả năng phân tích dữ liệu và mô hình hóa.

Q2: Có những lỗi nào thường gặp khi kết nối Tableau với R?
A2: Một số lỗi phổ biến là không thể kết nối hoặc lỗi khi truyền tham số không hợp lệ.

Q3: Tôi có thể sử dụng các thuật toán khác ngoài k-means không?
A3: Có, bạn có thể sử dụng nhiều thuật toán khác như DBSCAN hoặc Hierarchical Clustering tùy vào nhu cầu phân tích của mình.

Gợi ý câu hỏi phỏng vấn
Không có dữ liệu

Không có dữ liệu

Bài viết được đề xuất
Bài viết cùng tác giả

Bình luận

Chưa có bình luận nào

Chưa có bình luận nào