0
0
Lập trình
Harry Tran
Harry Tran106580903228332612117

Giảm Thời Gian Tải Dashboard Tableau Nhanh Chóng

Đăng vào 7 tháng trước

• 6 phút đọc

Dashboard Tuyệt Vời Cân Bằng Giữa Sức Mạnh và Đơn Giản

Mỗi dashboard kinh doanh nên thực hiện hai điều thật tốt:

  1. Hiệu suất nhanh chóng, ngay cả với tập dữ liệu lớn.
  2. Đơn giản đủ để người dùng có thể khám phá mà không gặp khó khăn.

Tuy nhiên, ai đã từng làm việc với big data trong Tableau đều biết rằng hiệu suất đôi khi có thể trở thành một điểm nghẽn. Một dashboard có vẻ đẹp mắt nhưng nếu mất nhiều phút để tải, người dùng sẽ nhanh chóng mất kiên nhẫn.

Một cách nhỏ nhưng mạnh mẽ để tăng tốc độ là cách bạn tạo nhóm trong Tableau. Trong bài viết này, tôi sẽ hướng dẫn bạn qua hai phương pháp:

  • Sử dụng tính năng nhóm nội bộ của Tableau
  • Sử dụng câu lệnh CASE trong một trường đã tính toán

Chúng ta sẽ xem tại sao tùy chọn thứ hai thường hoạt động nhanh hơn và phù hợp hơn cho các tập dữ liệu lớn.

Tại Sao Chúng Ta Cần Nhóm Trong Tableau?

Nhóm là một tính năng đơn giản nhưng mạnh mẽ trong Tableau. Chúng cho phép bạn kết hợp các mục liên quan lại với nhau, để bạn có thể phân tích chúng như một đơn vị duy nhất.

Ví dụ, giả sử bạn có một tập dữ liệu về đánh giá phim. Bạn có thể muốn nhóm một số tiêu đề phim cụ thể—như The Dark Knight, Inception, và Interstellar—và so sánh điểm số của chúng với tất cả các bộ phim khác.

Đây là lúc các tùy chọn nhóm của Tableau phát huy tác dụng.

Phương Pháp 1: Sử Dụng Tính Năng "Tạo Nhóm" Của Tableau

Tableau làm cho việc nhóm trở nên rất đơn giản. Bạn chỉ cần:

  1. Nhấp chuột phải vào một chiều (như tiêu đề phim).
  2. Chọn Tạo > Nhóm.
  3. Chọn các mục bạn muốn nhóm lại.

Nghe có vẻ dễ dàng, đúng không?
Nó thực sự đơn giản—nhưng dưới bề mặt, Tableau đang thực hiện một số thao tác ảnh hưởng đến hiệu suất. Khi bạn sử dụng tính năng nhóm nội bộ, Tableau tải toàn bộ miền của chiều đó—trong trường hợp của chúng ta, tất cả 28 triệu bản ghi phim—trước khi nhóm lại.

Điều đó có nghĩa là Tableau phải xử lý từng mục, ngay cả khi bạn chỉ quan tâm đến một vài bộ phim.

Kết Quả Trong Thử Nghiệm Của Chúng Tôi

Chúng tôi đã thử nghiệm trên một tập dữ liệu với 28 triệu hàng phim. Mục tiêu rất đơn giản: hiển thị điểm trung bình cho nhóm phim đã chọn so với phần còn lại.
Sử dụng tính năng nhóm nội bộ, hình ảnh trực quan mất:

  • ⏱ 2 phút 51 giây để tải

Đối với một biểu đồ cột cơ bản, đó là một khoảng thời gian dài.

Phương Pháp 2: Sử Dụng Câu Lệnh CASE

Thay vì dựa vào tùy chọn nhóm tích hợp của Tableau, chúng tôi đã tạo một trường đã tính toán bằng cách sử dụng câu lệnh CASE.
Dưới đây là cách nó hoạt động trong thực tế:

sql Copy
CASE [Tiêu Đề Phim]  
WHEN "The Dark Knight" THEN "Phim Đã Chọn"  
WHEN "Inception" THEN "Phim Đã Chọn"  
WHEN "Interstellar" THEN "Phim Đã Chọn"  
ELSE "Phim Khác"  
END

Logic này kiểm tra từng hàng và phân loại phim vào "Phim Đã Chọn" hoặc "Phim Khác".

Kết Quả Hiệu Suất Với Câu Lệnh CASE

Khi chúng tôi chạy cùng một phân tích với trường đã tính toán này, dashboard tải trong:

  • ⏱ 1 phút 40 giây

Đó là một sự cải thiện 42% so với tính năng nhóm nội bộ!
Và hãy nhớ—điều này diễn ra với một kết nối trực tiếp. Hiệu suất có thể cải thiện hơn nữa nếu bạn sử dụng Tableau Extracts (lưu trữ các bản sao tối ưu của dữ liệu của bạn).

Tại Sao Câu Lệnh CASE Hoạt Động Nhanh Hơn

Vậy tại sao phương pháp này giúp tăng tốc?

  • Nhóm nội bộ → Tableau kiểm tra toàn bộ miền chiều, ngay cả những mục không liên quan đến phân tích của bạn.
  • Câu lệnh CASE → Tableau chỉ kiểm tra các điều kiện bạn đã viết, bỏ qua dữ liệu không cần thiết.

Nói cách khác, với CASE, bạn đang chỉ rõ những gì bạn cần—nên Tableau mất ít thời gian hơn để tìm hiểu điều đó.

Khi Nào Sử Dụng Câu Lệnh CASE Để Nhóm

Nếu bạn đang làm việc với các tập dữ liệu nhỏ, sự khác biệt có thể không rõ ràng. Thực tế, nhóm nội bộ có thể nhanh hơn để thiết lập khi bạn chỉ đang khám phá dữ liệu.

Nhưng khi bạn làm việc với:

  • Tập dữ liệu lớn (hàng triệu hàng)
  • Kết nối trực tiếp với cơ sở dữ liệu
  • Dashboard mà nhiều người sẽ sử dụng

…câu lệnh CASE gần như luôn mang đến hiệu suất tốt hơn.
Nhóm tư vấn Tableau của chúng tôi thường khuyên phương pháp này cho các khách hàng trong các ngành như dược phẩm, bán lẻ và tài chính, nơi khối lượng dữ liệu có thể khổng lồ và tốc độ là điều quan trọng.

Ví Dụ Nhanh: Dữ Liệu Bán Lẻ

Giả sử bạn có một tập dữ liệu về 500,000 giao dịch bán hàng trên hàng ngàn sản phẩm.
Với một nhóm nội bộ, Tableau sẽ đầu tiên tải tất cả tên sản phẩm.
Với một câu lệnh CASE, bạn có thể đơn giản nhóm "Điện Tử", "Thiết Bị Gia Dụng", và "Nội Thất" lại với nhau và bỏ qua phần còn lại cho đến khi cần thiết.
Kết quả? Một dashboard nhanh hơn nhiều mà đi thẳng vào vấn đề.

Những Mẹo Thêm Để Tăng Tốc Độ Tableau

Sử dụng câu lệnh CASE là một mẹo, nhưng đây là một số cách khác để giữ cho dashboard Tableau của bạn hoạt động trơn tru:

  • Tận dụng Extracts – Thay vì kết nối trực tiếp, hãy sử dụng Tableau Extracts khi có thể. Chúng được tối ưu hóa cho tốc độ.
  • Giới Hạn Bộ Lọc Nhanh – Quá nhiều bộ lọc làm chậm mọi thứ. Sử dụng tham số khi có thể.
  • Tổng Hợp Dữ Liệu Trước Khi Nhập – Nếu có thể, hãy tổng hợp trước trong cơ sở dữ liệu hoặc công cụ ETL của bạn.
  • Tối Ưu Trường Tính Toán – Tránh các công thức quá phức tạp trong Tableau; chuyển logic đến cơ sở dữ liệu của bạn khi hợp lý.
  • Kiểm Tra Trên Dữ Liệu Thực – Luôn kiểm tra dashboard của bạn với kích thước tập dữ liệu mà người dùng của bạn thực sự sẽ có.

Kết Luận

Nhóm là một tính năng hữu ích trong Tableau—nhưng không phải tất cả các nhóm đều được tạo ra như nhau.
Tùy chọn "Tạo Nhóm" nội bộ rất nhanh để thiết lập nhưng có thể làm giảm hiệu suất với các tập dữ liệu lớn.
Một câu lệnh CASE có thể là hơi tốn công hơn ban đầu nhưng sẽ mang lại thời gian tải nhanh hơn nhiều.
Trong thử nghiệm đánh giá phim của chúng tôi với 28 triệu hàng, việc chuyển từ nhóm nội bộ sang câu lệnh CASE đã giảm thời gian tải xuống 42%. Và đó chỉ là khởi đầu—bạn có thể đạt được hiệu suất nhiều hơn với Tableau Extracts.
Vì vậy, lần tới khi bạn cần nhóm dữ liệu trong Tableau, hãy nghĩ về quy mô. Nếu tốc độ quan trọng (và thường thì nó là), các câu lệnh CASE là bạn đồng hành tốt nhất của bạn.

Mở Khóa Kỹ Năng Phân Tích Linh Hoạt

Khám phá khả năng phân tích linh hoạt với một nhà tư vấn Tableau tự do, tinh giản báo cáo thông qua dịch vụ triển khai Power BI mạnh mẽ, và nâng cao quyết định của bạn với các dịch vụ tư vấn Tableau chuyên dụng.

Gợi ý câu hỏi phỏng vấn
Không có dữ liệu

Không có dữ liệu

Bài viết được đề xuất
Bài viết cùng tác giả

Bình luận

Chưa có bình luận nào

Chưa có bình luận nào