Tổng Quan
Khi các khối lượng công việc AI ngày càng phát triển, việc hỗ trợ GPU đúng cách trở nên thiết yếu. Nền tảng ROCm của AMD cung cấp giải pháp mã nguồn mở để tận dụng tối đa GPU AMD. Tuy nhiên, khi tôi cố gắng cài đặt ROCm từ tài liệu chính thức của AMD, hệ thống và màn hình của tôi đã hoàn toàn bị crash (tôi phải khởi động lại PC). Trong hướng dẫn này, tôi sẽ hướng dẫn bạn cách thiết lập ROCm trên Ubuntu 24.04 với RX 6700 XT.
Các Bước Cài Đặt
Bước 1 — Cập Nhật Hệ Thống và Cài Đặt Các Gói Cần Thiết
Trước khi cài đặt ROCm, hãy chắc chắn rằng hệ thống của bạn đã được cập nhật và có các gói cần thiết:
bash
sudo apt update
sudo apt upgrade
sudo apt install synaptic python3 python3-venv python3-pip git
Điều này đảm bảo rằng bạn có một nền tảng sạch sẽ cho việc cài đặt ROCm.
Bước 2 — Cài Đặt ROCm và Thư Viện HIP
Thiết lập phiên bản GFX và cài đặt tất cả các gói ROCm cần thiết:
bash
export HSA_OVERRIDE_GFX_VERSION=10.3.0
sudo apt install libamd-comgr2 libhsa-runtime64-1 librccl1 librocalution0 librocblas0 librocfft0 librocm-smi64-1 \nlibrocsolver0 librocsparse0 rocm-device-libs-17 rocm-smi rocminfo hipcc libhiprand1 libhiprtc-builtins5 radeontop
sudo usermod -aG render,video $USER
sudo reboot
Lưu ý: Sau khi khởi động lại, xác nhận ROCm đã được cài đặt bằng cách chạy:
bash
rocminfo
Dòng đầu tiên nên hiển thị thông báo rằng mô-đun ROCk đã được tải. Radeontop là tùy chọn cho việc giám sát GPU.
Bước 3 — Cài Đặt PyTorch
Khi ROCm đã được thiết lập, bạn có thể cài đặt PyTorch với hỗ trợ ROCm.
Cài Đặt Gói
Kích hoạt môi trường ảo Python của bạn và tải gói PyTorch bằng cách làm theo hướng dẫn chính thức:
Hướng Dẫn Bắt Đầu với PyTorch
Kiểm Tra Tính Sẵn Có Của GPU
Sau khi cài đặt, xác minh rằng PyTorch có thể phát hiện GPU của bạn:
python
python3
import torch
print(torch.cuda.is_available())
Nếu nó trả về True
, PyTorch đã được cấu hình đúng để sử dụng GPU AMD của bạn.
Thực Tiễn Tốt Nhất
- Luôn cập nhật hệ thống: Trước khi cài đặt bất kỳ phần mềm mới nào, hãy đảm bảo hệ thống của bạn đã được cập nhật.
- Kiểm tra tương thích: Hãy kiểm tra xem GPU của bạn có tương thích với ROCm không trên trang chính thức của AMD.
- Sử dụng môi trường ảo: Luôn sử dụng môi trường ảo để cô lập các gói và thư viện bạn cài đặt.
Những Cạm Bẫy Thường Gặp
- Lỗi tải mô-đun: Nếu bạn gặp lỗi khi chạy
rocminfo
, hãy kiểm tra lại các bước cài đặt và đảm bảo rằng bạn đã khởi động lại hệ thống. - Không phát hiện GPU: Nếu PyTorch không phát hiện GPU, hãy chắc chắn rằng bạn đã cài đặt các gói đúng cách và kiểm tra biến môi trường
HSA_OVERRIDE_GFX_VERSION
.
Mẹo Tối Ưu Hiệu Suất
- Theo dõi hiệu năng GPU: Sử dụng
radeontop
để theo dõi hiệu suất GPU trong thời gian thực. - Tối ưu hóa mã: Đảm bảo mã của bạn được tối ưu hóa cho GPU bằng cách sử dụng các thuật toán và thư viện phù hợp.
Khắc Phục Sự Cố
- Nếu sau khi cài đặt, bạn gặp phải lỗi hoặc vấn đề hiệu suất, hãy kiểm tra các log hệ thống và tìm kiếm trên các diễn đàn hỗ trợ.
- Đảm bảo rằng driver và ROCm đều tương thích với phiên bản hệ điều hành của bạn.
Kết Luận
Việc thiết lập ROCm trên Ubuntu 24.04 với RX 6700 XT cho phép bạn tận dụng GPU của mình cho các khối lượng công việc AI một cách hiệu quả. Hướng dẫn này đã cung cấp cho bạn những điều cơ bản, từ cài đặt ROCm cho đến việc xác minh hỗ trợ GPU của PyTorch. Hãy thử nghiệm và khám phá tiềm năng của GPU AMD trong các ứng dụng của bạn.
Câu Hỏi Thường Gặp (FAQ)
1. ROCm có tương thích với tất cả các GPU AMD không?
Không, bạn nên kiểm tra danh sách GPU tương thích trên trang web của AMD.
2. Làm thế nào để gỡ bỏ ROCm?
Bạn có thể sử dụng lệnh sudo apt remove <package-name>
để gỡ bỏ từng gói ROCm.
3. Có cần phải cài đặt driver riêng cho ROCm không?
Có, bạn cần cài đặt driver ROCm cho GPU của mình để hoạt động tối ưu.