Giới Thiệu
Sự kết hợp giữa Docling và IBM Cloud Code Engine đang mở ra một kỷ nguyên mới cho các ứng dụng AI, giải quyết hiệu quả các thách thức trong việc xử lý dữ liệu phi cấu trúc. Hãy cùng tìm hiểu về hai công nghệ này và cách chúng có thể hỗ trợ bạn trong việc phát triển ứng dụng.
Code Engine là gì?
Khái Niệm Cơ Bản
IBM Cloud Code Engine là một nền tảng serverless hoàn toàn quản lý, cho phép bạn chạy các workload container hóa, các tác vụ theo lô và các chức năng mà không cần lo lắng về việc quản lý cơ sở hạ tầng. Điều này có nghĩa là bạn có thể tập trung vào việc viết mã mà không cần phải lo lắng về việc cung cấp và duy trì máy chủ.
Lợi Ích Của Serverless
- Tiết kiệm chi phí: Bạn chỉ phải trả tiền cho những gì bạn sử dụng.
- Mở rộng linh hoạt: Tài nguyên sẽ tự động được mở rộng hoặc thu hẹp tùy theo nhu cầu.
- Đơn giản hóa quản lý: Giảm bớt khối lượng công việc liên quan đến việc bảo trì hạ tầng.
Các Đặc Điểm Nổi Bật Của Code Engine
Serverless Fleets
Đối với các nhà phát triển cần hiệu suất tính toán cao, Serverless Fleets của IBM Cloud Code Engine cung cấp giải pháp tối ưu. Tính năng này cho phép thực hiện các tác vụ quy mô lớn mà không cần quản lý phần cứng chuyên dụng.
- Thích hợp cho AI: Hỗ trợ các tác vụ AI như huấn luyện mô hình và suy luận nhanh.
- Tối ưu hóa hiệu suất: Có thể sử dụng GPU để tăng tốc độ xử lý.
Docling Là Gì?
Giới Thiệu Về Docling
Docling là một công cụ mã nguồn mở được phát triển bởi IBM Research, giúp giải quyết vấn đề trích xuất kiến thức từ các tài liệu phi cấu trúc. Nó sử dụng các mô hình AI để hiểu cấu trúc và nội dung của tài liệu, chuyển đổi chúng thành các định dạng có cấu trúc như Markdown hoặc JSON.
Tính Năng Nổi Bật
- Xử lý nhiều định dạng: Hỗ trợ PDF, DOCX, hình ảnh...
- Cung cấp dữ liệu chất lượng cao: Làm nền tảng cho các mô hình AI lớn (LLMs) cung cấp phản hồi chính xác và đáng tin cậy.
Tại Sao Kết Hợp Docling và Code Engine?
Lợi Ích Từ Sự Kết Hợp
Khi kết hợp khả năng hiểu tài liệu của Docling với khả năng xử lý GPU của IBM Cloud Code Engine, chúng ta có thể mở ra một chân trời mới cho các ứng dụng AI. Sự kết hợp này không chỉ giúp tăng tốc độ xử lý mà còn nâng cao độ chính xác của các kết quả.
- Dữ liệu đầu vào chất lượng cao: Docling chuyển đổi dữ liệu phi cấu trúc thành định dạng dễ hiểu cho mô hình AI.
- Xử lý quy mô lớn: Code Engine cho phép chạy các tác vụ đòi hỏi công suất tính toán lớn mà không cần quản lý phần cứng.
Ví Dụ Cấu Hình Chạy
bash
#!/bin/bash
set -e
uuid=$(uuidgen | tr '[:upper:]' '[:lower:]' | awk -F- '{print $1}')
IMAGE="quay.io/docling-project/docling-serve-cpu"
echo ibmcloud code-engine beta fleet create --name "fleet-${uuid}-1"
echo " "--image $IMAGE
echo " "--worker-profile mx3d-24x240
echo " "--max-scale 8
echo " "--tasks-from-local-file commands.jsonl
echo " "--cpu 12
echo " "--memory 120G
echo " "--mount-data-store /input=fleet-input-store:/docling
echo " "--mount-data-store /output=fleet-output-store:/docling
ibmcloud code-engine beta fleet create --name "fleet-${uuid}-1" \
--image $IMAGE \
--worker-profile mx3d-24x240 \
--max-scale 8 \
--tasks-from-local-file commands.jsonl \
--cpu 12 \
--memory 120G \
--tasks-state-store fleet-task-store \
--mount-data-store /input=fleet-input-store:/docling \
--mount-data-store /output=fleet-output-store:/docling
Ví Dụ Cấu Hình Chạy Với GPU
bash
#!/bin/bash
set -e
uuid=$(uuidgen | tr '[:upper:]' '[:lower:]' | awk -F- '{print $1}')
IMAGE="quay.io/docling-project/docling-serve"
echo ibmcloud code-engine beta fleet create --name "fleet-${uuid}-1"
echo " "--image $IMAGE
echo " "--max-scale 1
echo " "--tasks-from-local-file commands.jsonl
echo " "--gpu l40s
echo " "--mount-data-store /input=fleet-input-store:/docling
echo " "--mount-data-store /output=fleet-output-store:/docling
ibmcloud code-engine beta fleet create --name "fleet-${uuid}-1" \
--image $IMAGE \
--max-scale 1 \
--tasks-from-local-file commands.jsonl \
--gpu l40s \
--tasks-state-store fleet-task-store \
--mount-data-store /input=fleet-input-store:/docling \
--mount-data-store /output=fleet-output-store:/docling
Kết Luận
Sự kết hợp giữa IBM Cloud Code Engine và Docling mở ra tiềm năng to lớn cho việc phát triển các ứng dụng AI thông minh. Với khả năng xử lý tài liệu phi cấu trúc và cung cấp tài nguyên tính toán linh hoạt, các nhà phát triển có thể triển khai ứng dụng nhanh chóng và hiệu quả hơn bao giờ hết. Để tìm hiểu thêm và trải nghiệm sức mạnh của sự kết hợp này, bạn có thể tham khảo hướng dẫn chi tiết trên GitHub của IBM Code Engine.
Câu Hỏi Thường Gặp (FAQ)
1. Docling có thể xử lý những định dạng nào?
Docling có thể xử lý nhiều định dạng như PDF, DOCX, hình ảnh và nhiều định dạng khác.
2. Có tài liệu hướng dẫn sử dụng IBM Cloud Code Engine không?
Có, IBM cung cấp tài liệu hướng dẫn chi tiết trên trang web chính thức của Code Engine.
3. Làm thế nào để bắt đầu với Docling và Code Engine?
Bạn có thể tham khảo hướng dẫn chi tiết trên GitHub để bắt đầu ngay.