Từ Điển Thuật Ngữ về AI và AWS cho Nhà Phát Triển

1.0 Khái Niệm Cơ Bản về AI và Học Máy (ML)

Những thuật ngữ sau đây là nền tảng cho bất kỳ giải pháp nào về AI và Học Máy.

1.1 Thuật Ngữ Chung

Các khái niệm này có mối quan hệ phân cấp: Học Máy là một phân nhánh của Trí Tuệ Nhân Tạo, còn Học Sâu là một phân nhánh chuyên sâu của Học Máy.

Trí Tuệ Nhân Tạo (AI)
Là lĩnh vực khoa học máy tính tập trung vào việc tạo ra các hệ thống có khả năng thực hiện các nhiệm vụ thông minh giống như trí tuệ con người. Những nhiệm vụ này bao gồm hiểu ngữ cảnh của ngôn ngữ tự nhiên, nhận diện mẫu và sự kiện thông tin, giải quyết các thách thức và quyết định phức tạp, và nhận thức về môi trường xung quanh.

Học Máy (Machine Learning - ML)
Là phân nhánh của AI, tập trung vào việc dạy cho máy tính học từ dữ liệu. Điều này cho phép chúng cải thiện hiệu suất theo thời gian mà không cần lập trình rõ ràng cho từng nhiệm vụ.

Học Sâu (Deep Learning - DL)
Là một phân nhánh chuyên sâu của ML, sử dụng Mạng Nơ-ron Nhân Tạo (RNA) với nhiều lớp. Cách tiếp cận này cho phép một mô hình học các mẫu và biểu diễn phức tạp từ các tập dữ liệu lớn, như hình ảnh hoặc văn bản.

Mạng Nơ-ron (Neural Network)
Là một mô hình tính toán được lấy cảm hứng từ cấu trúc của não người. Nó bao gồm các đơn vị liên kết (nơ-ron hoặc nút) được tổ chức thành các lớp, làm việc cùng nhau để xử lý và học từ dữ liệu.

1.2 Khái Niệm Mô Hình

Vượt Khung và Thiếu Khung (Overfitting và Underfitting)
Những thuật ngữ này mô tả các vấn đề về hiệu suất trong một mô hình ML. Vượt khung xảy ra khi một mô hình ghi nhớ dữ liệu huấn luyện và hoạt động kém với dữ liệu mới, trong khi thiếu khung xảy ra khi mô hình quá đơn giản để nắm bắt các mẫu tiềm ẩn trong dữ liệu, dẫn đến hiệu suất thấp.

Thiên Kiến và Biến Động (Bias và Variance)
Đây là hai loại lỗi trong học có giám sát:

Thiên kiến (Bias): Sự khác biệt giữa dự đoán trung bình của một mô hình và giá trị thực mà nó cố gắng dự đoán; thiên kiến cao có nghĩa là mô hình có giả định sai về dữ liệu.
Biến động (Variance): Đo lường sự không nhất quán của các dự đoán của mô hình khi được huấn luyện trên các tập dữ liệu khác nhau; biến động cao có nghĩa là mô hình rất nhạy cảm với các dữ liệu huấn luyện cụ thể.

Điều quan trọng là hiểu rằng một mô hình có thiên kiến cao thường gặp vấn đề thiếu khung, bởi vì các giả định của nó quá đơn giản. Ngược lại, một mô hình có biến động cao có xu hướng bị vượt khung, vì nó quá nhạy cảm với các dữ liệu huấn luyện cụ thể.

1.3 Các Lĩnh Vực Chính trong AI

Thị Giác Máy Tính (Computer Vision)
Cho phép máy móc nhận diện con người, địa điểm và đối tượng trong hình ảnh với độ chính xác ngang hoặc vượt trên con người, hoạt động với tốc độ và hiệu quả đáng kể hơn.

Xử Lý Ngôn Ngữ Tự Nhiên (Natural Language Processing - NLP)
Nhánh của trí tuệ nhân tạo cho phép máy tính hiểu, diễn giải và tương tác với ngôn ngữ con người.

Những khái niệm cơ bản này là nền tảng cho các lĩnh vực tiên tiến hơn, như AI Tạo Sinh, có khả năng độc đáo là tạo ra nội dung mới.

2.0 Khái Niệm Chính về AI Tạo Sinh

Phần này tập trung vào AI Tạo Sinh, phân nhánh của AI cho phép tạo ra nội dung mới và nguyên bản, như văn bản, hình ảnh và âm thanh.

2.1 Thuật Ngữ Cơ Bản của AI Tạo Sinh

AI Tạo Sinh (Generative AI)
Là một phân nhánh của học sâu tập trung vào việc sản xuất dữ liệu mới dưới nhiều định dạng khác nhau, như văn bản, âm thanh, hình ảnh và dữ liệu tổng hợp, với chất lượng tương tự như do con người tạo ra.

Mô Hình Ngôn Ngữ Lớn (Large Language Models - LLMs)
Là các mô hình học sâu sử dụng kiến trúc mạng nơ-ron kiểu transformer. Được huấn luyện với khối lượng lớn dữ liệu văn bản, chúng học một cách tự động mà không cần giám sát liên tục để thực hiện các nhiệm vụ như tạo văn bản, dịch thuật và trả lời câu hỏi.

Mô Hình Nền Tảng (Foundation Models)
Mô hình học sâu quy mô lớn được huấn luyện trên các tập dữ liệu đa dạng và tổng quát. Chúng được thiết kế để thực hiện nhiều nhiệm vụ chung, như trò chuyện bằng ngôn ngữ tự nhiên, tạo văn bản và hình ảnh, cũng như diễn giải ngôn ngữ.

Tạo Sinh Tăng Cường Bằng Khôi Phục (Retrieval Augmented Generation - RAG)
Một kỹ thuật tối ưu hóa đầu ra của mô hình ngôn ngữ lớn (LLM). Nó thực hiện điều này bằng cách tham khảo một cơ sở kiến thức bên ngoài để cung cấp câu trả lời chính xác, cập nhật và có ngữ cảnh hơn, giảm thiểu sự phụ thuộc vào dữ liệu huấn luyện trước đó.

2.2 Kỹ Thuật Tùy Biến Mô Hình

Để điều chỉnh một mô hình đã được huấn luyện trước cho các nhiệm vụ cụ thể, hai kỹ thuật chính được áp dụng với mục đích khác nhau:

Thuật Ngữ	Mục Đích Chính
Ajuste Fino (Fine-tuning)	Điều chỉnh một mô hình đã được huấn luyện trước cho một tập dữ liệu cụ thể để cải thiện hiệu suất trên một nhiệm vụ cụ thể. Kỹ thuật này, được gọi là học chuyển giao, cho phép tạo ra các mô hình đáng tin cậy với ít dữ liệu và thời gian huấn luyện hơn.
Kỹ Thuật Đầu Vào (Prompt Engineering)	Hướng dẫn một mô hình AI tạo sinh để sản xuất kết quả mong muốn. Điều này được thực hiện thông qua việc tạo các đầu vào (prompts) rõ ràng và cụ thể để dẫn dắt mô hình cung cấp các phản hồi chính xác và phù hợp cho nhiệm vụ hoặc hướng dẫn đã cho.

Kiến thức về các khái niệm AI Tạo Sinh này là rất quan trọng để tận dụng các dịch vụ mà AWS cung cấp nhằm xây dựng, triển khai và mở rộng các công nghệ tiên tiến này.

3.0 Dịch Vụ Chính về AI của AWS

AWS cung cấp một tập hợp các dịch vụ quản lý được thiết kế để đơn giản hóa và tăng tốc việc triển khai các giải pháp AI, trừu tượng hóa sự phức tạp của cơ sở hạ tầng bên dưới.

3.1 Dịch Vụ cho AI Tạo Sinh và ML

Amazon Bedrock
Là dịch vụ hoàn toàn quản lý giúp cung cấp quyền truy cập vào các mô hình nền tảng hiệu suất cao từ nhiều công ty AI thông qua một API duy nhất. Lợi ích chính của nó là giúp dễ dàng tạo và mở rộng các ứng dụng AI tạo sinh một cách an toàn, cho phép người dùng thử nghiệm và tùy biến các mô hình mà không cần quản lý cơ sở hạ tầng bên dưới.

Amazon SageMaker
Là dịch vụ toàn diện cho việc xây dựng, huấn luyện và triển khai các mô hình học máy ở mọi quy mô. Đối với người dùng mới, lợi ích chính của nó là thống nhất tất cả các công cụ cần thiết cho vòng đời của ML, bao gồm SageMaker Jumpstart để truy cập các mô hình đã được huấn luyện trước và các giải pháp, cũng như SageMaker Data Wrangler để đơn giản hóa việc chuẩn bị dữ liệu.

3.2 Dịch Vụ AI theo Lĩnh Vực

Amazon Rekognition
Dịch vụ thị giác máy tính để phân tích hình ảnh và video, cho phép phát hiện đối tượng, con người, văn bản và hoạt động.

Amazon Comprehend
Dịch vụ Xử Lý Ngôn Ngữ Tự Nhiên (NLP) sử dụng học máy để tìm thông tin và mối quan hệ trong văn bản.

Amazon Lex
Dịch vụ để xây dựng các giao diện trò chuyện (chatbots) cho các ứng dụng sử dụng giọng nói và văn bản.

Amazon Polly
Dịch vụ chuyển đổi văn bản thành giọng nói với âm thanh tự nhiên, cho phép tạo ra các ứng dụng có khả năng nói.

Amazon Transcribe
Dịch vụ nhận diện giọng nói tự động (ASR) giúp dễ dàng thêm khả năng chuyển đổi giọng nói thành văn bản cho các ứng dụng.

Amazon Translate
Dịch vụ dịch thuật tự động bằng mạng nơ-ron, cung cấp các bản dịch ngôn ngữ nhanh chóng, chất lượng cao và tiết kiệm.

Amazon Fraud Detector
Dịch vụ hoàn toàn quản lý giúp dễ dàng xác định các hoạt động trực tuyến có khả năng gian lận, như gian lận thanh toán và tạo tài khoản giả.