Khái Niệm về Self-Prompting

Trong thời đại công nghệ cao ngày nay, việc ứng dụng các mô hình ngôn ngữ lớn (LLM) đã trở thành một xu hướng nổi bật để giải quyết các bài toán liên quan đến ngôn ngữ tự nhiên. Một trong những thách thức lớn nhất mà các nhà nghiên cứu và phát triển gặp phải chính là việc tối ưu hóa quy trình tạo prompt, hay còn gọi là prompt engineering. Quá trình này yêu cầu sự tinh chỉnh và thử nghiệm nhiều lần để tìm ra cấu trúc câu lệnh đầu vào tối ưu, nhằm hướng dẫn mô hình thực hiện các nhiệm vụ. Tuy nhiên, điều này lại tốn nhiều thời gian, không đảm bảo tính nhất quán, và dễ dẫn đến sự bất ổn định trong kết quả.

Thay vì phụ thuộc vào con người để tạo và tinh chỉnh prompt, phương pháp self-prompting đã được giới thiệu như một cách tiếp cận tự động hóa, cho phép mô hình tự viết, đánh giá và tối ưu hóa prompt của chính mình. Self-Prompting không chỉ giúp tiết kiệm thời gian mà còn cải thiện độ chính xác trong các tác vụ phức tạp.

Phương Pháp Chain-of-Thought Prompting

Phương pháp Chain-of-Thought (CoT) đóng vai trò quan trọng trong việc giúp mô hình ngôn ngữ giải quyết các nhiệm vụ có tính phức tạp cao. Bằng cách phân chia một bài toán thành nhiều bước nhỏ và thực hiện chúng một cách có hệ thống, CoT cải thiện khả năng suy luận của mô hình. Ví dụ, trong một bài toán toán học: “Sau khi Jane tặng 2 bông hoa cho mẹ, cô ấy có 10 bông... nếu sau đó cô ấy tặng 3 bông cho bố, cô sẽ còn lại 7 bông...” – mô hình có thể lần lượt giải quyết từng bước để tính ra kết quả cuối cùng.

CoT không chỉ giúp mô hình lập luận hiệu quả mà còn cung cấp cái nhìn minh bạch về cách mà nó đạt được câu trả lời. Điều này tạo điều kiện cho việc phát hiện và sửa chữa lỗi suy luận. Phương pháp này rất thích hợp cho các nhiệm vụ như giải quyết vấn đề toán học, lý luận thông thường, và thao tác ký hiệu.

Có thể tham khảo cách Auto CoT được sử dụng để tự động sinh ra các câu trả lời tại đây.

Tìm Hiểu về Self-Prompting

Self-Prompting gồm có 2 giai đoạn chính:

Giai đoạn Chuẩn Bị (Preparation)
Giai đoạn Suy Luận (Inference)

Trong giai đoạn chuẩn bị, LLM được hướng dẫn để tự động tạo ra nhiều cặp câu hỏi và câu trả lời giả lập (pseudo dataset). Quá trình này bao gồm các bước như sau:

Bước 1: Tạo Đoạn Văn (Passage Generation)

Để đảm bảo tính đa dạng, chúng tôi xác định một số chủ đề khác nhau như chính trị, thể thao hay văn học. Từ các chủ đề cấp cao này, chúng tôi tiếp tục phân loại chi tiết hơn để tạo ra các đoạn văn nền tảng cho quá trình tạo câu hỏi.

Bước 2: Nhận Diện Thực Thể (Named Entity Recognition)

Chúng tôi sử dụng các passage đã tạo ở bước 1 để trích xuất các thực thể (ví dụ: tên, địa điểm, thời gian) trong các câu trả lời, giúp tăng tính chính xác và phong phú cho dữ liệu.

Bước 3: Tạo Câu Hỏi (Question Generation)

Sử dụng các passage và thực thể đã nhận diện, LLM sẽ sinh ra các câu hỏi có liên quan, với việc tự kiểm tra để đảm bảo câu hỏi đáp ứng được yêu cầu về nội dung.

Bước 4: Giải Thích Cặp QA (Explain the QA Pair)

Với mỗi cặp câu hỏi và câu trả lời, mô hình sẽ cần cung cấp một giải thích ngắn gọn sao cho logic và phù hợp với đoạn văn đã cho.

Giai Đoạn Suy Luận (Inference)

Trong giai đoạn này, LLM sẽ sử dụng bộ QA đã được tạo ra trước đó để đưa ra câu hỏi và câu trả lời. Ở đây, chúng tôi sẽ tập trung vào việc lựa chọn (selection) và định dạng lại (format) các ví dụ đã thu được.

Phân Nhóm Dựa Trên Retrieval (Clustering-based Retrieval)

Đối với mỗi câu hỏi cụ thể, các câu hỏi giả lập sẽ được nhóm theo thuật toán k-means và sử dụng Sentence-BERT để tìm ra các ví dụ giống nhau nhất.

Định Dạng và Giải Thích (Answer then Explain)

Các ví dụ được định dạng lại theo thứ tự từ câu hỏi đến câu trả lời, bao gồm cả lời giải thích, nhằm giúp LLM có nhiều thông tin hơn trong quá trình trả lời.

Kết Luận

Self-Prompting là một phương pháp tiên tiến có khả năng tối ưu hóa hiệu suất của các mô hình ngôn ngữ lớn (LLMs). Sự linh hoạt và khả năng thích ứng của nó cho phép áp dụng cho nhiều tác vụ khác nhau mà không cần thay đổi quá nhiều cấu trúc mô hình. Phương pháp này đặc biệt hữu ích trong các tác vụ zero-shot, nơi mô hình cần giải quyết các câu hỏi mà nó chưa được huấn luyện trước đây.

Mặc dù không thể hoàn toàn thay thế CoT, nhưng Self-Prompting đã chứng minh được hiệu quả trong các tác vụ QA với độ chính xác cao nhờ quy trình kiểm tra và giải thích từ chính mô hình mà không cần sự can thiệp của con người.
source: viblo

Giới thiệu về Self-Prompting và Mô Hình Self-Prompting trong Các Tác Vụ QA Mở Zero-Shot