Giới Thiệu
Các mô hình ngôn ngữ đã có những bước tiến vượt bậc trong thời gian gần đây, mang lại hiệu suất ấn tượng trong nhiều nhiệm vụ khác nhau. Tuy nhiên, những mô hình này thường hoạt động theo một khuôn mẫu tuyến tính, xử lý từng bước một từ đầu đến cuối. Điều này không phải lúc nào cũng phù hợp với những nhiệm vụ đòi hỏi sự lập kế hoạch cẩn thận, điều chỉnh và xem xét lại những quyết định trước đó; đặc biệt là khi những quyết định ban đầu có thể ảnh hưởng đến các bước tiếp theo.
Để giải quyết vấn đề này, khái niệm mới mang tên "Tree of Thoughts" (ToT) đã được giới thiệu. Phương pháp ToT được coi là một bước tiến đáng kể so với kỹ thuật "Chain of Thought" (CoT) truyền thống. Với ToT, các mô hình ngôn ngữ có khả năng "suy nghĩ" qua nhiều đoạn văn bản khác nhau, cho phép xem xét các lựa chọn khác nhau và tự đánh giá các quyết định của mình. Điều này giúp chúng có khả năng lập kế hoạch cho tương lai hoặc thay đổi hướng đi khi đối mặt với những thách thức khác nhau.
Các thử nghiệm cho thấy, ToT đã cải thiện đáng kể khả năng giải quyết vấn đề của các mô hình ngôn ngữ. Thí dụ, trong trò chơi 24 (Game of 24), tỷ lệ thành công khi áp dụng ToT lên tới 74%, so với chỉ 4% với phương pháp truyền thống.
Nền Tảng Kỹ Thuật
Kỹ Thuật Input-output (IO) Prompting
Kỹ thuật "input-output prompting" cho mô hình ngôn ngữ liên quan đến cách định dạng đầu vào để sản xuất ra đầu ra mong muốn. Điều này là rất quan trọng với các mô hình như GPT, vốn có khả năng tạo ra nhiều loại phản hồi khác nhau dựa trên đầu vào cung cấp.
Kỹ Thuật Chain-of-Thought (CoT) Prompting
Trong nhiều tình huống, mối liên hệ giữa đầu vào và đầu ra không rõ ràng. Đặc biệt là trong bài toán phức tạp, nơi mà đầu vào là câu hỏi và đầu ra là đáp án cuối cùng. Kỹ thuật CoT prompting trình bày một chuỗi các bước trung gian, giúp quá trình giải quyết vấn đề trở nên minh bạch hơn, đặc biệt trong các nhiệm vụ phức tạp.
Kỹ Thuật Self-Consistency with Chain-of-Thought (CoT-SC) Prompting
CoT-SC là phương pháp dùng nhiều chuỗi suy nghĩ độc lập để đưa ra quyết định. Phương pháp này không chỉ tạo ra các chuỗi suy nghĩ mà còn chọn kết quả phổ biến nhất từ các chuỗi này, giúp cải thiện độ tin cậy và độ đa dạng của kết quả đầu ra.
Khái Niệm Tree of Thoughts (ToT)
Hãy tưởng tượng việc giải quyết một bài toán như là một hành trình trên một cây. Mỗi nhánh trên cây đại diện cho một cách tiếp cận hoặc một giải pháp tiềm năng. ToT khuyến khích mô hình ngôn ngữ "suy nghĩ" qua nhiều nhánh khác nhau thay vì chỉ tò mò một hướng duy nhất, đồng thời lên kế hoạch và đánh giá lại các quyết định trong suốt quá trình.
1. Phân Chia Quá Trình Thành Các Bước Suy Nghĩ
Mô hình cần phân tách một vấn đề phức tạp thành các bước rõ ràng mà nó có thể theo dõi, tương tự như việc con người làm việc với các vấn đề trong cuộc sống hàng ngày.
2. Tạo Ra Các Suy Nghĩ Tiềm Năng
Từ mỗi trạng thái hiện tại, mô hình phải có khả năng phát triển nhiều bước suy nghĩ khác nhau. Việc này có thể thực hiện thông qua hai phương pháp: lấy mẫu suy nghĩ độc lập hoặc đề xuất suy nghĩ tuần tự.
3. Đánh Giá Heuristic Của Các Trạng Thái
Mỗi trạng thái tiềm năng cần được đánh giá độc lập hoặc so sánh với nhau. Một trong hai cách này sẽ giúp mô hình đưa ra lựa chọn tốt nhất từ vùng lân cận mà nó đang khám phá.
4. Lựa Chọn Thuật Toán Tìm Kiếm
Cả hai thuật toán tìm kiếm cơ bản, Tìm Kiếm Theo Chiều Rộng (BFS) và Tìm Kiếm Theo Chiều Sâu (DFS), đều có thể được áp dụng tùy thuộc vào cấu trúc của cây và bài toán cụ thể.
Kết Luận
Phương pháp "Tree of Thoughts" không chỉ là một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo mà còn là một khung hình cho phép các mô hình ngôn ngữ thực hiện các lộ trình suy luận tương tự như con người. Kỹ thuật này không chỉ cải thiện khả năng giải quyết các vấn đề phức tạp mà còn mở ra những cơ hội mới trong việc phát triển trí tuệ nhân tạo.
Tài Liệu Tham Khảo
- Tree of Thoughts: Deliberate Problem Solving with Large Language Models
- Repo github.
source: viblo