Giới Thiệu
Trong phần Chương 1, chúng ta đã khám phá cách mà các mô hình ngôn ngữ hoạt động dựa trên tokens. Mỗi token không chỉ có chi phí mà còn ảnh hưởng đến giới hạn bộ nhớ của mô hình. Điều này có nghĩa là, mỗi từ bạn thêm vào đều có giá và đóng góp vào bộ nhớ hạn chế của mô hình.
Các prompt dài hơn có thể cung cấp ngữ cảnh phong phú hơn, nhưng chúng cũng có thể làm tăng độ trễ, chi phí và có thể gặp phải giới hạn độ dài của mô hình.
Chúng ta sẽ cùng khám phá các nhóm kỹ thuật prompting chính, mỗi nhóm áp dụng các nguyên tắc này theo những cách khác nhau, đồng thời giới thiệu các phương pháp được thiết kế cho các trường hợp sử dụng cụ thể.
Kỹ Thuật Kỹ Thuật Prompt
Kỹ Thuật Kỹ Thuật Prompt Là Gì?
Kỹ Thuật Prompt là việc thiết kế, cấu trúc, và tối ưu hóa các chỉ dẫn (prompt) nhằm hướng dẫn các mô hình AI sinh sinh, với mục tiêu đảm bảo rằng chúng hiểu và phản hồi một cách chính xác và hiệu quả với nhiều loại truy vấn, phù hợp với mục tiêu của người dùng.
Lĩnh vực này không chỉ đơn thuần là viết hướng dẫn mà còn bao gồm việc hiểu cách mà các mô hình xử lý thông tin và áp dụng các kỹ thuật cụ thể để tối đa hóa hiệu quả của giao tiếp giữa con người và máy tính, đảm bảo rằng hệ thống hiểu đúng nhiệm vụ, ngữ cảnh và định dạng phản hồi mong đợi.
Phân Loại Các Kỹ Thuật Kỹ Thuật Prompt
Chúng ta sẽ phân loại các kỹ thuật này thành bốn nhóm chính để dễ dàng nghiên cứu và hiểu rõ hơn về các kỹ thuật kỹ thuật prompt. Mặc dù tài liệu chuyên ngành có thể trình bày các cách phân loại khác, tôi đã quyết định tổ chức chúng thành bốn nhóm để giúp hiểu nhanh mục tiêu và các ứng dụng phổ biến nhất dựa trên kinh nghiệm thực tế của bản thân.
Nhóm 1: Theo Số Lượng Ví Dụ
Trước khi đi vào các chiến lược nâng cao, hãy bắt đầu từ những điều cơ bản: mô hình cần thấy bao nhiêu để hiểu điều chúng ta muốn? Đôi khi một chỉ dẫn đơn giản là đủ (zero-shot). Đôi khi, việc cho một ví dụ (one-shot) hay một vài ví dụ (few-shot) là hữu ích. Nhóm này tập trung vào "dạy thông qua ví dụ", là cánh cửa dẫn đến hầu hết các kỹ thuật prompting.
Zero-shot prompting: Yêu cầu mô hình thực hiện một nhiệm vụ mà không cần cho nó thấy ví dụ trước đó.
Một số khuyến nghị:
🎯Thích hợp cho:Các nhiệm vụ đơn giản, các lĩnh vực đã biết, ứng dụng tiết kiệm chi phí, thử nghiệm nhanh.💡Đánh đổi:Nhanh và rẻ (ít token) nhưng độ chính xác thấp hơn cho các nhiệm vụ phức tạp hoặc chuyên ngành.❌Tránh khi:Làm việc với thuật ngữ chuyên ngành, yêu cầu định dạng phức tạp, hoặc các loại nhiệm vụ mới.
Ví dụ:
Viết một email mời chính thức cho một sự kiện kết nối doanh nghiệp do một công ty công nghệ tổ chức.
One-shot prompting: Bao gồm một ví dụ duy nhất để hướng dẫn mô hình.
Một số khuyến nghị:
🎯Thích hợp cho:Thử nghiệm định dạng phản hồi, khi bạn có ít ví dụ có sẵn, thiết lập các mẫu cơ bản.💡Đánh đổi:Tốt hơn zero-shot cho định dạng, nhưng ví dụ đơn lẻ có thể tạo ra sự thiên lệch đối với phong cách cụ thể đó.❌Tránh khi:Nhiệm vụ có nhiều cách tiếp cận hợp lệ hoặc khi ví dụ đơn lẻ có thể làm mô hình hiểu sai.
Ví dụ:
Viết một email mời chính thức cho các sự kiện chuyên nghiệp.
Ví dụ:
"Chủ đề: Thư Mời Tham Dự Diễn Đàn Đổi Mới Sức Khỏe Hàng Năm
Kính gửi Tiến sĩ Smith,
Chúng tôi rất vui mừng mời bạn tham dự Diễn Đàn Đổi Mới Sức Khỏe Hàng Năm diễn ra vào ngày 10 tháng 3 tại New York City…"Bây giờ hãy viết một lời mời cho một sự kiện kết nối doanh nghiệp do một công ty công nghệ tổ chức.
Few-shot prompting: Bao gồm một vài ví dụ để củng cố mẫu.
Một số khuyến nghị:
🎯Thích hợp cho:Các nhiệm vụ phức tạp, các lĩnh vực chuyên ngành, khi độ chính xác biện minh cho chi phí gia tăng, thiết lập các mẫu nhất quán.💡Đánh đổi:Độ chính xác và nhất quán cao hơn nhưng tốn 3-5 lần token đầu vào (chi phí cao hơn và prompt dài hơn).❌Tránh khi:Làm việc với các nhiệm vụ đơn giản, hạn chế ngân sách nghiêm ngặt, hoặc khi khó tạo ví dụ.
Ví dụ:
Viết email mời chuyên nghiệp theo các mẫu sau:
Ví dụ 1:
"Chủ đề: Thư Mời Tham Dự Diễn Đàn Đổi Mới Sức Khỏe Hàng Năm
Kính gửi Tiến sĩ Smith,
Chúng tôi rất vui mừng mời bạn tham dự Diễn Đàn Đổi Mới Sức Khỏe Hàng Năm diễn ra vào ngày 10 tháng 3 tại New York City…"
Ví dụ 2:
"Chủ đề: Tham Gia Hội Nghị Fintech Toàn Cầu
Kính gửi Bà Johnson,
Chúng tôi rất hân hạnh mời bạn tham gia Hội Nghị Fintech Toàn Cầu, dự kiến diễn ra vào ngày 15 tháng 4 tại London…"
Ví dụ 3:
"Chủ đề: Thư Mời Tham Dự Gala Lãnh Đạo Văn Hóa
Kính gửi Ông Brown,
Bạn được mời tham dự Gala Lãnh Đạo Văn Hóa vào ngày 20 tháng 5 tại Paris…"Bây giờ hãy viết một lời mời cho một sự kiện kết nối doanh nghiệp do một công ty công nghệ tổ chức.
Nhóm 2: Kỹ Thuật Cá Nhân Hóa
Việc khiến mô hình “trả lời chính xác” là một chuyện, nhưng nếu bạn cũng cần nó phát âm như một bác sĩ, một giáo viên, hay một luật sư? Hay điều chỉnh giọng điệu của nó để trở nên trang trọng, thuyết phục, hoặc vui vẻ? Nhóm này tập hợp các kỹ thuật định hình giọng điệu, danh tính và cảm xúc của mô hình, giúp đầu ra không chỉ có ý nghĩa mà còn phù hợp với tình huống hoặc khán giả.
Kỹ Thuật Định Dạng
Kỹ thuật này điều chỉnh giọng điệu, cách diễn đạt hoặc định dạng phản hồi của mô hình để phù hợp với một ngữ cảnh cụ thể, cho phép cùng một nội dung được diễn đạt một cách chính thức, sáng tạo, kỹ thuật hoặc thân mật.
Quá trình thực hiện nó là:
- Chỉ định giọng điệu hoặc phong cách mong muốn.
- Cụ thể hóa nội dung cần được tạo ra.
Một số khuyến nghị:
- 🎯Thích hợp cho: Tính nhất quán thương hiệu, yêu cầu giao tiếp cụ thể, phù hợp với giọng điệu nội dung hiện tại.
- 💡 Đánh đổi: Đảm bảo phong cách nhất quán nhưng có thể làm mất đi các mẫu phản hồi tự nhiên cho loại nội dung.
- ❌Tránh khi: Phong cách mâu thuẫn với vai trò, hoặc khi loại nội dung có các quy tắc đã thiết lập.
Nhóm 3: Kỹ Thuật Cải Thiện Lý Luận Và Chất Lượng Phản Hồi
Đây là nơi chúng ta chuyển từ việc chỉ "phản hồi" sang thực sự suy nghĩ trước khi phản hồi. Những kỹ thuật này hướng dẫn mô hình cấu trúc lý luận của nó, khám phá các phương án thay thế, và xây dựng các câu trả lời đáng tin cậy hơn. Chúng nổi bật khi bạn đang đối mặt với các vấn đề phức tạp, quy trình nhiều bước, hoặc các quyết định quan trọng mà độ chính xác là điều cần thiết nhất.
🪜 Kỹ Thuật Chuỗi Lý Luận (CoT) – lý luận từng bước
Kỹ thuật prompting này hướng dẫn mô hình tạo ra các bước lý luận trung gian trước khi đưa ra câu trả lời cuối cùng. Thay vì yêu cầu câu trả lời trực tiếp, prompt cấu trúc nhiệm vụ thành các bước nhỏ hơn và yêu cầu mô hình giải quyết chúng theo thứ tự. Phương pháp này có thể giảm lỗi trong các vấn đề phức tạp và cải thiện độ rõ ràng.
✅ Kỹ Thuật Tự Nhất Quán
Kỹ thuật này nâng cao khả năng lý luận bằng cách tạo ra nhiều con đường lý luận cho cùng một vấn đề và chọn ra kết quả nhất quán nhất. Mô hình khám phá các phương pháp thay thế, so sánh các câu trả lời thu được và chọn ra câu trả lời được hỗ trợ bởi sự đồng thuận lớn nhất.
Nhóm 4: Kỹ Thuật Cải Thiện Hiểu Biết Và Tương Tác
Cuối cùng, chúng ta đến với những kỹ thuật giúp các cuộc trò chuyện với mô hình trở nên mượt mà và chính xác hơn. Tập trung vào việc giảm thiểu sự mơ hồ, kiểm tra hiểu biết và làm phong phú ngữ cảnh. Với những chiến lược này, mô hình trở thành một cộng sự chú ý và đáng tin cậy hơn—hoàn hảo cho các trợ lý nâng cao hoặc quy trình nhiều bước.
Kỹ Thuật Ngữ Cảnh
Kỹ thuật này cải thiện độ chính xác của phản hồi bằng cách cung cấp thêm thông tin ngữ cảnh trước khi đưa ra câu hỏi hoặc yêu cầu. Mục tiêu là để mô hình hiểu rõ hơn về tình huống và phản hồi với độ liên quan cao hơn.
Các bước cơ bản để thực hiện điều này là:
- Thêm dữ liệu liên quan vào prompt về sự kiện (nơi, ngày tháng, khán giả, mục đích), nơi cũng có thể liên quan đến các giới hạn hoặc phạm vi nhất định (ví dụ: chỉ ở những nơi gần đó) hoặc một số khía cạnh cần nhấn mạnh như chi phí/hiệu suất.
- Cụ thể hóa yêu cầu một cách rõ ràng.
Kỹ Thuật Đọc Lại (RE2)
Kỹ thuật này bao gồm việc đọc và xử lý thông tin hai lần trước khi phản hồi, để cải thiện độ chính xác và tránh bỏ sót.
Việc đọc đầu tiên xác định các điểm chính; lần đọc thứ hai xác nhận và tổ chức chúng để tạo ra phản hồi.
Hạn Chế Và Các Yếu Tố Ảnh Hưởng Đến Chất Lượng Phản Hồi
Mặc dù các mô hình ngôn ngữ rất mạnh mẽ, nhưng chúng có những hạn chế vốn có và chịu tác động của các yếu tố có thể làm giảm chất lượng phản hồi hoặc tạo ra rủi ro bổ sung. Hiểu rõ những hạn chế này là điều cần thiết để sử dụng công nghệ một cách có trách nhiệm và hiệu quả.
Ảo Tưởng
Ảo tưởng là một trong những thách thức chính của AI sinh sinh và xảy ra khi một mô hình tạo ra nội dung có vẻ hợp lý nhưng thực tế lại không chính xác hoặc thiếu hỗ trợ thực tế.
Kết Luận
Kỹ thuật prompting cung cấp một bộ công cụ mạnh mẽ để hướng dẫn các mô hình ngôn ngữ và giúp chúng lý luận từng bước, theo dõi ví dụ hoặc điều chỉnh giọng điệu và phong cách. Tuy nhiên, không quan trọng là chúng ta đã tinh chỉnh các prompt như thế nào, các mô hình vẫn bị giới hạn bởi dữ liệu mà chúng được đào tạo và có thể vẫn tạo ra ảo tưởng khi không chắc chắn.
Trong chương tiếp theo, chúng ta sẽ khám phá các mẫu RAG, từ đơn giản đến nâng cao, và xem cách chúng mở rộng việc prompting thành các hệ thống sẵn sàng cho doanh nghiệp.