0
0
Lập trình
Admin Team
Admin Teamtechmely

Xây Dựng Đại Lý Gọi AI: Kiến Trúc, Thách Thức và Lựa Chọn GoHighLevel

Đăng vào 8 tháng trước

• 6 phút đọc

Giới Thiệu

Chào các bạn trong cộng đồng DEV! 👋 Hôm nay, mình muốn chia sẻ một số kiến thức từ dự án mà mình đã dồn hết tâm huyết trong vài tháng qua: xây dựng một hệ thống sử dụng các đại lý AI để tự động hóa việc đủ điều kiện khách hàng và đặt lịch hẹn.

Việc mơ về AI xử lý các cuộc gọi bán hàng là một chuyện, nhưng việc kiến trúc một hệ thống có thể thực hiện điều đó một cách đáng tin cậy lại là một câu chuyện khác. Mình nghĩ rằng việc phân tích cách tiếp cận của chúng mình, công nghệ sử dụng, và một số khó khăn mà chúng mình đã gặp phải sẽ rất thú vị cho những ai đang tìm hiểu về AI giọng nói hoặc tự động hóa quy trình làm việc.

Vấn Đề Cốt Lõi Chúng Ta Đang Giải Quyết

Việc đủ điều kiện khách hàng một cách thủ công và lên lịch gọi là một công việc tiêu tốn rất nhiều thời gian cho các nhóm bán hàng. Mục tiêu của chúng mình là xem liệu có thể xây dựng một đại lý AI có thể:

  • Thực hiện các cuộc trò chuyện tự nhiên, không giới hạn.
  • Thu thập thông tin cụ thể (trường hợp sử dụng, ngân sách, thời gian).
  • Đủ điều kiện khách hàng dựa trên các tiêu chí tùy chỉnh.
  • Đặt lịch hẹn bằng cách tích hợp với lịch.

Cách Chúng Tôi Thiết Kế Hệ Thống (Phiên Bản Ngắn Gọn)

Đây không chỉ là một lớp bọc fancy cho ChatGPT. Hệ thống này phải quản lý trạng thái, xử lý ngắt quãng, và thực hiện các hành động cụ thể trong cuộc gọi.

1. Giao Diện Giọng Nói

Chúng tôi đang sử dụng sự kết hợp giữa WebRTC cho kết nối cuộc gọi và một mô hình STT (Speech-to-Text) có độ trễ thấp để có bản sao cuộc trò chuyện theo thời gian thực. Đối với TTS (Text-to-Speech), chúng tôi đã chọn một mô hình hiện đại, biểu cảm để tránh giọng "robot" cổ điển.

2. Bộ Não

Điều Phối LLM: Đây là phần cốt lõi. Chúng tôi sử dụng một LLM chính (chúng tôi đã thử nghiệm cả GPT-4 của OpenAI và Claude của Anthropic) như là đại lý giao tiếp. Chúng tôi đã thiết kế một hệ thống nơi LLM hoạt động theo một khuôn khổ ReAct (Reasoning and Acting) nghiêm ngặt. Điều này có nghĩa là phản hồi của nó được hướng dẫn bởi các lời nhắc đã được xác định trước, chỉ định rằng:

  • Phân Tích: Phân tích đầu vào người dùng mới nhất và lịch sử cuộc trò chuyện.
  • Hành Động: Quyết định bước tiếp theo. Có phải là phản hồi bằng một câu hỏi? Thực hiện một chức năng? Chuyển tiếp cuộc gọi?

3. Gọi Hàm / Công Cụ

Đây là nơi phép màu xảy ra. LLM có thể kích hoạt các chức năng cụ thể dựa trên cuộc trò chuyện. Các công cụ chính của chúng tôi là:

  • qualify_lead(parameters): Cập nhật điểm số khách hàng trong cơ sở dữ liệu của chúng tôi dựa trên thông tin đã thu thập.
  • schedule_appointment(time, date): Kiểm tra tính khả dụng của lịch thông qua API.
  • log_information(key, value): Ghi log dữ liệu có cấu trúc cho CRM.

4. Lớp Tự Động Hóa: Tại Sao Chọn GoHighLevel?

Chúng tôi quyết định không xây dựng lại bánh xe. Thay vì xây dựng CRM, trình tự email, và tự động hóa SMS của riêng mình từ đầu, chúng tôi đã tích hợp với API của GoHighLevel. Đây là một bước ngoặt lớn.

  • Khi một cuộc gọi kết thúc, hệ thống của chúng tôi đóng gói tất cả dữ liệu có cấu trúc và đẩy nó vào GoHighLevel dưới dạng một khách hàng mới hoặc một ghi chú trên một liên hệ đã tồn tại.
  • GoHighLevel sau đó tự động kích hoạt SMS, email, hoặc quy trình phân công theo dõi thích hợp dựa trên điểm số đủ điều kiện của khách hàng.
  • Điều này cho phép chúng tôi tập trung 100% vào vấn đề AI và giọng nói, trong khi tận dụng một nền tảng đã được kiểm chứng cho mọi thứ khác.

Những Thách Thức Kỹ Thuật Lớn Nhất

  • Quản Lý Trạng Thái: Giữ cho ngữ cảnh của cuộc trò chuyện nhất quán qua nhiều lượt là một việc khó khăn. Chúng tôi đã thực hiện một hệ thống quản lý trạng thái tùy chỉnh theo dõi lịch sử cuộc trò chuyện, dữ liệu đã thu thập và mục tiêu hiện tại của cuộc gọi.
  • Độ Trễ: Thời gian trễ giữa việc người dùng kết thúc một câu và AI phản hồi cần phải dưới ~400ms để cảm thấy tự nhiên. Tối ưu hóa chuỗi (STT -> LLM -> TTS) là rất quan trọng.
  • Xử Lý Sự Mơ Hồ: Điều gì xảy ra khi AI không hiểu? Chúng tôi đã xây dựng một hệ thống dự phòng có thể hỏi lại một cách duyên dáng hoặc mặc định vào một câu hỏi đã được xác định trước mà không làm gián đoạn dòng chảy.

Đây là cái nhìn tổng quan cấp cao, nhưng mình rất vui được đi sâu vào bất kỳ phần cụ thể nào trong phần bình luận. Bạn đã làm việc trên một cái gì đó tương tự chưa? Mình rất muốn nghe về kiến trúc của bạn hoặc những thách thức mà bạn đã gặp phải!

Các Thực Hành Tốt Nhất

  • Tối Ưu Hóa Hiệu Năng: Đảm bảo rằng mọi thành phần của hệ thống đều được tối ưu hóa để giảm độ trễ và tăng tốc độ phản hồi.
  • Kiểm Tra và Ghi Nhận: Thiết lập hệ thống kiểm tra và ghi nhận để có thể theo dõi hiệu suất và phát hiện sớm các vấn đề.

Các Cạm Bẫy Thường Gặp

  • Quản Lý Context: Không giữ được ngữ cảnh có thể làm cho cuộc trò chuyện trở nên khó hiểu.
  • Phản Hồi Chậm: Độ trễ cao giữa các lượt có thể dẫn đến trải nghiệm người dùng kém.

Mẹo Tối Ưu Hóa Hiệu Suất

  • Sử Dụng Caching: Giảm tải cho hệ thống bằng cách lưu trữ các kết quả truy vấn thường xuyên.
  • Kiểm Tra Mọi Tình Huống: Đảm bảo rằng hệ thống có thể xử lý các tình huống bất ngờ mà không gặp phải lỗi.

Phần Kết

Hy vọng rằng bài viết này đã mang lại cho bạn cái nhìn sâu sắc về cách chúng tôi xây dựng hệ thống đại lý gọi AI của mình. Nếu bạn có bất kỳ câu hỏi nào hoặc muốn chia sẻ kinh nghiệm của mình, đừng ngần ngại để lại bình luận bên dưới! Hãy cùng nhau trao đổi và học hỏi thêm về công nghệ thú vị này nhé!

Câu Hỏi Thường Gặp (FAQ)

1. Đại lý gọi AI là gì?
Đại lý gọi AI là một hệ thống sử dụng trí tuệ nhân tạo để tự động hóa việc gọi điện và tương tác với khách hàng.
2. GoHighLevel là gì?
GoHighLevel là một nền tảng CRM cho phép tự động hóa marketing và quản lý khách hàng hiệu quả.
3. Làm thế nào để cải thiện hiệu suất của hệ thống AI?
Tối ưu hóa từng thành phần, sử dụng caching và thực hiện kiểm tra thường xuyên là những cách hiệu quả.

Tài Nguyên Tham Khảo

Gợi ý câu hỏi phỏng vấn
Không có dữ liệu

Không có dữ liệu

Bài viết được đề xuất
Bài viết cùng tác giả

Bình luận

Chưa có bình luận nào

Chưa có bình luận nào