Giới thiệu

Hãy tưởng tượng: Bạn đã dành nhiều tháng để tối ưu hóa tác nhân AI của mình để xử lý hỗ trợ khách hàng một cách xuất sắc. Sau đó, bạn thêm nhiều kiến thức vào bộ nhớ RAG của nó để cải thiện cơ sở tri thức cho các sản phẩm mới. Đột nhiên, nó bắt đầu đưa ra những lời khuyên tệ hại về sản phẩm ban đầu của bạn. Nghe có quen không?

Đây không phải là một lỗi; nó là một giới hạn cơ bản gọi là quên thảm khốc. Khi các hệ thống AI học thông tin mới, chúng thực sự đôi khi quên những gì đã học trước đó. Nó giống như việc có một nhân viên bị mất trí nhớ hoàn toàn mỗi khi họ tham dự một buổi đào tạo.

Đối với các doanh nghiệp triển khai các tác nhân AI, điều này tạo ra một kịch bản ác mộng:

Chi phí đào tạo lại có thể lên tới hàng triệu đô la.
Các tác nhân mất đi kiến thức quan trọng chỉ sau một đêm hoặc một phản hồi.
Khó khăn trong việc triển khai các hệ thống AI thực sự thích ứng.
Nỗi sợ hãi liên tục rằng các cập nhật sẽ phá vỡ các chức năng hiện có.

Rủi ro là rất cao. Khi các tác nhân AI trở nên tinh vi hơn và xử lý nhiều chức năng kinh doanh quan trọng hơn, chúng ta không thể chấp nhận các hệ thống quên mọi thứ mà chúng đã học.

Chúng ta cần một cách đầu tiên để trực quan hóa hiệu suất của các tác nhân AI của mình. Chúng ta cần cho phép chia sẻ bộ nhớ giữa các tổ chức và các tác nhân AI của họ.

Tại sao các giải pháp truyền thống không hiệu quả

Hầu hết các nỗ lực để giải quyết vấn đề này tập trung vào việc điều chỉnh kiến trúc mô hình hoặc các kỹ thuật đào tạo tinh vi, hoặc thậm chí là đổi mới trong các tham số mô hình. Nhưng vấn đề không chỉ nằm ở mô hình; nó còn liên quan đến cách mà tác nhân AI lưu trữ, truy xuất kiến thức và hành động dựa trên nó.

Các phương pháp hiện tại bao gồm:

Cơ sở dữ liệu vector: Tốt cho độ tương đồng ngữ nghĩa, nhưng về cơ bản là các tìm kiếm từ khóa tinh vi sử dụng các đối tượng được đại diện dưới dạng dữ liệu nhiều chiều và các phép toán toán học của các khoảng cách được tính toán như độ tương đồng cosine.
Biểu đồ tri thức: Xuất sắc trong việc xử lý các mối quan hệ có cấu trúc nhưng tệ trong việc xử lý thông tin tinh vi, giàu nhúng mà các tác nhân AI hiện đại cần.

Hệ thống kết hợp Vector-Graph

Tốt hơn, nhưng chúng vẫn coi bộ nhớ như một vấn đề lưu trữ tĩnh hơn là một thách thức học tập động. Không có phương pháp nào trong số này giải quyết vấn đề cốt lõi: Các tác nhân AI cần một hệ thống bộ nhớ có thể học liên tục và cho phép hợp tác và chia sẻ kiến thức giữa nhiều tác nhân mà không quên những gì nó đã biết.

Học hỏi từ sinh học: Giải pháp từ não bộ

Đây là nơi mà mọi thứ trở nên thú vị. Bộ não con người đã giải quyết vấn đề này hàng triệu năm trước thông qua một cái gọi là hệ thống học tập bổ sung.

Hippocampus: Nhanh chóng lưu trữ các trải nghiệm mới như ký ức tình huống.
Neocortex: Từ từ tích hợp những trải nghiệm này vào kiến thức có cấu trúc lâu dài.
Cơ chế phát lại: Trong lúc ngủ, hippocampus phát lại các trải nghiệm cho neocortex để củng cố.

Điều này tạo ra sự cân bằng hoàn hảo trong bộ não con người cho việc học liên tục. Trong học máy, học máy liên tục vẫn là một chủ đề nghiên cứu; giải pháp đạt được điều này phải tạo ra sự cân bằng giữa plasticity và stability trong máy móc, giống như trong bộ não con người:

Plasticity: Bạn có thể nhanh chóng học thông tin mới.
Stability: Việc học mới không xóa bỏ ký ức cũ. Liệu chúng ta có thể xây dựng một hệ thống bộ nhớ AI mà không cần phải cố gắng quá sức để thực hiện điều này?

Giới thiệu MeridianDB: Hệ thống bộ nhớ giúp các tác nhân AI học liên tục (Thiết kế nguyên mẫu)

Có hai cách để xây dựng một cơ sở dữ liệu liên kết như vậy: sử dụng một ngôn ngữ lập trình hiệu suất cao như Rust, C, hoặc thậm chí Go và xây dựng mọi thứ từ đầu. Nhưng vì tôi chỉ là một người tò mò yêu thích việc xây dựng, tôi đã chọn ngăn xếp của Cloudflare với các công nghệ sau: NodeJS, Hono, Cloudflare Workers, D1, Vectorize, KV và các giải pháp khác của Cloudflare, cùng với React (bảng điều khiển). Điều này cho phép tôi phát triển nguyên mẫu nhanh hơn và nhận được phản hồi có thể để cải thiện thiết kế.

Có nhiều giới hạn trong ngăn xếp, nhưng nó có thể xử lý lưu lượng lớn một cách dễ dàng; ví dụ, một giới hạn là D1 chỉ có 10 GB dung lượng lưu trữ. Chúng tôi có thể có một cơ sở dữ liệu D1 cho mỗi tác nhân và chia sẻ kiến thức giữa các tác nhân một cách thuật toán.

Kiến trúc bộ nhớ kép

Thay vì chỉ lưu trữ dựa trên vector hoặc biểu đồ, chúng tôi sẽ tạo một cơ sở dữ liệu vector-graph bằng cách kết hợp.

Vectorize: Nhanh chóng lưu trữ các trải nghiệm mới dưới dạng các nhúng nhiều chiều.
D1: Từ từ xây dựng một biểu đồ tri thức có cấu trúc giữa mọi thực thể mà các tác nhân AI nhúng.
KV: Lưu trữ các thực thể thường xuyên truy cập, phiên, phân tích và các trường hợp sử dụng khác.

Tinh chỉnh bộ nhớ thông minh

Thay vì chỉ lưu trữ ký ức, MeridianDB chủ động tinh chỉnh chúng:

Nhận diện các trải nghiệm quan trọng cần được bảo tồn.
Nhóm các ký ức tương tự để tránh sự dư thừa.
Cập nhật mối quan hệ dựa trên thông tin mới.
Cắt giảm kiến thức lỗi thời hoặc mâu thuẫn.

Kiểm soát Stability-Plasticity

Một hệ thống điều tiết tích hợp mà:

Quyết định khi nào ưu tiên học mới so với việc bảo tồn kiến thức cũ.
Áp dụng các tỷ lệ học khác nhau dựa trên tầm quan trọng và tính mới.
Ngăn chặn quên thảm khốc thông qua điều chỉnh thông minh.

Vượt xa sự tương đồng đơn giản: Trí tuệ ngữ cảnh

Các cơ sở dữ liệu truyền thống tìm thông tin dựa trên sự tương đồng thông qua việc tính toán khoảng cách trong nhiều mô hình toán học. MeridianDB tìm thông tin dựa trên mối liên quan. Khi tác nhân AI của bạn truy vấn thông tin, MeridianDB xem xét:

Tương đồng ngữ nghĩa: Ý nghĩa của truy vấn
Ngữ cảnh tạm thời: Khi nào thông tin được học và độ gần đây của nó
Ngữ cảnh môi trường: Tình huống mà tác nhân đang ở
Tiện ích hành vi: Thông tin nào đã hữu ích trong các tình huống tương tự
Mối quan hệ biểu đồ: Cách các khái niệm kết nối với nhau thông qua trải nghiệm của tác nhân và sự tinh chỉnh của con người.

Cách tiếp cận đa chiều này có nghĩa là các tác nhân nhận được câu trả lời tốt hơn, không chỉ là những câu trả lời tương tự.

Hợp tác đa tác nhân mà không hỗn loạn

Đây là nơi mà mọi thứ trở nên mạnh mẽ. MeridianDB cho phép nhiều tác nhân AI chia sẻ kiến thức mà không can thiệp vào nhau.

Các khả năng chủ chốt:

Học tập hợp tác: Các tác nhân có thể học từ trải nghiệm của nhau.
Chia sẻ chọn lọc: Các tổ chức kiểm soát kiến thức nào được chia sẻ giữa các tổ chức và giữa các tác nhân thông qua kiểm soát quyền truy cập tinh vi.
Chuyển giao giữa các tác nhân: Các chiến lược thành công tự động lan rộng.
Giải quyết mâu thuẫn: Hệ thống xử lý thông tin mâu thuẫn một cách linh hoạt.

Hãy tưởng tượng có một tác nhân bán hàng học hỏi từ các tương tác hỗ trợ khách hàng hoặc một hệ thống gợi ý sản phẩm cải thiện dựa trên các mẫu mua hàng thực tế, tất cả đều xảy ra một cách tự động và an toàn.

Xây dựng cho quy mô trên Cloudflare's Edge

MeridianDB tận dụng cơ sở hạ tầng toàn cầu của Cloudflare để cung cấp:

Ngăn xếp kỹ thuật:

D1: Lưu trữ metadata có cấu trúc và biểu đồ thuộc tính
Vectorize: Nhúng nhiều chiều với thời gian truy xuất dưới 100 ms
KV: Quản lý phiên và phân tích thời gian thực
R2: Lưu trữ và hệ thống sao lưu tài liệu
Workers: Tính toán tại biên cho truy cập toàn cầu với độ trễ thấp

Tối ưu hóa hiệu suất:

Lượng tử hóa nhúng để truy xuất nhanh hơn
Lưu trữ các thực thể thường xuyên truy cập
Tải biểu đồ lười để giảm thiểu chi phí bộ nhớ
Hoạt động vector theo lô để cập nhật hiệu quả

Kiến trúc này mang lại hiệu suất cấp doanh nghiệp: <500 ms cho các truy vấn đơn giản, <2000 ms cho lý luận nhiều bước phức tạp.

Đo lường những gì quan trọng: Phân tích quên

MeridianDB bao gồm phân tích tích hợp để theo dõi những gì các hệ thống truyền thống bỏ qua:

Chuyển giao ngược (BWT): Mức độ học mới ảnh hưởng đến kiến thức cũ
Đường cong quên: Tỷ lệ suy giảm kiến thức theo thời gian
Hiệu quả chuyển giao: Tính hiệu quả của việc chia sẻ kiến thức giữa các tác nhân
Chi phí tính toán: Theo dõi chi phí lưu trữ và truy vấn
Tỷ lệ ổn định: Cân bằng giữa học tập và giữ lại

Những chỉ số này cho phép bạn tối ưu hóa các mẫu học của các tác nhân AI và phát hiện vấn đề trước khi chúng ảnh hưởng đến sản xuất.

Ứng dụng thực tế

Tiến hóa hỗ trợ khách hàng

Thay vì đào tạo lại toàn bộ bot hỗ trợ của bạn khi bạn ra mắt các sản phẩm mới, các tác nhân học liên tục từ mỗi tương tác trong khi duy trì chuyên môn về các sản phẩm hiện có.

Trợ lý AI đa miền

Triển khai các tác nhân có thể xử lý nhiều chức năng kinh doanh—nhân sự, bán hàng và hỗ trợ kỹ thuật—mà không có sự phân chia kiến thức hoặc can thiệp giữa các miền.

Đội ngũ nghiên cứu hợp tác

Nhiều nhà nghiên cứu AI có thể đóng góp vào các cơ sở tri thức chung, với việc tự động giải quyết mâu thuẫn và tích hợp kiến thức.

Hệ thống gợi ý thích ứng

Các hệ thống gợi ý học từ hành vi người dùng trong thời gian thực trong khi duy trì hiểu biết về sở thích lâu dài và các mẫu theo mùa.

Tài liệu tham khảo

Parisi, G. I., Kemker, R., Part, J. L., Kanan, C., & Wermter, S. (2019). Học liên tục trong suốt cuộc đời với mạng nơ-ron: Một bài đánh giá [Đánh giá tài liệu]. Mạng nơ-ron. arXiv preprint arXiv:1802.07569 arXiv
Mikolov, T., Sutskever, I., Chen, K., Corrado, G., & Dean, J. (2013). Các đại diện phân phối của từ và cụm từ và tính tổng hợp của chúng. arXiv preprint arXiv:1310.4546 arXiv
Angles, R. (2018). Mô hình cơ sở dữ liệu biểu đồ thuộc tính. CEUR Workshop Proceedings, 2100. https://ceur-ws.org/Vol-2100/paper26.pdf CEUR-WS

Giải pháp trí tuệ nhân tạo với MeridianDB: Ngăn chặn mất trí nhớ