Lưu ý: Bài viết này được dịch từ bài đăng hàng tuần của DAIR.AI trên LinkedIn. Bạn có thể tham khảo thêm tại đây: https://www.linkedin.com/company/dair-ai/
Giới thiệu
Trong thời gian gần đây, lĩnh vực Machine Learning (Máy Học) đã chứng kiến nhiều đột phá quan trọng. Bài viết này sẽ tóm tắt những tiến bộ nổi bật giữa thời gian từ ngày 12 đến 18 tháng 08 năm 2024, với các công nghệ mới giúp nâng cao hiệu suất và khả năng áp dụng trong thực tế.
1. Tác Nhân AI Nghiên Cứu
Tóm tắt:
- Giới thiệu một tác nhân AI mới cho phép tự động phát triển và viết các bài báo khoa học hạng mục hội nghị với chi phí thấp dưới 15 đô la.
- Tác nhân này sử dụng các mô hình LLM tiên tiến để tiến hành nghiên cứu độc lập và tổng hợp kết quả, cùng một người đánh giá tự động để kiểm tra chất lượng bài báo.
- Khẳng định đạt hiệu suất gần như tương đương với con người trong việc đánh giá chất lượng bài báo, vượt qua ngưỡng chấp nhận tại các hội nghị học máy hàng đầu.
(paper | tweet)
2. Grok-2
Tóm tắt:
- Giới thiệu mô hình Grok-2, một hệ thống mã hóa và suy luận mới với khả năng vượt trội.
- Grok-2 tỏ ra vượt trội so với Claude 3.5 Sonnet và GPT-4-Turbo trong Arenas Chatbot LMSYS.
- Nâng cao khả năng tuân theo chỉ dẫn và độ chính xác trong việc trả lời.
(paper | tweet)
3. LongWriter
Tóm tắt:
- Đưa ra phương pháp AgentWrite cho phép tạo ra nội dung dài hơn 20.000 từ.
- Phương pháp này chia nhỏ nhiệm vụ tạo nội dung thành các phần nhỏ hơn, ứng dụng thuật toán “chia để trị” để đạt được đầu ra liên kết.
- Một mô hình với 9 tỷ tham số đạt hiệu suất hàng đầu nhờ vào các cải tiến DPO.
(paper | tweet)
4. EfficientRAG
Tóm tắt:
- Huấn luyện các mô hình mã hóa để gán nhãn cho các khối văn bản và tạo câu trả lời dựa trên truy vấn originale bằng cách cải thiện quy trình liên tục.
- Quá trình này giúp tối ưu hóa việc phát hiện các khối liên quan và cung cấp thông tin một cách tuần tự, hợp lý cho các câu hỏi.
(paper | tweet)
5. RAGChecker
Tóm tắt:
- Giới thiệu khung đánh giá RAGChecker để chẩn đoán các mô-đun lấy thông tin trong kiến trúc RAG.
- RAGChecker thể hiện mối tương quan tốt hơn so với đánh giá của con người, khám phá nhiều mẫu thiết kế và lựa chọn.
(paper | tweet)
6. HybridRAG
Tóm tắt:
- Kết hợp giữa GraphRAG và VectorRAG để tối ưu hóa hiệu suất, nhắm đến độ chính xác cao hơn trong việc trả lời.
- Thử nghiệm cho thấy rõ ràng mô hình HybridRAG vượt qua hiệu suất của hai mô hình riêng lẻ trên các bài kiểm tra thực tiễn.
(paper | tweet)
7. rStar
Tóm tắt:
- Giới thiệu kỹ thuật suy luận tự chơi để cải thiện khả năng suy luận cho các mô hình ngôn ngữ nhỏ.
- Phương pháp sử dụng MCTS với hành động suy luận giống như con người, từ đó thu nhận các quỹ đạo phong phú hơn, cải thiện độ chính xác đáng kể.
(paper | tweet)
8. Tối Ưu Hóa Tính Toán Thời Gian Chạy Trong LLM
Tóm tắt:
- Nghiên cứu mở rộng cách tính toán và tối ưu hóa để cải thiện hiệu suất LLM trong khi dùng một nguồn tài nguyên cố định.
- Đưa ra chiến lược tối ưu hóa giúp nâng cao hiệu quả lên 4 lần so với tiêu chuẩn hiện tại.
(paper | tweet)
9. MedGraphRAG
Tóm tắt:
- Phát triển khung dựa trên đồ thị cho lĩnh vực y tế, cung cấp nhiều cải tiến trong việc hỗ trợ LLMs y tế.
- Sử dụng phương pháp chia tài liệu tĩnh-ngữ nghĩa giúp thu thập thông tin ngữ cảnh hiệu quả hơn.
(paper | tweet)
10. Tổng Quan Về NL2QL
Tóm tắt:
- Cung cấp cái nhìn tổng quan về các kỹ thuật NL2QL dựa trên LLMs.
- Tóm tắt chi tiết về các mô hình, phương pháp thu thập dữ liệu và phân tích lỗi để góp phần phát triển kỹ thuật này hơn nữa.
(paper | tweet)
source: viblo