0
0
Lập trình
NM

Tự động tóm tắt biên bản cuộc họp với n8n và AI

Đăng vào 7 tháng trước

• 5 phút đọc

Chủ đề:

KungFuTech

Giới thiệu

Bạn có bao giờ cảm thấy ngợp với hàng đống biên bản cuộc họp hoặc ghi chú phỏng vấn? Nếu việc tóm tắt chúng có thể hoàn toàn tự động? Tôi đã xây dựng một quy trình làm việc với n8n để tự động lấy các tệp biên bản từ Google Drive, tóm tắt chúng qua một mô hình ngôn ngữ lớn (LLM), và đẩy kết quả vào Google Sheets mà không cần bất kỳ nỗ lực thủ công nào.

Tôi sẽ công bố quy trình hoàn chỉnh trên GitHub và trong bài viết này, tôi sẽ hướng dẫn bạn cách nó hoạt động, lý do tôi xây dựng nó và cách bạn có thể áp dụng nó cho các dự án của riêng mình.


Vấn đề cần giải quyết

  • Các tổ chức lớn hoặc người sáng tạo nội dung thường tạo ra các biên bản dài—cuộc gọi, podcast, phỏng vấn, bài giảng.
  • Việc tóm tắt thủ công mất nhiều thời gian và không nhất quán.
  • Các thông tin quý giá thường bị lạc giữa hàng tấn văn bản không cấu trúc.

Giới thiệu n8n và LLMs

Với n8n, một công cụ tự động hóa quy trình làm việc mã nguồn mở, và các mô hình ngôn ngữ lớn hiện đại (thông qua OpenRouter/OpenAI), bạn có thể tự động hóa:

  1. Phát hiện các tệp biên bản mới trong Google Drive
  2. Giải mã và làm sạch văn bản
  3. Chia các biên bản lớn thành các phần nhỏ hơn (≤4000 ký tự)
  4. Tóm tắt từng phần một cách nhất quán thành:
    • Một tóm tắt 3 câu
    • Danh sách các vấn đề
    • Danh sách các yêu cầu tính năng
    • Gộp và loại bỏ trùng lặp tóm tắt
    • Định dạng kết quả cho rõ ràng
    • Lưu hoặc cập nhật kết quả trong Google Sheets bằng cách khớp với CallID

Không cần lập trình ngoại trừ việc làm sạch JavaScript đơn giản—chỉ cần kéo, cấu hình và chạy.


Cách quy trình làm việc hoạt động (Bước từng bước)

  1. Kích hoạt Google Drive
    Giám sát một thư mục Drive cụ thể (ví dụ: “Biên bản”) và kích hoạt khi một tệp mới được thêm vào.

  2. Tải xuống
    Lấy tệp nhị phân để có thể xử lý.

  3. Giải mã nhị phân → rawText
    Phát hiện xem tệp là UTF-8 hay UTF-16, loại bỏ BOM và chuyển đổi thành văn bản có thể đọc được.

  4. Tải biên bản
    Chuyển văn bản đã giải mã vào một biến để xử lý tiếp theo.

  5. Tiền xử lý

    • Chuẩn hóa ngắt dòng
    • Thay thế [inaudible] bằng “âm thanh không rõ ràng”
    • Xóa địa chỉ email và số điện thoại để bảo mật
  6. Chia biên bản

    • Chia theo các dòng đã cắt gọn thành các phần nhỏ hơn dưới ~4000 ký tự
    • Xử lý các dòng dài bằng cách cắt chúng
  7. Chuỗi LLM cơ bản
    Gửi từng phần đến LLM với một lệnh để trả về JSON nghiêm ngặt với:

    • summary: chính xác 3 câu
    • pain_points[]
    • feature_requests[]
  8. Gộp các tóm tắt

    • Nối tất cả các tóm tắt phần lại với nhau
    • Loại bỏ trùng lặp các vấn đề & yêu cầu tính năng
  9. Định dạng cho Sheet

    • Tạo ra:
      • CallID (hoặc được truyền vào hoặc tự sinh ra)
      • Tóm tắt nhiều dòng (mỗi câu một dòng)
      • Danh sách có dấu đầu dòng cho các vấn đề / yêu cầu tính năng
  10. Thêm hoặc cập nhật trong Google Sheets

  • Khớp trên CallID để tránh trùng lặp
  • Thêm hoặc cập nhật hàng trong bảng tính của bạn

(Add a screenshot or diagram of the workflow if available.)


Tại sao điều này quan trọng

  • Tiết kiệm thời gian – Không còn phải lục lọi qua các biên bản thủ công
  • Độ nhất quán – Một lệnh có cấu trúc đảm bảo đầu ra đồng nhất
  • Bảo mật – Thông tin nhạy cảm được xóa tự động
  • Khả năng mở rộng – Việc chia nhỏ có nghĩa là giải pháp hoạt động trên các biên bản dài
  • Tùy chỉnh – Muốn tóm tắt 5 câu hoặc thêm siêu dữ liệu? Chỉ cần điều chỉnh lệnh hoặc nút mã chia nhỏ.

Cách sử dụng

  1. Sao chép & nhập kho:

    Copy
    git clone https://github.com/arafatruetbd/n8n-transcript-summarizer.git
  2. Trong n8n:

    • Workflows → Nhập từ Tệp, chọn JSON
    • Kết nối lại thông tin xác thực của bạn:
      • Google Drive
      • Google Sheets
      • OpenRouter hoặc nhà cung cấp LLM khác
    • Cấu hình:
      • ID thư mục Drive
      • ID & GID bảng tính
      • Tên mô hình nếu cần
  3. Kích hoạt và thử nghiệm. Tải lên một biên bản vào Drive và xem tóm tắt xuất hiện trong bảng tính!


Ý tưởng tùy chỉnh

  • Thêm một node Slack để tự động đăng tóm tắt vào một kênh
  • Gửi tóm tắt qua email
  • Lưu trữ biên bản sau khi tóm tắt
  • Sử dụng một LLM khác (ví dụ: mô hình cục bộ hoặc Llama trên máy chủ tự lưu trữ)
  • Bao gồm siêu dữ liệu bổ sung, chẳng hạn như tên người nói, dấu thời gian, thời gian gọi, v.v.

Kêu gọi hành động

Toàn bộ quy trình làm việc và README có trên GitHub:
https://github.com/arafatruetbd/n8n-transcript-summarizer

Hãy tự do sao chép, điều chỉnh hoặc phân nhánh. Tôi rất muốn xem những gì bạn xây dựng trên nền tảng này hoặc cách bạn cải thiện nó—hãy để lại bình luận, vấn đề hoặc yêu cầu kéo!


Tóm tắt

Quy trình làm việc này biến nhiệm vụ tóm tắt biên bản thành một tự động hóa dễ dàng nhờ vào n8n và LLMs. Dù bạn đang làm việc trong nghiên cứu, sản phẩm, hỗ trợ khách hàng hay sáng tạo nội dung—nếu bạn muốn một cách thông minh hơn để biến biên bản thành thông tin, hãy thử nghiệm với nó.

Gợi ý câu hỏi phỏng vấn
Không có dữ liệu

Không có dữ liệu

Bài viết được đề xuất
Bài viết cùng tác giả

Bình luận

Chưa có bình luận nào

Chưa có bình luận nào