0
0
Lập trình
Sơn Tùng Lê
Sơn Tùng Lê103931498422911686980

Công Cụ Sửa Ảnh Tuân Thủ AEC - Giải Pháp An Toàn Thông Minh

Đăng vào 7 tháng trước

• 6 phút đọc

Công Cụ Sửa Ảnh Tuân Thủ AEC

Đề xuất cho Thử thách Đa phương tiện Google AI Studio.
Một ứng dụng web sử dụng AI phân tích ảnh công trường nhằm phát hiện vấn đề về thiết bị bảo hộ cá nhân (PPE) và ngay lập tức tạo ra phiên bản an toàn tuân thủ quy định.


Demo

Ứng dụng trực tuyến: https://aec-compliance-image-fixer-111886031714.us-west1.run.app/


Mục Lục

  • Những Gì Tôi Đã Xây Dựng

    • Tổng Quan Ứng Dụng
    • Vấn Đề Mà Nó Giải Quyết
    • Trải Nghiệm Người Dùng
  • Cách Tôi Sử Dụng Google AI Studio

    • Cách Sử Dụng Google AI Studio
    • Các Tính Năng Đa Phương Tiện Được Triển Khai
  • Các Tính Năng Đa Phương Tiện

    • Những Gì Tôi Đã Xây Dựng (Quy Trình Chỉnh Sửa)
    • Tại Sao Nó Tăng Cường Trải Nghiệm Người Dùng
  • Ghi Chú Kỹ Thuật

  • Được Xây Dựng Bởi


Những Gì Tôi Đã Xây Dựng

Tổng Quan Ứng Dụng

Ứng dụng này là một công cụ sử dụng AI cho ngành Kiến trúc, Kỹ thuật và Xây dựng (AEC). Nó tự động phát hiện các vấn đề về PPE trong ảnh công trường và có thể áp dụng các chỉnh sửa tuân thủ quy định—được căn cứ theo các tiêu chuẩn phổ biến như OSHA—trực tiếp lên hình ảnh.

Vấn Đề Mà Nó Giải Quyết

Các tài liệu tiếp thị, sổ tay đào tạo và tài liệu dự án phải thể hiện sự tuân thủ nghiêm ngặt các quy tắc an toàn. Một bức ảnh có thể hoàn hảo ngoại trừ một vi phạm nhỏ (ví dụ: thiếu kính bảo hộ, nhãn dán không tuân thủ trên mũ bảo hiểm, hoặc loại mũ không đúng). Truyền thống, việc chỉnh sửa này yêu cầu chụp lại hoặc chỉnh sửa thủ công mất thời gian. Ứng dụng này cung cấp một giải pháp nhanh chóng, tiết kiệm chi phí.

Trải Nghiệm Người Dùng

  1. Tải Lên & Phân Tích
    Người dùng tải lên một bức ảnh công trường và nhấp vào Phân Tích Ảnh. Một mô hình thị giác quét các vấn đề PPE phổ biến và trả về một tóm tắt (ví dụ: “Thiếu kính bảo hộ”, “Mũ không tiêu chuẩn đã phát hiện”), tự động chọn các chỉnh sửa được đề xuất trong giao diện người dùng.

  2. Chỉnh Sửa & Tải Xuống
    Người dùng chấp nhận các đề xuất của AI hoặc chọn thêm các chỉnh sửa khác (ví dụ: Gỡ bỏ nhãn dán trên mũ, Thêm găng tay bảo hộ) hoặc thêm hướng dẫn tùy chỉnh. Nhấp vào Chỉnh Sửa Ảnh kích hoạt một mô hình tạo hình ảnh chỉnh sửa bức ảnh. Hình ảnh cuối cùng, tuân thủ quy định được tạo ra và sẵn sàng để tải xuống.

Tóm lại: một trợ lý thông minh xác định các vấn đề an toàn và chỉnh sửa chúng ngay lập tức, tiết kiệm thời gian, công sức và tài nguyên.


Cách Tôi Sử Dụng Google AI Studio

Cách Sử Dụng Google AI Studio

  • Tiên phong nhanh chóng: Các lời nhắc cốt lõi cho cả phân tích và chỉnh sửa được lặp lại trong AI Studio, cho phép thử nghiệm A/B nhanh chóng giữa các mô hình và chiến lược lời nhắc.
  • Truy cập API đơn giản: Ứng dụng gọi các mô hình Gemini qua đường dẫn /api-proxy/; AI Studio quản lý an toàn khóa API ở nền mà không cần khóa trong mã khách hàng.
  • Môi trường tích hợp: Trình biên tập mã, xem trước trực tiếp và truy cập mô hình trong một nơi đã tạo ra một vòng lặp liền mạch từ việc viết đến thử nghiệm UX AI.

Các Tính Năng Đa Phương Tiện Được Triển Khai

  1. Phân Tích Ảnh Powered by AI (Hiểu Biết Thị Giác)
  • Đầu vào đa phương tiện: Ảnh công nhân (hình ảnh) + một lời nhắc văn bản chi tiết được gửi đến mô hình gemini-2.5-flash.
  • Nhiệm vụ: Hành động như một chuyên gia an toàn; kiểm tra hình ảnh để phát hiện vấn đề PPE (ví dụ: thiếu kính, mũ không tiêu chuẩn, nhãn dán).
  • Đầu ra đa phương tiện: Một phản hồi JSON có cấu trúc chứa (a) một tóm tắt có thể đọc được và (b) cờ boolean cho các chỉnh sửa được đề xuất.
  1. Chỉnh Sửa Ảnh Powered by AI (Thị Giác Tạo Hình)
  • Đầu vào đa phương tiện: Bức ảnh gốc (hình ảnh) + một lời nhắc văn bản được tạo từ các chỉnh sửa đã chọn và bất kỳ hướng dẫn tùy chỉnh nào.
  • Nhiệm vụ: Sử dụng gemini-2.5-flash-image-preview (chuyên về chỉnh sửa) để áp dụng các chỉnh sửa thực tế mà tôn trọng tư thế, ánh sáng và phong cách.
  • Đầu ra đa phương tiện: Một hình ảnh mới, đã chỉnh sửa—tuân thủ an toàn và sẵn sàng để sử dụng.

Các Tính Năng Đa Phương Tiện

Những Gì Tôi Đã Xây Dựng (Quy Trình Chỉnh Sửa)

Chức năng cốt lõi Chỉnh Sửa Ảnh tận dụng gemini-2.5-flash-image-preview:

  • Dữ liệu ảnh: Bức ảnh gốc của người dùng.
  • Lời nhắc động: Được xây dựng từ các tùy chọn giao diện người dùng (ví dụ: Thêm Kính Bảo Hộ, Gỡ Bỏ Nhãn Dán Trên Mũ) cộng với bất kỳ văn bản tùy chỉnh nào. Điều này cho AI biết chính xác những gì cần thay đổi.
  • Kết quả: Một hình ảnh mới tích hợp các chỉnh sửa được yêu cầu một cách tự nhiên và hợp lý.

Tại Sao Nó Tăng Cường Trải Nghiệm Người Dùng

  • Điều khiển ngôn ngữ tự nhiên: Không cần phần mềm chỉnh sửa ảnh chuyên nghiệp; người dùng làm việc với các ô tích hoặc tiếng Anh đơn giản (ví dụ: “Thêm áo vest an toàn màu cao”).
  • Thực tế theo ngữ cảnh: Các chỉnh sửa tính đến góc đầu, ánh sáng cảnh và phong cách chụp ảnh—không có dấu hiệu “dán nhãn” rõ ràng.
  • Linh hoạt & nhanh chóng: Các chỉnh sửa phổ biến chỉ cần một cú nhấp chuột; trường nhập liệu tùy chỉnh hỗ trợ các trường hợp đặc biệt và yêu cầu sáng tạo.

Ghi Chú Kỹ Thuật

  • Nền tảng: Được xây dựng và lưu trữ trong Google AI Studio.
  • Mô hình: gemini-2.5-flash (phân tích) và gemini-2.5-flash-image-preview (chỉnh sửa).
  • Bảo mật: Truy cập API được định tuyến qua /api-proxy/ của AI Studio, giữ cho các khóa nằm ngoài mã ứng dụng.

Được Xây Dựng Bởi

Tác giả: https://dev.to/beardedbe4n

Thực Hành Tốt Nhất

  • Luôn kiểm tra ảnh trước khi tải lên: Đảm bảo rằng ảnh không bị mờ hoặc thiếu thông tin cần thiết.
  • Sử dụng các hướng dẫn rõ ràng: Khi thêm các hướng dẫn tùy chỉnh, hãy chắc chắn rằng chúng dễ hiểu và cụ thể.

Các Cạm Bẫy Thường Gặp

  • Quá phụ thuộc vào AI: Mặc dù AI rất mạnh, nhưng việc xác nhận các chỉnh sửa vẫn cần thiết để đảm bảo an toàn.
  • Không thử nghiệm đủ: Hãy đảm bảo rằng bạn thử nghiệm nhiều trường hợp khác nhau để tối ưu hóa hiệu suất.

Mẹo Hiệu Suất

  • Giảm kích thước ảnh trước khi tải lên: Điều này sẽ giúp tăng tốc độ phân tích và chỉnh sửa.
  • Sử dụng kết nối mạng ổn định: Đảm bảo rằng bạn có kết nối mạng tốt để tránh bị gián đoạn trong quá trình xử lý.

Câu Hỏi Thường Gặp

  1. Công cụ này có sử dụng miễn phí không?
    • Có, bạn có thể sử dụng miễn phí với một số hạn chế.
  2. Tôi có thể tải ảnh lên từ đâu?
    • Bạn có thể tải ảnh từ máy tính hoặc thiết bị di động của mình.
  3. Công cụ này có hỗ trợ các ngôn ngữ khác không?
    • Hiện tại, công cụ chỉ hỗ trợ tiếng Anh và tiếng Việt.

Kết Luận

Công cụ Sửa Ảnh Tuân Thủ AEC là một giải pháp hiệu quả và thông minh cho ngành xây dựng, giúp tiết kiệm thời gian và chi phí. Hãy thử ngay ứng dụng để đảm bảo an toàn cho công trường của bạn!

Gợi ý câu hỏi phỏng vấn
Không có dữ liệu

Không có dữ liệu

Bài viết được đề xuất
Bài viết cùng tác giả

Bình luận

Chưa có bình luận nào

Chưa có bình luận nào