Khám Phá Mặt Trái Của OpenAI: 12 Sự Thật Đáng Ngạc Nhiên
Trong quá trình lướt YouTube, tôi đã tình cờ xem một video có tiêu đề Cuốn Sách Đã Thay Đổi Cách Tôi Nghĩ Về AI. Tò mò, tôi đã nhấp vào video và được giới thiệu về cuốn sách Empire of AI của Karen Hao, một cuốn sách đi sâu vào sự phát triển của OpenAI.
Cuốn sách khám phá lịch sử của OpenAI, văn hóa bí mật của nó và sự theo đuổi gần như duy nhất của trí tuệ nhân tạo tổng quát (AGI). Dựa trên các cuộc phỏng vấn với hơn 260 người, cùng với thư từ và tài liệu nội bộ, Hao vẽ nên một bức tranh rõ nét về công ty.
Sau khi đọc cuốn sách, tôi đã khám phá ra 12 sự thật đặc biệt thú vị về OpenAI mà hầu hết mọi người không biết. Hãy cùng tìm hiểu.
1. Từ “Open” trong OpenAI Hơn Cả Chỉ Là Thương Hiệu
Tên gọi nghe có vẻ cao quý, ai mà không thích ý tưởng về AI “mở”? Nhưng đây là cái bẫy: từ những ngày đầu, sự mở ra chỉ là một câu chuyện hơn là một cam kết. Các nhà sáng lập Sam Altman, Greg Brockman và Elon Musk đã tận dụng điều này vì nó giúp họ nổi bật. Tuy nhiên, sau cánh cửa đóng kín, đồng sáng lập Ilya Sutskever đã gợi ý rằng họ có thể thu hẹp lại khi câu chuyện đã phục vụ mục đích của nó. Nói cách khác: mở, cho đến khi không còn tiện lợi.
2. Lời Hứa Một Tỷ Đô La Của Elon Musk? Chủ Yếu Là Ảo Tưởng
Bạn còn nhớ lời hứa tài trợ 1 tỷ đô la hào nhoáng của Musk chứ? Hóa ra, OpenAI chỉ nhận được khoảng 130 triệu đô la. Và chưa đến 45 triệu đô la đến trực tiếp từ Musk. Sự lật lọng về tài trợ của ông đã gần đẩy tổ chức vào khủng hoảng, buộc Altman phải tìm kiếm nguồn tiền mới.
3. Sự Chuyển Đổi Sang Mô Hình Tư Nhân Hơn Là Về Tầm Nhìn
Vào năm 2019, OpenAI đã công bố cấu trúc “lợi nhuận giới hạn”, quảng bá như một cách đổi mới để cân bằng giữa sứ mệnh và lợi nhuận. Nhưng sự thật thì kém lấp lánh hơn nhiều: mô hình phi lợi nhuận không mang lại hàng tỷ đô la cần thiết để cạnh tranh với các gã khổng lồ công nghệ. Có lúc, Brockman và Sutskever thậm chí đã thảo luận về việc sáp nhập với một công ty khởi nghiệp chip. Việc tạo ra OpenAI LP không phải là một tầm nhìn táo bạo mà là một phao cứu sinh.
4. Mô Hình “Lợi Nhuận Giới Hạn” Nhìn Giống Như Không Giới Hạn Với Các Nhà Đầu Tư
Các nhà đầu tư được thông báo rằng lợi nhuận của họ sẽ bị giới hạn ở 100 lần. Nghe có vẻ có trách nhiệm, đúng không? Nhưng hãy làm phép toán: một tấm séc 10 triệu đô la vẫn có thể biến thành 1 tỷ đô la. Các nhà phê bình ngay lập tức gọi nó là “cơ bản không giới hạn”, lập luận rằng giới hạn chỉ có vẻ có ý nghĩa cho đến khi bạn nhìn thấy các con số thực tế.
5. Câu Chuyện “Quá Nguy Hiểm” Của GPT-2 Là Một Chiến Lược PR Tài Tình
Vào năm 2019, OpenAI tuyên bố mô hình GPT-2 của họ mạnh đến mức phải bị giữ lại vì lý do an toàn. Các tiêu đề bùng nổ. Nhưng đây là khúc quanh: nhiều nhà nghiên cứu cho rằng các tuyên bố về rủi ro đã bị thổi phồng và xem toàn bộ điều này như một trò lừa bịp do Jack Clark, giám đốc truyền thông của OpenAI vào thời điểm đó, dàn dựng. Chiến thuật này đã thành công—công ty bỗng dưng có mặt ở khắp mọi nơi.
6. Văn Hóa OpenAI Có Nhiều “Bộ Tộc” Đối Kháng
Bên trong OpenAI, mọi thứ không hề hòa hợp. Sam Altman đã mô tả tổ chức này như được chia thành ba thành phần: những người khám phá nghiên cứu, những người ủng hộ an toàn, và những người xây dựng theo tư duy khởi nghiệp. Ông thậm chí đã cảnh báo về “cuộc chiến bộ tộc” nếu họ không thể hợp tác. Đó không chỉ là sự căng thẳng tại nơi làm việc mà còn là dấu hiệu của sự xung đột sâu sắc về định hướng của công ty.
7. Ra Mắt ChatGPT Là Một Tai Nạn
Bạn nghĩ rằng sự ra mắt của ChatGPT được lên kế hoạch cẩn thận? Không hề. Sản phẩm đã khiến OpenAI trở thành tên tuổi quen thuộc đã được phát hành chỉ trong hai tuần dưới dạng “xem trước nghiên cứu”, ngay sau Lễ Tạ ơn 2022. Sự vội vàng này một phần là để vượt qua một chatbot được đồn đại từ Anthropic. Ngay cả Microsoft—đối tác lớn nhất của OpenAI—cũng bị bất ngờ và báo cáo rằng họ cảm thấy khó chịu.
8. Dữ Liệu Huấn Luyện Bao Gồm Sách Bị Đánh Cắp và Video YouTube
Làm thế nào để bạn có đủ dữ liệu để huấn luyện một thứ như GPT-3 hoặc GPT-4? Trong trường hợp của OpenAI, bằng cách thu thập gần như mọi thứ họ có thể. GPT-3 sử dụng một tập dữ liệu bí mật có tên “Books2”, mà theo báo cáo bao gồm các tác phẩm bị đánh cắp từ Library Genesis. GPT-4 thậm chí còn tiến xa hơn, với nhân viên phiên âm video YouTube và thu thập bất kỳ thứ gì trực tuyến mà không có cảnh báo “không thu thập”.
9. “An Toàn AI” Ban Đầu Bỏ Qua Tác Hại Xã Hội
OpenAI thích nói về an toàn AI bây giờ. Nhưng từ sớm, các giám đốc đã kháng cự trước những lời kêu gọi mở rộng thuật ngữ để bao gồm các tác hại thực tế như phân biệt đối xử và thiên kiến. Khi bị thúc ép, một lãnh đạo đã thẳng thừng nói: “Đó không phải là vai trò của chúng tôi.” Thông điệp rất rõ ràng: an toàn có nghĩa là rủi ro tồn vong, không phải tác động hàng ngày.
10. Mở Rộng Cũng Đi Kèm Với Chi Phí Môi Trường Ẩn Giấu
Các mô hình lớn hơn cần nhiều tính toán và tài nguyên hơn. Việc huấn luyện GPT-4 tại các trung tâm dữ liệu của Microsoft ở Iowa đã tiêu tốn khoảng 11,5 triệu gallon nước chỉ trong một tháng, trong thời kỳ hạn hán. Thú vị thay, Altman và các lãnh đạo khác được báo cáo là không bao giờ thảo luận về những chi phí môi trường này trong các cuộc họp toàn công ty.
11. “SummerSafe LP” Có Nguồn Cảm Hứng Tối Tăm
Trước khi OpenAI LP có tên công khai, nó đã được thành lập bí mật với tên “SummerSafe LP”. Tham chiếu đến một tập của Rick and Morty, nơi một chiếc xe, có nhiệm vụ giữ cho Summer an toàn, đã resort đến việc giết chóc và tra tấn. Bên trong, đó là một sự ám chỉ mỉa mai về cách các hệ thống AI có thể biến những mục tiêu tốt đẹp thành những kết quả nguy hiểm.
12. Nhân Viên Ra Đi Đối Mặt Với Áp Lực Cổ Phần
Các tài liệu bị rò rỉ tiết lộ OpenAI đã sử dụng một chiến thuật cứng rắn với những nhân viên ra đi: ký một thỏa thuận không công kích nghiêm ngặt hoặc có nguy cơ mất cổ phần đã được cấp. Điều này thực chất đã buộc người ta phải im lặng suốt đời. Altman sau đó cho biết ông không biết điều này đang xảy ra và cảm thấy xấu hổ, nhưng các hồ sơ cho thấy ông đã ký giấy tờ cấp cho công ty những quyền đó một năm trước đó.
Kết Luận
Câu chuyện về OpenAI không hề đơn giản. Từ những lời hứa bị phá vỡ và xung đột nội bộ đến các thực tiễn dữ liệu gây tranh cãi, công ty thường hoạt động theo cách không khớp với thông điệp công khai của mình. Dù bạn xem đó là chiến lược khéo léo, những cơn đau phát triển lộn xộn, hay điều gì đó đáng lo ngại hơn, phụ thuộc vào quan điểm của bạn.
Nhưng một điều rõ ràng: “mở” trong OpenAI luôn phức tạp.