'Vua YouTube' một thời tuyên bố tạo AI vượt ChatGPT, DeepSeek
YouTuber nổi tiếng Felix Kjellberg (được biết đến với kênh PewDiePie) mới đây gây chú ý khi công bố dự án tự huấn luyện mô hình AI và cho rằng nó từng đạt kết quả vượt qua một số mô hình lớn trong các bài kiểm tra hiệu năng.
Tự huấn luyện AI từ mô hình mã nguồn mở
Thay vì xây dựng AI từ đầu, PewDiePie lựa chọn tinh chỉnh (fine-tune) một mô hình mã nguồn mở có sẵn là Qwen 2.5. Đây là mô hình ngôn ngữ lớn do Alibaba Cloud phát triển và được cộng đồng sử dụng rộng rãi cho các dự án nghiên cứu.
Mục tiêu của anh không phải tạo ra sản phẩm thương mại, mà là tự học cách huấn luyện AI và thử xem liệu một cá nhân có thể cải thiện hiệu năng của mô hình mã nguồn mở đến đâu.
Kết quả gây bất ngờ trong các bài kiểm tra
Để đánh giá khả năng lập trình của AI, PewDiePie sử dụng bài benchmark Aider Polyglot – một bài kiểm tra đánh giá khả năng xử lý nhiều ngôn ngữ lập trình.
Trong bài test này:
Các mô hình như DeepSeek 2.5 và Llama 4 Maverick chỉ đạt hơn 18% điểm.
Ban đầu mô hình của PewDiePie đạt 8%, sau khi tối ưu dữ liệu tăng lên 16%.
Anh tiếp tục thu thập 100.000 mẫu dữ liệu từ GitHub và bổ sung thêm 15.000 mẫu dữ liệu reasoning để buộc AI phải suy luận từng bước trước khi trả lời.
Sau nhiều vòng tinh chỉnh, điểm số tăng mạnh:
4,4% → sau tinh chỉnh ban đầu
25% → sau khi tối ưu dữ liệu huấn luyện
36% → khi chạy đầy đủ bộ test
39,1% → sau khi bổ sung thêm dữ liệu chuyên sâu
Con số này từng có thời điểm vượt qua kết quả của GPT-4 của OpenAI trong cùng bài kiểm tra.
Tuy nhiên, ngay sau đó phiên bản mới Qwen 3 ra mắt và đạt khoảng 40%, khiến thành tích của PewDiePie nhanh chóng bị vượt qua.
Sự cố và chi phí không nhỏ
Để huấn luyện AI, PewDiePie đã tự xây dựng hệ thống máy tính trị giá khoảng 20.000 USD (khoảng 500 triệu đồng).
Do hệ thống tiêu thụ hơn 2.000W điện, anh gặp nhiều sự cố:
cháy dây nguồn
quá nhiệt hệ thống
hỏng một GPU đắt tiền
máy thường xuyên bị treo do tải nặng
Anh thậm chí cho biết đã suýt gây cháy nhà trong quá trình thử nghiệm.
Bài học từ dự án cá nhân
Dù kết quả không vượt xa các mô hình thương mại lớn, dự án của PewDiePie cho thấy một xu hướng quan trọng: AI mã nguồn mở đang ngày càng mạnh và dễ tiếp cận, đến mức một cá nhân với phần cứng đủ mạnh vẫn có thể huấn luyện và cải thiện mô hình đáng kể.
Điều này cũng đặt ra câu hỏi lớn cho tương lai AI: khi công nghệ ngày càng phổ biến và rẻ hơn, ai cũng có thể tạo hoặc tinh chỉnh AI mạnh mẽ.
Nếu bạn muốn, mình có thể giải thích thêm một điều khá thú vị: vì sao benchmark AI đôi khi “đánh lừa” người thử nghiệm, khiến nhiều mô hình tưởng mạnh hơn thực tế – đúng như lỗi mà PewDiePie từng gặp trong quá trình huấn luyện.