Mới đây, giới công nghệ được một phen xôn xao khi phát hiện bản nâng cấp DeepSeek R1 được phát hành trên kho lưu trữ mô hình AI Hugging Face. Đáng chú ý, bản thân DeepSeek lại không hề có bất kỳ thông báo gì về bản nâng cấp này.
DeepSeek.webp
Có thể thấy, động thái này tương tự lần ra mắt đầu tiên của mô hình R1, khi DeepSeek chọn cách không ồn ào để xuất hiện, nhưng vẫn gây chấn động nhờ chất lượng vượt trội và mã nguồn mở miễn phí.
Tại thời điểm đó, R1 nhanh chóng vượt mặt nhiều mô hình cùng loại đến từ những tên tuổi lớn như Meta hay OpenAI, gây bất ngờ vì được phát triển trong thời gian ngắn với chi phí thấp chỉ 5,6 triệu USD. Điều này làm dấy lên lo ngại rằng các “gã khổng lồ” công nghệ Mỹ đang đầu tư quá mức vào hạ tầng AI, xóa sạch hàng tỷ đô la giá trị cổ phiếu của các công ty như Nvidia - nhà sản xuất chip chủ chốt cho ngành công nghiệp AI. Dù sau đó các cổ phiếu này đã phục hồi, cú sốc mà DeepSeek tạo ra vẫn để lại dấu ấn rõ nét.
Với phiên bản nâng cấp R1, DeepSeek vẫn đi theo hướng phát triển mô hình lý luận - loại AI có khả năng xử lý nhiệm vụ phức tạp thông qua lập luận từng bước. Trên bảng xếp hạng LiveCodeBench, trang đánh giá hiệu suất các mô hình AI, phiên bản nâng cấp DeepSeek R1 chỉ đứng sau o4-mini và o3 của OpenAI.
Adina Yakefu, nhà nghiên cứu AI tại Hugging Face, nhận xét: “Bản nâng cấp mới nhất của DeepSeek nhạy bén hơn về lý luận, mạnh mẽ hơn về toán học và mã hóa, đồng thời gần với các mô hình hàng đầu như Gemini và O3”.
Mô hình nâng cấp có "những cải tiến lớn trong suy luận và giảm ảo giác", ông Yakefu nói thêm rằng "phiên bản mới cho thấy DeepSeek không chỉ bắt kịp, màn còn đang từng bước khẳng định vị thế của mình”.
Sự kiện này tiếp tục cho thấy nỗ lực của Trung Quốc trong việc phát triển trí tuệ nhân tạo bất chấp những hạn chế từ phía chính phủ Mỹ, đặc biệt là các lệnh siết xuất khẩu chip và công nghệ liên quan. Cùng thời điểm, các tập đoàn lớn của Trung Quốc như Baidu và Tencent cũng công bố các cải tiến mô hình AI nhằm thích ứng với bối cảnh thiếu hụt phần cứng.
Sightsea Labs, QuillAudits và nhiều đối tác sắp phối hợp tổ chức sự kiện Doodle & Giggle trong tuần lễ công nghệ tại Đà Nẵng, kỳ vọng thúc đẩy hợp tác công nghệ trong khu vực châu Á - Thái Bình Dương.