Mô hình R1 của DeepSeek nhận bản cập nhật với những cải tiến lớn về khả năng suy luận và đầu ra, báo hiệu tầm ảnh hưởng ngày càng tăng của Trung Quốc trong cuộc đua AI toàn cầu.
Ảnh chụp màn hình so sánh các mô hình DeepSeek-R1. Ảnh: @OpenRouterAI trên X
DeepSeek vừa tung ra một bản cập nhật nhỏ cho mô hình R1 của mình và hiện đã cho phép thử nghiệm công khai. Những người dùng thử nghiệm đầu tiên cho biết hoạt động của mô hình AI đã thay đổi đáng kể.
Hiện tại, Deepseek vẫn chưa cung cấp thêm chi tiết về bản cập nhật này cũng như chưa có điểm chuẩn cụ thể nào. Điều này khiến người dùng phải tự trải nghiệm, tự tìm hiểu và đánh giá các thay đổi. Những phản ứng ban đầu cho thấy những cải tiến đáng kể về chất lượng và định dạng phản hồi.
Bản cập nhật cho mô hình R1 được xác nhận một cách lặng lẽ trong một tin nhắn từ đại diện công ty được chia sẻ trong nhóm WeChat chính thức của DeepSeek. Được gọi là "bản nâng cấp thử nghiệm nhỏ", phiên bản mới hiện đã được kích hoạt và mở cửa cho công chúng thử nghiệm.
Mặc dù xác nhận việc triển khai, công ty AI này vẫn chưa công bố bất kỳ chi tiết kỹ thuật nào về những gì bản cập nhật bao gồm. Theo báo cáo của Bloomberg, DeepSeek đã không phản hồi yêu cầu bình luận qua email.
Không có thêm giải thích hoặc tài liệu chính thức nào từ DeepSeek ngoài bài đăng trên WeChat, người dùng phải tự tìm hiểu xem mô hình AI đã thay đổi những gì.
Trên X, người dùng nhấn mạnh rằng hành vi Suy luận theo chuỗi suy nghĩ (CoT) của DeepSeek-R1 dường như đã thay đổi đáng kể, với khả năng suy luận có cấu trúc hơn. Một số người cũng lưu ý rằng mô hình giờ đây thể hiện khả năng suy luận sâu sắc hơn, tương tự như các mô hình của Google, chất lượng viết được cải thiện và phong cách thận trọng, có suy nghĩ hơn.
Người dùng Reddit gọi bản cập nhật DeepSeek-R1 là một bước tăng đáng kể trong hiệu suất viết mã, khen ngợi sự mạch lạc hơn và đầu ra sạch hơn, thậm chí còn so sánh với khả năng tạo mã của Claude 3.7.
Tuy nhiên, những người thử nghiệm trên X và Reddit đề cập rằng thời gian phản hồi chậm hơn, nhưng nhiều người coi đó là sự đánh đổi xứng đáng cho kết quả chính xác hơn.
Bản cập nhật R1 mới nhất của DeepSeek có vẻ bình thường, nhưng nó gợi ý một điều gì đó lớn hơn: nỗ lực bền bỉ của Trung Quốc nhằm thay đổi cán cân AI toàn cầu. Quốc gia này đầu tư mạnh mẽ vào nghiên cứu AI, nhân tài và cơ sở hạ tầng. Các công ty như DeepSeek, với những bản nâng cấp mô hình thường xuyên của họ, đóng vai trò trung tâm trong chiến lược này.
Mặc dù được mô tả là một bản thử nghiệm nhỏ, bản cập nhật R1 cho thấy những cải thiện đáng kể về khả năng suy luận và đầu ra. Đáng chú ý, những cải tiến này được người dùng công nhận – chứ không phải do công ty quảng bá – làm tăng thêm độ tin cậy cho bản cập nhật.
Kết hợp với chi phí thấp, DeepSeek đang trở thành một đối thủ đáng gờm cạnh tranh với các mô hình phương Tây đắt tiền hơn. Khi AI có khả năng cao và giá cả phải chăng trở nên dễ tiếp cận hơn, những tiến bộ âm thầm của họ có thể giúp Trung Quốc chuyển từ vị thế người đi theo nhanh chóng sang vị thế dẫn đầu trong cuộc đua AI.
Lúc này, bạn có thể tự trải nghiệm và đánh giá phiên bản Deepseek R1 0528 tại LOSA AI, link thử nghiệm tại đây!