Người trong cuộc tiết lộ DeepSeek V4 sẽ vượt qua Claude và ChatGPT về khả năng lập trình, ra mắt trong vài tuần tới

Bitget

Tin tức

Decrypt2026/01/09 21:40

Hiển thị bản gốc

Theo:Decrypt

Tóm tắt

DeepSeek V4 có thể sẽ ra mắt trong vài tuần tới, hướng đến hiệu suất lập trình ở cấp độ ưu tú.
Người trong cuộc cho rằng nó có thể vượt qua Claude và ChatGPT trong các tác vụ mã hóa với ngữ cảnh dài.
Các nhà phát triển đã rất hào hứng trước khả năng sẽ có sự thay đổi lớn.

Theo thông tin, DeepSeek đang lên kế hoạch ra mắt mô hình V4 vào khoảng giữa tháng Hai, và nếu các thử nghiệm nội bộ là chính xác, các ông lớn AI tại Thung lũng Silicon nên cảm thấy lo lắng.

Startup AI có trụ sở tại Hàng Châu này có thể nhắm đến việc phát hành vào khoảng ngày 17 tháng 2—trùng với Tết Nguyên Đán—với một mô hình được thiết kế riêng cho các tác vụ lập trình, theo

. Những người có kiến thức trực tiếp về dự án cho biết V4 vượt trội hơn cả Claude của Anthropic và dòng GPT của OpenAI trong các bài kiểm tra nội bộ, đặc biệt khi xử lý các đoạn mã cực dài.

Tất nhiên, chưa có bất kỳ bài kiểm tra hay thông tin nào về mô hình này được công bố công khai, nên không thể xác minh trực tiếp các tuyên bố đó. DeepSeek cũng chưa xác nhận các tin đồn này.

Dù vậy, cộng đồng lập trình viên không chờ đợi thông báo chính thức. Trên Reddit, các diễn đàn r/DeepSeek và r/LocalLLaMA đã trở nên sôi động, người dùng đang tích trữ tín dụng API, và nhiều người đam mê trên X nhanh chóng chia sẻ dự đoán rằng V4 có thể khẳng định vị thế "kẻ ngáng đường" của DeepSeek, từ chối tuân theo các quy tắc trị giá hàng tỷ đô của Thung lũng Silicon.

Anthropic đã chặn thuê bao Claude trên các ứng dụng bên thứ ba như OpenCode, và được cho là cũng cắt quyền truy cập của xAI và OpenAI.

Claude và Claude Code rất tốt, nhưng chưa tốt hơn gấp 10 lần. Điều này chỉ khiến các phòng thí nghiệm khác đẩy nhanh tốc độ phát triển các mô hình/agent lập trình của họ.

DeepSeek V4 được đồn đoán sẽ ra mắt…

— Yuchen Jin (@Yuchenj_UW) 9 tháng 1, 2026

Đây cũng không phải là lần đầu DeepSeek tạo ra sự xáo trộn. Khi công ty phát hành mô hình suy luận R1 vào tháng 1 năm 2025, điều đó đã kích hoạt một đợt bán tháo trị giá 1 nghìn tỷ đô la trên các thị trường toàn cầu.

Lý do? DeepSeek R1 đạt được kết quả tương đương với mô hình o1 của OpenAI trên các bài kiểm tra toán học và suy luận, dù chi phí phát triển chỉ khoảng 6 triệu đô—rẻ hơn khoảng 68 lần so với chi phí của các đối thủ. Mô hình V3 sau đó đạt 90,2% trên bài kiểm tra MATH-500, vượt xa Claude với 78,3% và bản cập nhật gần đây “V3.2 Speciale” còn cải thiện hiệu suất hơn nữa.

Người trong cuộc tiết lộ DeepSeek V4 sẽ vượt qua Claude và ChatGPT về khả năng lập trình, ra mắt trong vài tuần tới image 0

Ảnh: DeepSeek

Trọng tâm về lập trình của V4 sẽ là một sự chuyển hướng chiến lược. Nếu như R1 tập trung vào suy luận thuần túy—logic, toán học, chứng minh hình thức—thì V4 là một mô hình lai (tác vụ suy luận và không suy luận) nhắm vào thị trường lập trình viên doanh nghiệp, nơi việc tạo ra mã chính xác cao sẽ chuyển thành doanh thu thực tế.

Để khẳng định vị thế, V4 sẽ cần vượt qua Claude Opus 4.5, hiện đang giữ kỷ lục SWE-bench Verified với 80,9%. Nhưng nếu xét theo các lần ra mắt trước đây của DeepSeek, điều này có thể không phải là bất khả thi, ngay cả với những hạn chế mà một phòng thí nghiệm AI tại Trung Quốc phải đối mặt.

Bí quyết không quá bí mật

Giả sử các tin đồn là đúng, làm thế nào một phòng thí nghiệm nhỏ lại có thể đạt được thành tựu như vậy?

Vũ khí bí mật của công ty có thể nằm trong bài báo nghiên cứu ngày 1 tháng 1 của họ: Manifold-Constrained Hyper-Connections, hay mHC. Đồng tác giả là nhà sáng lập Liang Wenfeng, phương pháp huấn luyện mới này giải quyết một vấn đề cơ bản trong việc mở rộng các mô hình ngôn ngữ lớn—làm thế nào để mở rộng dung lượng mô hình mà không khiến nó trở nên bất ổn hoặc "nổ tung" trong quá trình huấn luyện.

Các kiến trúc AI truyền thống buộc mọi thông tin phải đi qua một kênh hẹp duy nhất. mHC mở rộng kênh đó thành nhiều luồng có thể trao đổi thông tin mà không gây sụp đổ trong quá trình huấn luyện.

Người trong cuộc tiết lộ DeepSeek V4 sẽ vượt qua Claude và ChatGPT về khả năng lập trình, ra mắt trong vài tuần tới image 1

Ảnh: DeepSeek

Wei Sun, nhà phân tích chính về AI tại Counterpoint Research, gọi mHC là một “bước đột phá nổi bật” khi bình luận với

. Theo bà, kỹ thuật này cho thấy DeepSeek có thể “vượt qua các nút thắt về tính toán và mở khóa bước nhảy vọt về trí tuệ,” ngay cả khi khả năng tiếp cận chip tiên tiến bị hạn chế do lệnh cấm xuất khẩu của Mỹ.

Lian Jye Su, nhà phân tích trưởng tại Omdia, lưu ý rằng việc DeepSeek sẵn sàng công bố phương pháp của mình cho thấy một “niềm tin mới trong ngành AI Trung Quốc.” Phương pháp mã nguồn mở của công ty đã biến họ trở thành cái tên được yêu thích trong cộng đồng lập trình, những người xem DeepSeek như hiện thân của những gì OpenAI từng là, trước khi xoay sang các mô hình đóng và những vòng gọi vốn hàng tỷ đô la.

Không phải ai cũng bị thuyết phục. Một số lập trình viên trên Reddit phàn nàn rằng các mô hình suy luận của DeepSeek lãng phí tài nguyên tính toán vào các tác vụ đơn giản, trong khi các nhà phê bình cho rằng các bài kiểm tra của công ty không phản ánh sự phức tạp của thực tế. Một bài viết trên Medium có tiêu đề “DeepSeek tệ—Và tôi sẽ không giả vờ nữa” đã lan truyền vào tháng 4 năm 2025, cáo buộc các mô hình tạo ra “mã mẫu vô nghĩa có lỗi” và “thư viện tưởng tượng.”

DeepSeek cũng mang theo không ít phiền toái. Các mối lo ngại về quyền riêng tư đã ám ảnh công ty, với việc một số chính phủ cấm ứng dụng gốc của DeepSeek. Mối liên hệ với Trung Quốc và các câu hỏi về kiểm duyệt trong các mô hình càng làm gia tăng căng thẳng địa chính trị cho các cuộc tranh luận kỹ thuật.

Dù vậy, động lực là rõ ràng. DeepSeek đã được áp dụng rộng rãi tại châu Á, và nếu V4 đáp ứng được các lời hứa về lập trình, thì việc doanh nghiệp phương Tây áp dụng cũng có thể xảy ra.

Người trong cuộc tiết lộ DeepSeek V4 sẽ vượt qua Claude và ChatGPT về khả năng lập trình, ra mắt trong vài tuần tới image 2

Ảnh: Microsoft

Vấn đề còn nằm ở thời điểm. Theo

, DeepSeek ban đầu dự định phát hành mô hình R2 vào tháng 5 năm 2025, nhưng đã kéo dài lịch trình sau khi nhà sáng lập Liang không hài lòng với hiệu suất của nó. Hiện tại, với việc V4 được cho là sẽ ra mắt vào tháng 2 và R2 có thể tiếp theo vào tháng 8, công ty đang tiến với tốc độ cho thấy sự cấp bách—hoặc tự tin. Có thể là cả hai.

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.

APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.

Khóa ngay!