Nếu như năm 2025 là năm AI được kiểm tra cảm nhận, thì năm 2026 sẽ là năm công nghệ này trở nên thực tiễn. Sự chú ý đã bắt đầu chuyển từ việc xây dựng các mô hình ngôn ngữ ngày càng lớn hơn sang công việc khó khăn hơn là làm cho AI trở nên hữu dụng. Thực tế, điều này liên quan đến việc triển khai các mô hình nhỏ hơn khi phù hợp, tích hợp trí tuệ vào các thiết bị vật lý, và thiết kế các hệ thống tích hợp mượt mà vào quy trình làm việc của con người.
Các chuyên gia mà TechCrunch phỏng vấn đều nhận định 2026 sẽ là năm chuyển giao, chuyển từ phương pháp mở rộng thô bạo sang nghiên cứu các kiến trúc mới, từ các bản trình diễn lòe loẹt sang các ứng dụng triển khai mục tiêu, và từ các agent hứa hẹn tính tự động sang các agent thực sự tăng cường cách con người làm việc.
Bữa tiệc vẫn chưa kết thúc, nhưng ngành công nghiệp đang bắt đầu tỉnh táo lại.
Các quy luật mở rộng không còn phù hợp
Tín dụng hình ảnh:Amazon Năm 2012, Alex Krizhevsky, Ilya Sutskever và Geoffrey Hinton với bài báo ImageNet đã chỉ ra cách hệ thống AI có thể “học” nhận diện vật thể trong hình ảnh bằng cách nhìn vào hàng triệu ví dụ. Phương pháp này tiêu tốn nhiều tài nguyên tính toán, nhưng đã trở nên khả thi nhờ GPU. Kết quả? Một thập kỷ nghiên cứu AI chuyên sâu khi các nhà khoa học phát minh ra các kiến trúc mới cho nhiều nhiệm vụ khác nhau.
Điều đó lên đến đỉnh điểm vào khoảng năm 2020 khi OpenAI ra mắt GPT-3, cho thấy chỉ đơn giản là làm cho mô hình lớn hơn 100 lần đã mở khóa các khả năng như lập trình và lập luận mà không cần huấn luyện rõ ràng. Đây là bước chuyển sang cái mà Kian Katanforoosh, CEO và nhà sáng lập nền tảng agent AI Workera, gọi là “thời đại mở rộng”: một giai đoạn được xác định bởi niềm tin rằng càng nhiều sức mạnh tính toán, càng nhiều dữ liệu, và các mô hình transformer lớn hơn sẽ chắc chắn thúc đẩy các đột phá lớn tiếp theo trong AI.
Hiện nay, nhiều nhà nghiên cứu cho rằng ngành công nghiệp AI đang bắt đầu chạm tới giới hạn của các quy luật mở rộng và sẽ một lần nữa chuyển sang thời kỳ nghiên cứu.
Yann LeCun, cựu trưởng bộ phận AI của Meta, từ lâu đã phản đối việc quá phụ thuộc vào việc mở rộng, và nhấn mạnh nhu cầu phát triển các kiến trúc tốt hơn. Sutskever cũng đã nói trong một phỏng vấn gần đây rằng các mô hình hiện tại đang đạt đến ngưỡng và kết quả huấn luyện trước đã chững lại, cho thấy cần có ý tưởng mới.
Tham gia danh sách chờ Disrupt 2026
Thêm bạn vào danh sách chờ Disrupt 2026 để là người đầu tiên nhận vé Early Bird khi mở bán. Các sự kiện Disrupt trước đây từng có sự góp mặt của Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil, và Vinod Khosla trên sân khấu — cùng hơn 250+ lãnh đạo ngành mang đến hơn 200+ phiên thảo luận nhằm thúc đẩy sự phát triển và sắc bén của bạn. Ngoài ra, bạn còn được gặp hàng trăm startup đổi mới trong mọi lĩnh vực.
Tham gia danh sách chờ Disrupt 2026
Thêm bạn vào danh sách chờ Disrupt 2026 để là người đầu tiên nhận vé Early Bird khi mở bán. Các sự kiện Disrupt trước đây từng có sự góp mặt của Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil, và Vinod Khosla trên sân khấu — cùng hơn 250+ lãnh đạo ngành mang đến hơn 200+ phiên thảo luận nhằm thúc đẩy sự phát triển và sắc bén của bạn. Ngoài ra, bạn còn được gặp hàng trăm startup đổi mới trong mọi lĩnh vực.
“Tôi nghĩ rất có thể trong năm năm tới, chúng ta sẽ tìm ra một kiến trúc tốt hơn, cải tiến đáng kể so với transformer,” Katanforoosh nói. “Và nếu không, chúng ta không thể kỳ vọng nhiều vào sự cải tiến của các mô hình.”
Đôi khi ít lại là nhiều
Các mô hình ngôn ngữ lớn rất giỏi tổng quát hóa kiến thức, nhưng nhiều chuyên gia cho rằng làn sóng tiếp theo của AI doanh nghiệp sẽ được thúc đẩy bởi các mô hình ngôn ngữ nhỏ hơn, linh hoạt hơn, có thể tinh chỉnh cho các giải pháp chuyên biệt.
“SLM được tinh chỉnh sẽ là xu hướng lớn và trở thành tiêu chuẩn được các doanh nghiệp AI trưởng thành sử dụng vào năm 2026, vì lợi thế về chi phí và hiệu suất sẽ thúc đẩy việc sử dụng thay vì các LLM có sẵn,” Andy Markus, giám đốc dữ liệu của AT&T, nói với TechCrunch. “Chúng tôi đã thấy các doanh nghiệp ngày càng dựa vào SLM vì nếu được tinh chỉnh đúng cách, chúng đạt độ chính xác ngang với các mô hình lớn hơn, tổng quát hơn cho các ứng dụng doanh nghiệp và vượt trội về mặt chi phí và tốc độ.”
Chúng ta đã từng nghe luận điểm này từ startup AI open-weight Pháp Mistral: Họ cho rằng các mô hình nhỏ của họ thực sự hoạt động tốt hơn các mô hình lớn ở một số tiêu chuẩn sau khi tinh chỉnh.
“Hiệu quả, tiết kiệm chi phí và khả năng thích nghi của SLM khiến chúng trở nên lý tưởng cho các ứng dụng tùy chỉnh nơi độ chính xác là tối quan trọng,” Jon Knisley, chiến lược gia AI tại ABBYY, một công ty AI doanh nghiệp có trụ sở tại Austin, chia sẻ.
Trong khi Markus cho rằng SLM sẽ là chìa khóa trong thời đại agentic, Knisley nói rằng bản chất của các mô hình nhỏ khiến chúng phù hợp hơn để triển khai trên các thiết bị cục bộ, “một xu hướng được thúc đẩy bởi sự phát triển của điện toán biên.”
Học hỏi qua trải nghiệm
Tín dụng hình ảnh:World Labs/TechCrunch Con người không chỉ học qua ngôn ngữ; chúng ta học bằng cách trải nghiệm cách thế giới vận hành. Nhưng LLM không thực sự hiểu thế giới; chúng chỉ dự đoán từ hoặc ý tiếp theo. Đó là lý do nhiều nhà nghiên cứu tin rằng bước nhảy vọt tiếp theo sẽ đến từ các mô hình thế giới: hệ thống AI học cách mọi vật di chuyển và tương tác trong không gian 3D để có thể dự đoán và hành động.
Dấu hiệu cho thấy năm 2026 sẽ là năm bùng nổ của các mô hình thế giới đang ngày càng nhiều. LeCun đã rời Meta để thành lập phòng lab mô hình thế giới riêng và được cho là tìm kiếm mức định giá 5 tỷ đô. DeepMind của Google tiếp tục phát triển Genie và vào tháng 8 đã ra mắt mô hình mới nhất có thể xây dựng các mô hình thế giới tương tác thời gian thực đa mục đích. Song song với các bản demo từ startup như Decart và Odyssey, World Labs của Fei-Fei Li đã ra mắt mô hình thế giới thương mại đầu tiên mang tên Marble. Các cái tên mới như General Intuition vào tháng 10 đã gọi vốn 134 triệu đô để dạy agent lý luận không gian bằng clip game, và startup tạo video Runway tháng 12 đã phát hành mô hình thế giới đầu tiên, GWM-1.
Dù các nhà nghiên cứu nhìn thấy tiềm năng lâu dài trong robot và tự chủ, tác động gần nhất nhiều khả năng sẽ xuất hiện trong lĩnh vực trò chơi điện tử. PitchBook dự đoán thị trường mô hình thế giới trong game có thể tăng từ 1,2 tỷ đô giai đoạn 2022-2025 lên 276 tỷ đô vào năm 2030, nhờ khả năng tạo thế giới tương tác và các nhân vật phi người chơi sống động hơn.
Pim de Witte, nhà sáng lập General Intuition, chia sẻ với TechCrunch rằng môi trường ảo không chỉ tái định hình ngành game mà còn trở thành nơi thử nghiệm quan trọng cho thế hệ mô hình nền tảng tiếp theo.
Quốc gia agentic
Các agent đã không đáp ứng được kỳ vọng trong năm 2025, phần lớn vì khó kết nối chúng với các hệ thống nơi công việc thực sự diễn ra. Nếu không có cách tiếp cận công cụ và ngữ cảnh, hầu hết các agent chỉ mắc kẹt trong quy trình thử nghiệm.
Model Context Protocol (MCP) của Anthropic, một “USB-C cho AI” cho phép agent AI giao tiếp với các công cụ bên ngoài như cơ sở dữ liệu, máy tìm kiếm và API, đã trở thành “mô liên kết” còn thiếu và nhanh chóng trở thành tiêu chuẩn. OpenAI và Microsoft đã công khai ủng hộ MCP, còn Anthropic gần đây đã chuyển giao nó cho Agentic AI Foundation mới của Linux Foundation, với mục tiêu tiêu chuẩn hóa các công cụ agentic mã nguồn mở. Google cũng bắt đầu triển khai máy chủ MCP quản lý riêng để kết nối agent AI với sản phẩm và dịch vụ của mình.
Với MCP giúp giảm ma sát khi kết nối agent với hệ thống thực, năm 2026 có khả năng là năm các quy trình agentic cuối cùng sẽ chuyển từ demo sang thực tiễn hàng ngày.
Rajeev Dham, đối tác tại Sapphire Ventures, nói rằng những tiến bộ này sẽ dẫn đến các giải pháp ưu tiên agent đảm nhận vai trò “hệ thống ghi nhận” trên các ngành công nghiệp.
“Khi các agent thoại xử lý ngày càng nhiều tác vụ đầu-cuối như tiếp nhận và giao tiếp khách hàng, chúng cũng bắt đầu trở thành hệ thống lõi nền tảng,” Dham cho biết. “Chúng ta sẽ thấy điều này ở nhiều lĩnh vực như dịch vụ gia đình, proptech, y tế, cũng như các chức năng ngang như bán hàng, CNTT và hỗ trợ.”
Tăng cường, không tự động hóa
Tín dụng hình ảnh:Photo by Igor Omilaev on Unsplash Dù quy trình agentic phát triển có thể khiến nhiều người lo ngại về việc cắt giảm nhân sự, Katanforoosh của Workera lại không nghĩ vậy: “2026 sẽ là năm của con người,” ông nói.
Năm 2024, mọi công ty AI đều dự đoán họ sẽ tự động hóa công việc đến mức không cần con người. Nhưng công nghệ vẫn chưa đạt đến mức đó, và trong nền kinh tế bất ổn, đó cũng không phải là thông điệp được ưa chuộng. Katanforoosh cho biết năm tới, chúng ta sẽ nhận ra rằng “AI chưa hoạt động tự chủ như chúng ta nghĩ”, và cuộc thảo luận sẽ tập trung nhiều hơn vào cách AI tăng cường quy trình làm việc của con người, thay vì thay thế hoàn toàn.
“Và tôi nghĩ nhiều công ty sẽ bắt đầu tuyển dụng,” ông nói thêm, lưu ý rằng ông kỳ vọng sẽ có các vai trò mới về quản trị AI, minh bạch, an toàn và quản lý dữ liệu. “Tôi khá lạc quan về tỉ lệ thất nghiệp trung bình dưới 4% năm sau.”
“Con người muốn ở trên API, không phải dưới nó, và tôi nghĩ 2026 là năm quan trọng cho điều này,” de Witte bổ sung.
Tiến vào thế giới vật lý
Tín dụng hình ảnh:David Paul Morris/Bloomberg / Getty Images Các tiến bộ trong công nghệ như mô hình nhỏ, mô hình thế giới và điện toán biên sẽ cho phép nhiều ứng dụng vật lý của machine learning hơn nữa, theo các chuyên gia.
“AI vật lý sẽ phổ biến vào năm 2026 khi các thiết bị AI mới, bao gồm robot, xe tự hành, drone, và thiết bị đeo bắt đầu xuất hiện trên thị trường,” Vikram Taneja, trưởng bộ phận AT&T Ventures, chia sẻ với TechCrunch.
Dù các phương tiện tự hành và robot là những ví dụ hiển nhiên cho AI vật lý và chắc chắn sẽ tiếp tục tăng trưởng vào năm 2026, việc huấn luyện và triển khai vẫn còn tốn kém. Các thiết bị đeo, ngược lại, cung cấp một lựa chọn tiết kiệm hơn với sự chấp nhận của người dùng. Kính thông minh như Ray-Ban Meta đã bắt đầu xuất xưởng các trợ lý có thể trả lời các câu hỏi về những gì bạn đang nhìn, và các hình thức mới như vòng đeo sức khỏe AI và đồng hồ thông minh đang dần phổ biến hóa việc suy luận trên cơ thể, luôn sẵn sàng.
“Các nhà cung cấp kết nối sẽ làm việc để tối ưu hạ tầng mạng nhằm hỗ trợ làn sóng thiết bị mới này, và những ai linh hoạt hơn trong cách cung cấp kết nối sẽ có vị trí tốt nhất,” Taneja nói.
