Bitget App
Giao dịch thông minh hơn
Mua CryptoThị trườngGiao dịchFutures‌EarnWeb3Quảng trườngThêm
Giao dịch
Spot
Mua bán tiền điện tử
Ký quỹ
Gia tăng vốn và tối ưu hiệu quả đầu tư
Onchain
Going Onchain, without going Onchain!
Convert
Miễn phí giao dịch và không trượt giá.
Khám phá
Launchhub
Giành lợi thế sớm và bắt đầu kiếm lợi nhuận
Sao chép
Sao chép elite trader chỉ với một nhấp
Bots
Bot giao dịch AI đơn giản, nhanh chóng và đáng tin cậy
Giao dịch
USDT-M Futures
Futures thanh toán bằng USDT
USDC-M Futures
Futures thanh toán bằng USDC
Coin-M Futures
Futures thanh toán bằng tiền điện tử
Khám phá
Hướng dẫn futures
Hành trình giao dịch futures từ người mới đến chuyên gia
Chương trình ưu đãi futures
Vô vàn phần thưởng đang chờ đón
Bitget Earn
Sản phẩm kiếm tiền dễ dàng
Simple Earn
Nạp và rút tiền bất cứ lúc nào để kiếm lợi nhuận linh hoạt không rủi ro
On-chain Earn
Kiếm lợi nhuận mỗi ngày và được đảm bảo vốn
Structured Earn
Đổi mới tài chính mạnh mẽ để vượt qua biến động thị trường
Quản lý Tài sản và VIP
Dịch vụ cao cấp cho quản lý tài sản thông minh
Vay
Vay linh hoạt với mức độ an toàn vốn cao
IOSG: Khi trình duyệt trở thành chiến trường tiếp theo của AI

IOSG: Khi trình duyệt trở thành chiến trường tiếp theo của AI

BlockBeatsBlockBeats2025/08/20 02:00
Theo:BlockBeats

Các công ty công nghệ lớn đang bắt đầu xây dựng các proxy trình duyệt riêng có thể duyệt web và thực hiện các hành động giống như người dùng, báo trước sự phát triển quan trọng trong tương lai của AI.

Tiêu đề gốc: "Bản tin hàng tuần của IOSG | Khi trình duyệt của bạn trở thành tác nhân #289"
Tác giả gốc: Mario Chow, Figo, @IOSG


Giới thiệu


Trong 12 tháng qua, mối quan hệ giữa trình duyệt web và tự động hóa đã có sự thay đổi đáng kể. Hầu như mọi công ty công nghệ lớn đều đang nỗ lực xây dựng các tác nhân trình duyệt tự động. Xu hướng này đã trở nên mạnh mẽ hơn kể từ cuối năm 2024: OpenAI ra mắt Chế độ tác nhân vào tháng 1, Anthropic phát hành tính năng "Sử dụng máy tính" cho mô hình Claude, Google DeepMind ra mắt Dự án Mariner, Opera công bố trình duyệt dựa trên tác nhân Neon và Perplexity AI phát hành trình duyệt Comet. Tín hiệu rất rõ ràng: tương lai của AI nằm ở các tác nhân có thể tự động điều hướng web.


Xu hướng này không chỉ là việc thêm các chatbot thông minh hơn vào trình duyệt; đó là một sự thay đổi cơ bản trong cách máy móc tương tác với môi trường kỹ thuật số. Các tác nhân trình duyệt là các hệ thống AI có thể "nhìn thấy" các trang web và thực hiện các hành động: nhấp vào liên kết, điền vào biểu mẫu, cuộn, nhập văn bản — giống như người dùng thực. Mô hình này hứa hẹn sẽ mở ra năng suất và giá trị kinh tế to lớn bằng cách tự động hóa các tác vụ hiện đang đòi hỏi nỗ lực thủ công hoặc quá phức tạp đối với các tập lệnh truyền thống.


IOSG: Khi trình duyệt trở thành chiến trường tiếp theo của AI image 0


▲ Trình diễn GIF: Một tác nhân trình duyệt AI đang hoạt động: làm theo hướng dẫn, điều hướng đến trang tập dữ liệu mục tiêu, tự động chụp ảnh màn hình và trích xuất dữ liệu cần thiết.


Ai sẽ chiến thắng trong cuộc chiến trình duyệt AI?


Hầu hết các công ty công nghệ lớn (và một số công ty khởi nghiệp) đều đang phát triển các giải pháp tác nhân trình duyệt AI của riêng họ. Dưới đây là một số dự án tiêu biểu nhất:


OpenAI – Chế độ Đại lý


Chế độ Đại lý của OpenAI (trước đây gọi là Operator, ra mắt vào tháng 1 năm 2025) là một đại lý AI có trình duyệt riêng. Operator có thể xử lý nhiều tác vụ trực tuyến lặp đi lặp lại: chẳng hạn như điền biểu mẫu web, đặt hàng tạp hóa và lên lịch họp: tất cả đều được thực hiện thông qua các giao diện web tiêu chuẩn thường được con người sử dụng.


IOSG: Khi trình duyệt trở thành chiến trường tiếp theo của AI image 1


▲ Tác nhân AI lên lịch các cuộc họp như một trợ lý chuyên nghiệp: kiểm tra lịch, tìm các khoảng thời gian trống, tạo sự kiện, gửi xác nhận và tạo tệp .ics cho bạn.


Anthropic – “Sử dụng máy tính” của Claude


Vào cuối năm 2024, Anthropic đã giới thiệu tính năng “Sử dụng máy tính” mới cho Claude 3.5, cho phép nó vận hành máy tính và trình duyệt như con người. Claude có thể xem màn hình, di chuyển con trỏ, nhấp vào các nút và nhập văn bản. Đây là công cụ tác nhân quy mô lớn đầu tiên thuộc loại này bước vào giai đoạn beta công khai, cho phép các nhà phát triển kích hoạt Claude tự động điều hướng các trang web và ứng dụng. Anthropic định vị tính năng này là một tính năng thử nghiệm, với mục tiêu chính là tự động hóa quy trình làm việc nhiều bước trên các trang web.


IOSG: Khi trình duyệt trở thành chiến trường tiếp theo của AI image 2


Perplexity – Comet


Công ty khởi nghiệp AI Perplexity (nổi tiếng với công cụ hỏi đáp) đã ra mắt trình duyệt Comet vào giữa năm 2025 như một giải pháp thay thế cho Chrome dựa trên AI. Về cơ bản, Comet là một công cụ tìm kiếm AI hội thoại được tích hợp vào thanh địa chỉ (omnibox), cung cấp tính năng Hỏi & Đáp và tóm tắt tức thì thay vì các liên kết tìm kiếm truyền thống.


IOSG: Khi trình duyệt trở thành chiến trường tiếp theo của AI image 3


Comet cũng bao gồm Comet Assistant, một tác nhân thường trú trên thanh bên, tự động hóa các tác vụ thường lệ trên các trang web. Ví dụ: nó có thể tóm tắt các email đã mở, lên lịch họp, quản lý các tab trình duyệt hoặc duyệt và thu thập dữ liệu web thay mặt bạn.


IOSG: Khi trình duyệt trở thành chiến trường tiếp theo của AI image 4


Comet hướng đến việc tích hợp liền mạch tính năng duyệt web với trợ lý AI bằng cách cho phép các tác nhân nhận biết nội dung trang web hiện tại thông qua giao diện thanh bên.


Các tình huống ứng dụng thực tế cho tác nhân trình duyệt


Trước đây, chúng ta đã xem xét cách các công ty công nghệ lớn (OpenAI, Anthropic, Perplexity, v.v.) tích hợp chức năng vào các tác nhân trình duyệt thông qua nhiều hình thức sản phẩm khác nhau. Để hiểu rõ hơn về giá trị của chúng, hãy cùng xem xét kỹ hơn các tình huống thực tế, nơi những khả năng này đang được áp dụng vào cuộc sống hàng ngày và quy trình làm việc của doanh nghiệp.


Tự động hóa web hàng ngày


# Thương mại điện tử và Mua sắm Cá nhân


Một kịch bản rất thực tế là giao nhiệm vụ mua sắm và đặt chỗ cho một nhân viên. Nhân viên có thể tự động điền thông tin vào giỏ hàng trực tuyến của bạn và đặt hàng dựa trên danh sách cố định, hoặc tìm kiếm mức giá thấp nhất trên nhiều nhà bán lẻ và hoàn tất quy trình thanh toán thay mặt bạn.


IOSG: Khi trình duyệt trở thành chiến trường tiếp theo của AI image 5


Đối với du lịch, bạn có thể yêu cầu AI thực hiện các nhiệm vụ như: "Đặt cho tôi một chuyến bay đến Tokyo vào tháng tới với giá dưới 800 đô la và một khách sạn có Wi-Fi miễn phí." Nhân viên sẽ xử lý toàn bộ quy trình: tìm kiếm chuyến bay, so sánh các lựa chọn, điền thông tin hành khách và hoàn tất đặt phòng khách sạn, tất cả thông qua trang web của hãng hàng không và khách sạn. Mức độ tự động hóa này vượt xa các bot du lịch hiện có: nó không chỉ đơn thuần đưa ra đề xuất mà còn trực tiếp thực hiện giao dịch mua.


# Nâng cao Hiệu quả Văn phòng


Nhân viên có thể tự động hóa nhiều tác vụ lặp đi lặp lại mà mọi người thực hiện trên trình duyệt của họ. Ví dụ, nó có thể sắp xếp email và trích xuất các mục việc cần làm hoặc kiểm tra tính khả dụng trên nhiều lịch và tự động lên lịch các cuộc họp. Trợ lý Comet của Perplexity có thể tóm tắt nội dung hộp thư đến của bạn hoặc thêm mục lịch cho bạn thông qua giao diện web. Với sự cho phép của bạn, các đại lý cũng có thể đăng nhập vào các công cụ SaaS để tạo báo cáo thường xuyên, cập nhật bảng tính hoặc gửi biểu mẫu. Hãy tưởng tượng một đại lý nhân sự tự động đăng nhập vào các trang web đăng tuyển dụng khác nhau hoặc một đại lý bán hàng cập nhật dữ liệu khách hàng tiềm năng trong hệ thống CRM. Những nhiệm vụ tầm thường này nếu không sẽ tiêu tốn đáng kể thời gian của nhân viên, nhưng AI có thể hoàn thành chúng bằng cách tự động hóa các biểu mẫu web và hoạt động của trang. Ngoài các tác vụ đơn lẻ, các đại lý có thể điều phối toàn bộ quy trình công việc trên nhiều hệ thống mạng. Tất cả các bước này yêu cầu các giao diện web khác nhau, đó chính xác là nơi các đại lý trình duyệt phát huy hết khả năng. Các đại lý có thể đăng nhập vào nhiều bảng điều khiển khác nhau để khắc phục sự cố và thậm chí điều phối các quy trình, chẳng hạn như hoàn thành quy trình tích hợp cho nhân viên mới (tạo tài khoản trên nhiều trang web SaaS). Về cơ bản, bất kỳ thao tác nhiều bước nào hiện nay yêu cầu nhấp qua nhiều trang web đều có thể được thực hiện bằng proxy.


Những thách thức và hạn chế hiện tại


Mặc dù có tiềm năng to lớn, các proxy trình duyệt ngày nay vẫn còn rất xa mới hoàn hảo. Các triển khai hiện tại cho thấy một số thách thức lâu dài về mặt kỹ thuật và cơ sở hạ tầng:


Sự không phù hợp về kiến trúc


Web hiện đại được thiết kế cho các trình duyệt do con người vận hành và đã phát triển theo thời gian để chủ động chống lại tự động hóa. Dữ liệu thường được ẩn trong HTML/CSS được tối ưu hóa cho việc hiển thị trực quan, bị giới hạn bởi các thao tác tương tác (di chuột, vuốt) hoặc chỉ có thể truy cập thông qua các API không được ghi chép đầy đủ.

Hơn nữa, các hệ thống chống sao chép dữ liệu và chống gian lận lại vô tình tạo thêm các rào cản bổ sung. Các công cụ này kết hợp danh tiếng IP, dấu vân tay trình duyệt, phản hồi thử thách JavaScript và phân tích hành vi (ví dụ: độ ngẫu nhiên của chuyển động chuột, nhịp độ gõ phím, thời gian chờ). Nghịch lý thay, một tác nhân AI càng tỏ ra "hoàn hảo" và hiệu quả - ví dụ, điền biểu mẫu ngay lập tức và không có lỗi - thì càng dễ bị xác định là tự động hóa độc hại. Điều này có thể dẫn đến những lỗi nghiêm trọng: ví dụ, một tác nhân OpenAI hoặc Google có thể hoàn thành thành công tất cả các bước trước khi thanh toán nhưng lại bị chặn bởi CAPTCHA hoặc bộ lọc bảo mật thứ cấp. Sự kết hợp giữa giao diện được tối ưu hóa cho con người và lớp phòng thủ không thân thiện với bot buộc các tác nhân phải áp dụng chiến lược "mô phỏng người-máy" mong manh. Cách tiếp cận này rất dễ thất bại và có tỷ lệ thành công thấp (ngay cả khi không có sự can thiệp của con người, chưa đến một phần ba số giao dịch đã hoàn thành vẫn được thực hiện).


Mối lo ngại về lòng tin và bảo mật


Việc trao toàn quyền kiểm soát cho một tác nhân thường yêu cầu quyền truy cập vào thông tin nhạy cảm: thông tin đăng nhập, cookie, mã thông báo xác thực hai yếu tố và thậm chí cả thông tin thanh toán. Điều này làm dấy lên những lo ngại dễ hiểu cho cả người dùng và doanh nghiệp:


· Điều gì sẽ xảy ra nếu tác nhân mắc lỗi hoặc bị lừa bởi một trang web độc hại?

· Ai chịu trách nhiệm nếu tác nhân đồng ý với các điều khoản dịch vụ hoặc thực hiện giao dịch?


Với những rủi ro này, các hệ thống hiện tại thường áp dụng cách tiếp cận thận trọng:


· Mariner của Google không nhập thông tin thẻ tín dụng hoặc đồng ý với các điều khoản dịch vụ mà thay vào đó trả về thông tin đó cho người dùng.


· Operator của OpenAI nhắc người dùng tiếp quản thử thách đăng nhập hoặc CAPTCHA.


IOSG: Khi trình duyệt trở thành chiến trường tiếp theo của AI image 6


· Agent do Claude hỗ trợ của Anthropic có thể từ chối đăng nhập, viện dẫn lý do bảo mật.


Kết quả: AI và con người thường xuyên bị tạm dừng và chuyển giao, làm giảm trải nghiệm tự động hóa liền mạch.


Bất chấp những trở ngại này, tiến độ vẫn đang diễn ra nhanh chóng. Các công ty như OpenAI, Google và Anthropic học hỏi từ những thất bại của họ qua mỗi lần lặp lại. Khi nhu cầu tăng lên, một loại "tiến hóa đồng thời" có thể sẽ xảy ra: các trang web trở nên thân thiện hơn với agent trong các tình huống thuận lợi, và các agent liên tục cải thiện khả năng bắt chước hành vi của con người để vượt qua các rào cản hiện có.


Các phương pháp tiếp cận và cơ hội


Các proxy trình duyệt hiện tại phải đối mặt với hai thực tế tương phản: môi trường thù địch của Web2, nơi các biện pháp chống sao chép và bảo mật có mặt ở khắp mọi nơi; và môi trường mở của Web3, nơi tự động hóa thường được khuyến khích. Sự chênh lệch này định hình hướng đi của các giải pháp khác nhau. Các giải pháp sau đây được chia thành hai loại: các giải pháp giúp proxy tránh được môi trường thù địch của Web2 và các giải pháp có sẵn trong Web3. Mặc dù những thách thức mà proxy trình duyệt phải đối mặt vẫn còn đáng kể, nhưng các dự án mới đang nổi lên nhằm giải quyết chúng trực tiếp. Hệ sinh thái tiền điện tử và tài chính phi tập trung (DeFi) đang trở thành một nền tảng thử nghiệm tự nhiên vì nó mở, có thể lập trình và ít thù địch với tự động hóa hơn. API mở, hợp đồng thông minh và tính minh bạch trên chuỗi loại bỏ nhiều điểm ma sát phổ biến trong thế giới Web2. Có bốn loại giải pháp, mỗi loại giải quyết một hoặc nhiều hạn chế cốt lõi hiện tại: Trình duyệt proxy gốc cho các hoạt động trên chuỗi Các trình duyệt này được thiết kế ngay từ đầu để được điều khiển bởi các tác nhân tự trị và được tích hợp sâu với các giao thức blockchain. Không giống như các trình duyệt Chrome truyền thống, vốn dựa vào Selenium, Playwright hoặc plugin ví để tự động hóa trên chuỗi, trình duyệt proxy gốc cung cấp API trực tiếp và đường dẫn thực thi đáng tin cậy để các tác nhân gọi đến. Trong tài chính phi tập trung, tính hợp lệ của giao dịch dựa trên chữ ký mật mã chứ không phải "tính giống người" của người dùng. Do đó, trong môi trường trên chuỗi, proxy có thể bỏ qua CAPTCHA, điểm phát hiện gian lận và kiểm tra dấu vân tay thiết bị phổ biến trong thế giới Web2. Tuy nhiên, nếu các trình duyệt này được chuyển hướng đến các trang web Web2 như Amazon, chúng không thể vượt qua các biện pháp phòng thủ này và vẫn sẽ kích hoạt các biện pháp chống bot thông thường.


Giá trị của trình duyệt proxy không phải là truy cập tất cả các trang web một cách kỳ diệu, mà là:


· Tích hợp blockchain gốc: Hỗ trợ ví và chữ ký tích hợp, loại bỏ nhu cầu sử dụng cửa sổ bật lên MetaMask hoặc phân tích cú pháp DOM trên giao diện người dùng dApp.


· Thiết kế tự động hóa ưu tiên: Cung cấp các lệnh cấp cao ổn định ánh xạ trực tiếp đến các hoạt động của giao thức.


· Mô hình bảo mật: Kiểm soát quyền được tinh chỉnh và hộp cát đảm bảo tính bảo mật của khóa riêng trong quá trình tự động hóa.


· Tối ưu hóa hiệu suất: Khả năng thực hiện nhiều lệnh gọi trên chuỗi song song mà không cần hiển thị trình duyệt hoặc trì hoãn giao diện người dùng.


Donut tích hợp dữ liệu và hoạt động blockchain như một công dân hạng nhất. Người dùng (hoặc đại lý của họ) có thể di chuột để xem các chỉ báo rủi ro theo thời gian thực cho các token hoặc nhập trực tiếp các lệnh ngôn ngữ tự nhiên như "/swap 100 USDC sang SOL". Bằng cách bỏ qua các điểm ma sát đối kháng của Web2, Donut cho phép các đại lý hoạt động hết công suất trong DeFi, cải thiện tính thanh khoản, chênh lệch giá và hiệu quả thị trường. Thực thi Proxy có thể xác minh và đáng tin cậy. Việc cấp cho các đại lý các quyền nhạy cảm là rủi ro. Các giải pháp sử dụng Môi trường Thực thi Đáng tin cậy (TEE) hoặc Bằng chứng Không Kiến thức (ZKP) xác nhận bằng mật mã hành vi dự kiến của một đại lý trước khi thực thi, cho phép người dùng và các bên đối tác xác minh hành động của đại lý mà không tiết lộ khóa riêng hoặc thông tin xác thực.


# Trường hợp: Mạng Phala


Phala sử dụng TEE (chẳng hạn như Intel SGX) để cô lập và bảo vệ môi trường thực thi, ngăn chặn các nhà điều hành hoặc kẻ tấn công Phala theo dõi hoặc giả mạo logic và dữ liệu proxy. TEE giống như một "phòng an toàn" được hỗ trợ bởi phần cứng, đảm bảo tính bảo mật (vô hình với bên ngoài) và tính toàn vẹn (không thể bị sửa đổi từ bên ngoài).


Đối với proxy trình duyệt, điều này có nghĩa là nó có thể đăng nhập, lưu trữ mã thông báo phiên hoặc xử lý thông tin thanh toán, và dữ liệu nhạy cảm này sẽ không bao giờ rời khỏi phòng an toàn. Ngay cả khi máy tính, hệ điều hành hoặc mạng của người dùng bị xâm phạm, thông tin cũng không thể bị rò rỉ. Điều này trực tiếp giảm bớt một trong những trở ngại lớn nhất đối với việc triển khai các ứng dụng proxy: vấn đề tin cậy của thông tin đăng nhập và hoạt động nhạy cảm.


Mạng Dữ liệu Có Cấu trúc Phi tập trung


Các hệ thống phát hiện chống bot hiện đại không chỉ kiểm tra xem các yêu cầu có "quá nhanh" hay "tự động" hay không, mà còn kết hợp danh tiếng IP, dấu vân tay trình duyệt, phản hồi thử thách JavaScript và phân tích hành vi (chẳng hạn như chuyển động con trỏ, nhịp độ gõ và lịch sử phiên). Proxy có nguồn gốc từ IP trung tâm dữ liệu hoặc môi trường duyệt web hoàn toàn có thể lặp lại được dễ dàng nhận dạng.


Để giải quyết vấn đề này, các mạng lưới này không còn thu thập dữ liệu từ các trang web được tối ưu hóa cho con người nữa. Thay vào đó, chúng trực tiếp thu thập và cung cấp dữ liệu có thể đọc được bằng máy hoặc lưu lượng proxy thông qua môi trường duyệt web thực tế của con người. Cách tiếp cận này vượt qua các lỗ hổng của trình thu thập dữ liệu truyền thống trong quá trình phân tích cú pháp và chống thu thập dữ liệu, cung cấp dữ liệu đầu vào sạch hơn và đáng tin cậy hơn cho proxy.


Bằng cách chuyển tiếp lưu lượng đến các phiên thực tế này, các mạng lưới phân tán cho phép các tác nhân AI truy cập nội dung web như con người mà không gây ra tình trạng tắc nghẽn ngay lập tức.


# Trường hợp sử dụng


· Grass: Mạng dữ liệu/DePIN phi tập trung, nơi người dùng chia sẻ băng thông rộng dân dụng chưa sử dụng, cung cấp quyền truy cập đa dạng về mặt địa lý và thân thiện với đại lý vào bộ sưu tập dữ liệu web công cộng và đào tạo mô hình.


· WootzApp: Trình duyệt di động nguồn mở hỗ trợ thanh toán bằng tiền điện tử, có đại lý phụ trợ và danh tính không kiến thức; nó mang đến "trò chơi hóa" các tác vụ AI/dữ liệu cho người dùng.


· Sixpence: Mạng trình duyệt phân tán định tuyến lưu lượng cho các đại lý AI thông qua việc duyệt web của những người đóng góp toàn cầu.


Tuy nhiên, đây không phải là giải pháp hoàn chỉnh. Phát hiện hành vi (theo dõi chuột/cuộn), các hạn chế ở cấp tài khoản (KYC, tuổi tài khoản) và kiểm tra tính nhất quán của dấu vân tay vẫn có thể gây ra tình trạng chặn. Do đó, tốt nhất nên xem mạng phân tán như một lớp bảo mật nền tảng phải được kết hợp với các chiến lược thực thi mô phỏng con người để đạt hiệu quả cao nhất.


Tiêu chuẩn Web dành cho Đại lý (Foresight)


Hiện nay, ngày càng nhiều cộng đồng và tổ chức kỹ thuật đang tìm hiểu câu hỏi: Nếu người dùng web trong tương lai không chỉ là con người mà còn là các đại lý tự động, thì làm thế nào các trang web có thể tương tác với họ một cách an toàn và tuân thủ?


Điều này đã thúc đẩy thảo luận về các tiêu chuẩn và cơ chế mới nổi, với mục tiêu cho phép các trang web nêu rõ ràng "Tôi cho phép các đại lý đáng tin cậy truy cập" và cung cấp một kênh tương tác an toàn, thay vì chặn các đại lý như "các cuộc tấn công của bot" theo mặc định như hiện nay.


· Thẻ "Đại lý được phép": Giống như tệp robots.txt mà các công cụ tìm kiếm tuân thủ, các trang web trong tương lai có thể bao gồm một thẻ trong mã của chúng để thông báo cho các đại lý trình duyệt rằng "Truy cập này an toàn". Ví dụ: nếu bạn sử dụng một đại lý để đặt chuyến bay, trang web sẽ không hiển thị một loạt CAPTCHA; thay vào đó, nó sẽ trực tiếp cung cấp một giao diện đã được xác thực.


· Cổng API cho Đại lý được Chứng nhận: Các trang web có thể tạo một điểm vào chuyên dụng, giống như một "làn đường nhanh", cho các đại lý đã được xác minh. Đại lý không còn cần phải mô phỏng các cú nhấp chuột và dữ liệu đầu vào của con người nữa, mà thay vào đó sử dụng một đường dẫn API ổn định hơn để hoàn tất đơn hàng, thanh toán hoặc truy vấn dữ liệu.


· Thảo luận về W3C: Liên minh Mạng lưới Toàn cầu (W3C) đang tìm hiểu cách phát triển các kênh chuẩn hóa cho "tự động hóa được quản lý". Điều này có nghĩa là trong tương lai, chúng ta có thể có một bộ quy tắc được chấp nhận trên toàn cầu, cho phép các đại lý đáng tin cậy được các trang web xác định và chấp nhận, đồng thời vẫn duy trì tính bảo mật và trách nhiệm giải trình.


Mặc dù những khám phá này vẫn đang trong giai đoạn đầu, nhưng một khi được triển khai, chúng có thể cải thiện đáng kể mối quan hệ giữa con người, đại lý và trang web. Hãy tưởng tượng: không còn phải bắt chước chuyển động chuột của con người để "đánh lừa" kiểm soát rủi ro, mà thay vào đó là hoàn thành các nhiệm vụ một cách công khai thông qua một kênh "được phê duyệt chính thức".


Cơ sở hạ tầng gốc tiền điện tử có khả năng sẽ dẫn đầu theo hướng này. Điều này là do các ứng dụng trên chuỗi vốn dựa vào API mở và hợp đồng thông minh, khiến chúng trở nên lý tưởng cho tự động hóa. Ngược lại, các nền tảng Web2 truyền thống có thể vẫn thận trọng phòng thủ, đặc biệt là những nền tảng dựa trên quảng cáo hoặc hệ thống chống gian lận. Tuy nhiên, khi người dùng và doanh nghiệp dần dần đón nhận những lợi ích về hiệu quả mà tự động hóa mang lại, những nỗ lực chuẩn hóa này có thể sẽ trở thành chất xúc tác quan trọng thúc đẩy toàn bộ internet hướng tới kiến trúc ưu tiên tác nhân.


Kết luận


Các tác nhân trình duyệt đang phát triển từ các công cụ đàm thoại đơn giản thành các hệ thống tự động có khả năng hoàn thành các quy trình làm việc trực tuyến phức tạp. Sự thay đổi này phản ánh một xu hướng rộng hơn: nhúng tự động hóa trực tiếp vào các giao diện cốt lõi mà người dùng tương tác với internet. Mặc dù tiềm năng tăng năng suất là rất lớn, nhưng những thách thức cũng đáng kể không kém, bao gồm việc khắc phục các cơ chế chống bot cố hữu và đảm bảo an ninh, tin cậy và sử dụng có trách nhiệm.


Trong ngắn hạn, khả năng suy luận của tác nhân được cải thiện, tốc độ nhanh hơn, tích hợp chặt chẽ hơn với các dịch vụ hiện có và những tiến bộ trong mạng lưới phân tán có thể sẽ dần cải thiện độ tin cậy. Về lâu dài, chúng ta có thể thấy việc triển khai dần dần các tiêu chuẩn "thân thiện với tác nhân" trong các tình huống mà tự động hóa mang lại lợi ích cho cả nhà cung cấp dịch vụ và người dùng. Tuy nhiên, quá trình chuyển đổi này sẽ không đồng đều: việc áp dụng sẽ nhanh hơn trong các môi trường thân thiện với tự động hóa như DeFi, trong khi các nền tảng Web2, vốn phụ thuộc nhiều vào tương tác và điều khiển của người dùng, sẽ được chấp nhận chậm hơn.


Trong tương lai, sự cạnh tranh giữa các công ty công nghệ sẽ ngày càng tập trung vào việc các tác nhân của họ điều hướng tốt như thế nào các ràng buộc trong thế giới thực, mức độ an toàn của chúng khi tích hợp vào các quy trình làm việc quan trọng và mức độ đáng tin cậy của chúng trong các môi trường trực tuyến đa dạng. Liệu điều này cuối cùng có định hình lại "cuộc chiến trình duyệt" hay không sẽ không phụ thuộc vào năng lực công nghệ thuần túy mà phụ thuộc vào khả năng xây dựng niềm tin, điều chỉnh các động lực và chứng minh giá trị hữu hình trong sử dụng hàng ngày.


Liên kết gốc

0

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.
APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.
Khóa ngay!