Autonomous AI - Khi AI không chỉ hỏi đáp mà còn tự học và làm mọi thứ

Lời nói đầu

Bạn đã bao giờ tự hỏi: Tại sao ChatGPT rất giỏi viết lách nhưng lại lúng túng khi nhờ đặt một vé máy bay thực tế? Đây là một trong những “điểm nóng” của công nghệ AI hiện nay: từ AI biết nói sang AI biết làm.

Hiện nay, giới công nghệ đang sục sôi với khái niệm Skill.md hay Skill Library (Thư viện kỹ năng). Đây không chỉ là một định dạng file thông thường, mà chính là “vùng nhớ cơ bắp” giúp các AI Agent (Đại lý AI) thoát khỏi vỏ bọc của một chatbot thuần túy. Nếu các mô hình ngôn ngữ lớn (LLM) là những giáo sư uyên bác nhưng “chưa từng xuống phố”, thì Skill.md chính là cuốn sổ tay thực địa giúp chúng thực sự bắt tay vào công việc, tự sửa sai và trở nên thông minh hơn sau mỗi nhiệm vụ.

Cơ chế hoạt động: Làm sao AI dùng được `skill.md`?

Thực chất, skill.md (hoặc các định dạng tương đương) đóng vai trò là Bộ nhớ dài hạn (Long-term Memory) của AI về các quy trình làm việc. Quy trình này thường diễn ra theo 4 bước:

Thử sai (Trial & Error): Khi gặp một nhiệm vụ mới (VD: “Đặt vé máy bay”), AI chưa có kỹ năng đó. nó sẽ tự mò mẫm bằng các công cụ (Browser, API).
Xác nhận (Verification): AI thực hiện và kiểm tra xem kết quả có đúng không (ví dụ: đã nhận được email xác nhận chưa).
Đúc kết (Synthesize): Nếu thành công, AI sẽ tự viết lại các bước thực hiện, các đoạn code cần thiết, và các lỗi cần tránh vào một file (như skill.md).
Truy xuất (Retrieval): Lần sau khi gặp nhiệm vụ tương tự, AI không “mò” nữa mà vào thư viện kỹ năng, đọc file hướng dẫn đó và thực hiện ngay lập tức.

Có phải AI nào cũng làm được như vậy không?

Câu trả lời ngắn gọn là: Không.

Để một AI có thể tự tạo và sử dụng skill.md, nó không chỉ là một mô hình ngôn ngữ (như GPT-4 hay Gemini) mà phải là một Agentic Framework (Khung tác vụ). Sự khác biệt nằm ở:

Đặc điểm	LLM thông thường (Chatbot)	AI Agent (như Manus, OpenClaw)
Đầu ra	Văn bản, hình ảnh, code	Hành động thực tế (click, gõ phím, gọi API)
Khả năng học	Học từ dữ liệu huấn luyện cố định	Học từ phản hồi của môi trường thực tế
Công cụ	Không có hoặc rất hạn chế	Có quyền truy cập Browser, Terminal, File System

AI cần những quyền truy cập (Access) gì?

Đây là phần “xương sống”. Một AI muốn tự tạo kỹ năng cần một “cơ thể” để tương tác với thế giới:

Computer Use / Browser Control: Khả năng nhìn màn hình, di chuyển chuột và gõ phím (như cách Manus AI đang làm).
Sandbox Environment: Một môi trường an toàn (như Docker) để AI có thể chạy code thử nghiệm mà không làm hỏng máy tính của người dùng.
Feedback Loop: Quan trọng nhất là cơ chế phản hồi. Nếu AI làm sai, hệ thống phải báo lỗi để nó tự sửa. Nếu không có phản hồi, nó sẽ không bao giờ “học” được.

Note: Riêng Manus AI có thể chạy và tự học ngay trên Server riêng của họ (tức nó có thể lướt web, tạo báo cáo pdf, code phần mềm, thậm chí host server, database, lưu trữ file – việc của bạn chỉ cần chat và chờ nó thực hiện).

Về Autonomous AI và khả năng “Tự tạo tri thức”

Các dự án như Manus AI hay OpenClaw thực chất đang ứng dụng các nghiên cứu như Voyager (AI tự học chơi Minecraft).

Chúng không được lập trình sẵn mọi kỹ năng.
Chúng được lập trình “cách để học”.
Mỗi khi vượt qua một thử thách, chúng lưu lại “bí kíp” vào thư viện. Theo thời gian, thư viện này càng dày lên, AI càng trở nên vạn năng mà không cần con người can thiệp vào code gốc.

Điểm khác biệt quan trọng khi bạn trải nghiệm:

Tính không đồng bộ (Asynchronous): Bạn có thể giao một việc cực khó (như viết một báo cáo 20 trang), sau đó tắt trình duyệt đi ngủ. Manus sẽ tự làm việc ngầm và gửi thông báo cho bạn qua email hoặc Telegram/WhatsApp khi hoàn thành.
Khả năng tự sửa lỗi: Nếu trong quá trình làm việc gặp lỗi (ví dụ: link web bị hỏng), nó sẽ tự tìm nguồn khác thay thế thay vì dừng lại và hỏi bạn “Tôi phải làm gì tiếp theo?”.

Ví dụ các nhiệm vụ để AI Agent tự thực hiện

1. Nhóm tác vụ Nghiên cứu & Phân tích (Research)

Thay vì chỉ tóm tắt tài liệu, Manus có thể tự lên mạng tìm kiếm dữ liệu thực tế và trình bày thành báo cáo hoàn chỉnh.

Câu lệnh ví dụ: “Hãy nghiên cứu xu hướng thị trường xe điện tại Việt Nam trong năm 2025, so sánh thị phần của VinFast với các hãng xe Trung Quốc và lập một bảng phân tích SWOT. Sau đó xuất kết quả thành file PDF cho tôi.”

2. Nhóm tác vụ Lập kế hoạch & Logistics (Planning)

Manus có thể truy cập các trang web du lịch, thời tiết và bản đồ để xây dựng một lịch trình thực tế thay vì chỉ đưa ra gợi ý chung chung.

Câu lệnh ví dụ: “Hãy lập kế hoạch du lịch Tokyo 5 ngày cho 2 người vào tháng 4 tới với ngân sách 50 triệu đồng. Tìm giúp tôi các khách sạn gần ga tàu điện, liệt kê giá vé máy bay rẻ nhất hiện tại và tạo một lộ trình di chuyển tối ưu nhất.”

3. Nhóm tác vụ Lập trình & Xây dựng Website (Coding)

Khác với các AI chỉ viết code suông, Manus có thể tự chạy thử code, kiểm tra lỗi và triển khai (deploy) thành sản phẩm.

Câu lệnh ví dụ: “Hãy viết code và tạo cho tôi một trang web cá nhân (portfolio) đơn giản có đầy đủ các mục: Giới thiệu, Dự án và Liên hệ. Hãy sử dụng màu chủ đạo là xanh dương và tối ưu hóa giao diện cho điện thoại.”

4. Nhóm tác vụ Nhân sự & Kế toán (HR)

Đây là một tính năng mạnh mẽ của Manus mà các chatbot khác khó làm được.

Câu lệnh ví dụ: “Tôi có 20 tệp CV của ứng viên (đã tải lên), hãy giúp tôi sàng lọc ra 5 người phù hợp nhất với vị trí ‘Marketing Manager’, đánh giá điểm mạnh/yếu của từng người dựa trên mô tả công việc này và soạn email mời phỏng vấn cho họ.”
Câu lệnh ví dụ: “Vào ngày 1 hàng tháng, hãy truy cập vào tệp Google Sheets thu chi của tôi, phân tích xem nhóm chi tiêu nào tăng cao nhất so với tháng trước và đưa ra 3 lời khuyên để tôi tiết kiệm tiền hiệu quả hơn trong tháng tới.”

5. Nhóm tác vụ Marketing & Quảng cáo (Meta Integration)

Kể từ khi về tay Meta, Manus có khả năng tích hợp sâu vào các công cụ như Facebook Ads hay WhatsApp.

Câu lệnh ví dụ: “Hãy phân tích hiệu quả các chiến dịch quảng cáo của tôi trên Facebook trong tháng qua, tìm ra nhóm đối tượng nào đang mang lại chuyển đổi tốt nhất và tự động soạn thảo 3 mẫu quảng cáo mới dựa trên dữ liệu đó.”
Câu lệnh ví dụ: “Hãy lên lịch đăng 5 bài viết về chủ đề ‘Mẹo chăm sóc da mùa đông’ lên Fanpage Facebook của tôi. Thời gian đăng là 20h tối các ngày từ thứ Hai đến thứ Sáu tuần tới. Hãy tự tạo hình ảnh minh họa bằng AI cho mỗi bài viết.”

6. Nhóm tác vụ Lập lịch (Scheduling)

Nếu các Chatbot thông thường chỉ nhận và phản hồi thì Manus có khả năng lên lịch và thực hiện kế hoạch và xử lý luồng công việc đã định sẵn.

Câu lệnh ví dụ: “Mỗi ngày vào lúc 8h sáng, hãy tra cứu giá vàng miếng SJC, giá vàng nhẫn PNJ và giá bạc thế giới. So sánh với mức giá ngày hôm trước và gửi một bản báo cáo tóm tắt các biến động chính cho tôi qua WhatsApp.”
Câu lệnh ví dụ: “Mỗi sáng thứ Sáu, hãy kiểm tra trang web của [Thương hiệu] và báo cáo cho tôi nếu họ có bất kỳ sản phẩm mới nào hoặc có chương trình khuyến mãi lớn nào mới được cập nhật.”

7. Nhóm tác vụ Tự động hóa (Automation)

Bạn cũng có thể tận dụng khả năng liên tục của AI để tìm “kèo thơm” như Săn vé máy bay hoặc sản phẩm giảm giá.

Câu lệnh ví dụ: “Hãy theo dõi giá vé máy bay khứ hồi chặng Hà Nội – Phú Quốc trên tất cả các hãng trong tháng 12. Nếu có bất kỳ chuyến bay nào có tổng giá vé dưới 1.800.000 VNĐ, hãy lập tức gửi thông báo đẩy và link đặt vé cho tôi.”

Kết luận

Tóm lại: skill.md chính là cuốn “nhật ký thành công” của AI. Tuy nhiên, rào cản lớn nhất hiện nay không phải là AI không biết viết file đó, mà là làm sao để AI tự nhận diện lỗi một cách chính xác nhất khi thực hiện tác vụ trong môi trường thực tế phức tạp. Thay vì phải dạy bảo từng bước, chúng ta đang tiến tới một kỷ nguyên nơi con người chỉ cần đưa ra mục tiêu, còn AI sẽ tự đi tìm “bí kíp” hoặc tự viết nên bộ kỹ năng mới cho chính mình.

Lời nói đầu

Cơ chế hoạt động: Làm sao AI dùng được `skill.md`?

Có phải AI nào cũng làm được như vậy không?

AI cần những quyền truy cập (Access) gì?

Về Autonomous AI và khả năng “Tự tạo tri thức”

Điểm khác biệt quan trọng khi bạn trải nghiệm:

Ví dụ các nhiệm vụ để AI Agent tự thực hiện

1. Nhóm tác vụ Nghiên cứu & Phân tích (Research)

2. Nhóm tác vụ Lập kế hoạch & Logistics (Planning)

3. Nhóm tác vụ Lập trình & Xây dựng Website (Coding)

4. Nhóm tác vụ Nhân sự & Kế toán (HR)

5. Nhóm tác vụ Marketing & Quảng cáo (Meta Integration)

6. Nhóm tác vụ Lập lịch (Scheduling)

7. Nhóm tác vụ Tự động hóa (Automation)

Kết luận

Thiên Phong

Leave a Reply Cancel reply

Cuộc chiến hoàn tiền Online Quốc Tế 2026: Thẻ nào tối ưu nhất?

So sánh các Tổ chức thẻ Thanh toán quốc tế (Napas, Visa, Mastercard, JCB,…)

Phân tích hệ sinh thái quản trị đa ngành Sovico: HDBank – Vietjet Air

SigNoz – Giải pháp Giám sát All-in-One tích hợp OpenTelemetry

[Blog] Kiến trúc hệ thống Core Banking: GitOps và Multi-level Caching

AI

Autonomous AI – Khi AI không chỉ hỏi đáp mà còn tự học và làm mọi thứ

Lời nói đầu

Cơ chế hoạt động: Làm sao AI dùng được skill.md?

Có phải AI nào cũng làm được như vậy không?

AI cần những quyền truy cập (Access) gì?

Về Autonomous AI và khả năng “Tự tạo tri thức”

Điểm khác biệt quan trọng khi bạn trải nghiệm:

Ví dụ các nhiệm vụ để AI Agent tự thực hiện

1. Nhóm tác vụ Nghiên cứu & Phân tích (Research)

2. Nhóm tác vụ Lập kế hoạch & Logistics (Planning)

3. Nhóm tác vụ Lập trình & Xây dựng Website (Coding)

4. Nhóm tác vụ Nhân sự & Kế toán (HR)

5. Nhóm tác vụ Marketing & Quảng cáo (Meta Integration)

6. Nhóm tác vụ Lập lịch (Scheduling)

7. Nhóm tác vụ Tự động hóa (Automation)

Kết luận

Thiên Phong

Leave a Reply Cancel reply

Cuộc chiến hoàn tiền Online Quốc Tế 2026: Thẻ nào tối ưu nhất?

So sánh các Tổ chức thẻ Thanh toán quốc tế (Napas, Visa, Mastercard, JCB,…)

Phân tích hệ sinh thái quản trị đa ngành Sovico: HDBank – Vietjet Air

SigNoz – Giải pháp Giám sát All-in-One tích hợp OpenTelemetry

[Blog] Kiến trúc hệ thống Core Banking: GitOps và Multi-level Caching

Cơ chế hoạt động: Làm sao AI dùng được `skill.md`?