AI không phải ô chat: một vòng từ chỗ hỏi tới chỗ tự xây trợ lý
Cả khóa này, từ đầu tới cuối, chỉ xoay quanh khoảng cách đó. Mình kể lại thành một mạch để bạn thấy các bài nối vào nhau thế nào, chứ không phải mười mẩu rời.
Mở: cái ô chat quá nhỏ
Phần lớn chúng ta, lần đầu tiếp cận AI, đều hình dung đúng một việc: mở một ô chat, gõ vài câu, đọc vài đoạn, rồi đóng tab. Hiểu vậy không sai, nhưng nó nhỏ, nhỏ tới mức bỏ lỡ gần hết những gì AI làm được cho công việc của một người làm thông tin. Giống như nghĩ một chiếc ô tô chỉ là cái vô lăng.
Đổi đúng một chữ thì cả cách làm việc đổi theo: từ "hỏi" sang "giao việc". Hỏi thì bạn nhận một câu trả lời rồi tự đẩy việc đi tiếp. Giao việc thì bạn đặt một mục tiêu, và phía bên kia làm cho tới khi xong. Nghe nhỏ, mà đây là cái bản lề của mọi thứ phía sau.
Lái: giao việc cho rõ
Đã giao việc thì phải giao cho rõ, vì AI không đọc được suy nghĩ trong đầu bạn, nó chỉ đọc đúng những gì bạn viết ra. Cái gì bạn nói rõ thì thành dữ kiện; cái gì bạn bỏ trống thì nó tự đoán, mà đoán thì hay chọn hướng an toàn nhất, tức là nhạt nhất.
Một lời giao việc đủ ý thường có bốn mảnh: vai (AI đóng vai ai), việc (làm gì, ra cái gì), bối cảnh (đăng ở đâu, cho ai đọc), và khuôn ra (một đoạn văn, một bảng, hay một danh sách). "Viết về biến đổi khí hậu" thiếu cả bốn mảnh, nên AI đoán hết, trả về một bài chung chung vứt đi. Thêm đủ bốn mảnh vào, vẫn con AI đó thôi, bạn nhận một bản dùng được. Tập lái cho quen từ bây giờ, vì lát nữa chính kỹ năng này là cách bạn điều khiển một agent.
Hiểu: agent là gì
Tới đây phải gọi tên cái mình nhắc nãy giờ. Một agent không phải chatbot xịn hơn. Khác biệt không nằm ở chỗ nó nói hay hơn, mà ở chỗ nó tự làm được việc.
Cứ hình dung cách một người làm việc: có cái đầu để nghĩ, có tay chân để làm, có trí nhớ để khỏi quên việc đang dở, và có một mục tiêu để biết mình làm vì cái gì. Một agent cũng đúng bốn thứ đó, chỉ là bằng linh kiện số: bộ não là mô hình AI, tay chân là các công cụ nó gọi được (tìm web, đọc file, gửi mail), trí nhớ giữ bối cảnh, mục tiêu là điều bạn giao. Bốn thứ này ghép trong một vòng lặp: nhận việc, tự hỏi cần làm gì tiếp, gọi công cụ, lấy kết quả về, rồi quay lại tự hỏi, tới khi xong mới dừng. Hết. Không có gì huyền bí, và quan trọng là không cần biết code đâu.
Đặt hàng và thiết lập: nghĩ như người đặt hàng
Hiểu agent rồi thì việc của bạn không phải viết code, mà là biết đặt hàng. Đặt hàng một agent gọn trong bốn câu hỏi: cái gì kích hoạt việc này, ở đâu cần ra quyết định, kết quả đạt trông thế nào, và chốt chặn an toàn ở đâu, tức điều agent tuyệt đối không được tự làm. Trả lời trơn cả bốn là bạn vừa tìm ra ứng viên đầu tiên cho đội trợ lý của mình, dù chưa đụng một dòng code.
Nhưng trước khi giao việc lớn, phải chỉnh lại tính nết của AI một chút. Mặc định nó hay gật: bạn nói gì cũng "đúng rồi", rồi đẻ thêm lý do cho cái sai của bạn. Dễ chịu mà nguy. Nên cài cho nó dám cãi: giao vai phản biện, bắt nó chỉ ra điểm yếu trước khi làm theo, cấm cả kiểu khen rỗng lẫn kiểu bịa số cho nghe hợp lý. Một cộng sự dám nói thẳng "chỗ này sai" đáng giá hơn nhiều một cái máy chỉ biết vâng.
Giữ chuẩn: chỗ bạn không thể giao cho máy
Đây là phần xương sống của cả vòng. AI đưa thông tin sai một cách rất tự nhiên và tự tin. Nghịch lý là khi nó nói "tôi không chắc" thì đó là tín hiệu tốt; lúc nó trình bày trơn tru bằng giọng chắc nịch mới là lúc cần soi nhất. Mình gọi loại đầu ra đó là slop: AI nói điều nó không biết bằng đúng giọng của điều nó biết.
Gặp một tin chưa chắc, chạy bốn nhịp theo đúng thứ tự: khựng lại đã (chưa chia sẻ, chưa đưa vào bài), soi xem ai đứng sau tin, đối chiếu với một nguồn đáng tin khác, rồi lần về tận bản gốc. Bốn nhịp đó áp cho cả tin bạn đọc được lẫn thứ AI đưa cho bạn, vì AI cũng chỉ là một nguồn, lại là nguồn phải soi kỹ hơn bình thường.
Hai thứ nữa đi kèm. Một là con mắt bắt văn AI: nó hay mở bài sáo, hay dựng câu bị động kiểu dịch, hay chêm mấy cụm nghe sang mà rỗng. Mẹo bắt nhanh nhất không phải soi từng quy luật, mà là đọc to đoạn văn lên, tai bắt giọng giả nhanh hơn mắt. Hai là kỷ luật dữ liệu: chọn AI theo việc chứ không theo lời đồn, và nhớ cái đèn giao thông. Xanh là văn bản đã công bố, cứ dùng. Vàng là dự thảo chưa duyệt, cân nhắc. Đỏ là dữ liệu cá nhân công dân, văn bản mật, tuyệt đối không đẩy lên chỗ lạ. Tin nhạy thì giữ trên sân nhà.
Xây: dựng con trợ lý đầu tiên
Gom hết những thứ trên lại, bạn dựng được một con trợ lý thật. Ví dụ quen nhất là một agent điểm tin buổi sáng: nó tự đọc tin từ mấy nguồn bạn theo, lọc trùng, lọc theo mảng bạn quan tâm, tóm mỗi tin vài câu kèm đường dẫn gốc, rồi gửi cho bạn một bản gọn trước khi bạn vào cơ quan.
Bốn câu hỏi đặt hàng lúc nãy giờ hiện thành bốn khối nối nhau: một khối hẹn giờ chạy mỗi sáng, một khối đọc tin về, một khối dùng AI để lọc và tóm, một khối gửi bản tin đi. Đúng cái vòng lặp đã nói. Và đừng quên khối vô hình quan trọng nhất ở cuối: chốt chặn người duyệt. Bản tin tới tay bạn trước, bạn liếc qua rồi mới quyết dùng gì. Một việc trước đây ngốn cả buổi sáng lướt tin, giờ xong trong lúc bạn còn chưa pha xong cốc cà phê.
Nhân rộng: từ một con tới cả một đội
Con agent điểm tin đơn giản tới mức gần như tầm thường, nhưng nó gói trọn cái cốt của tư duy agent. Nắm được cái cốt đó rồi thì bạn không dừng ở một con. Bạn dựng được một con theo dõi văn bản mới trên cổng, một con dò tên và số liệu trong bản thảo, một con dựng bản tóm tắt diễn biến từ tư liệu cũ. Mỗi con may đo cho đúng một việc trong ngày của bạn.
Không cần vội. Bốn tuần là đủ để cách nghĩ này thành phản xạ. Tuần đầu, mỗi ngày thay một việc quen bằng cách giao việc cho rõ. Tuần hai, tập tinh chỉnh qua vòng hai vòng ba thay vì nhận ngay bản đầu. Tuần ba, gom lại một bộ câu lệnh riêng cho mấy việc lặp đi lặp lại. Tuần tư, nghĩ như người đặt hàng agent và phác ra con trợ lý đầu tiên. Bỏ ngày nào thì làm bù ngày đó, đừng bỏ luôn. Tới lúc đó cái chặn bạn không còn là công cụ nữa, mà là bạn nghĩ ra được bao nhiêu việc để giao.
Kết: cái gì ký tên mình thì mình kiểm
Có một chỗ mà không agent nào, dù mạnh đến đâu, làm thay được bạn: bối cảnh thật của cơ quan, phán đoán nên hay không nên, và trách nhiệm cùng chữ ký cuối cùng. Mọi tòa soạn nghiêm túc đều giữ một nguyên tắc giống nhau, người đặt tên mình lên bài là người sở hữu bài, bất kể công cụ nào đã giúp làm ra nó.
Cho nên cả vòng này không kéo bạn ra xa nghề, nó trả bạn về đúng nghề. Agent gánh phần việc lặp lại để bạn dồn sức cho phần chọn góc, thẩm định, chịu trách nhiệm. AI ở đây để giúp chúng ta, không phải để thay chúng ta. Và cái gì ký tên mình, thì mình kiểm.