Bài 5

Kiểm chứng và chống `slop`

Phần 1 · Bài 5 · Nội bộ, không phát hành bên ngoài

Lúc nguy nhất là khi AI nói chắc nịch

AI đưa thông tin sai một cách rất tự nhiên và tự tin. Nghịch lý là, khi AI nói "tôi không chắc" thì đó là tín hiệu tốt; còn khi nó trình bày trơn tru bằng giọng chắc nịch, đó mới là lúc cần kiểm chứng nhất. slop là tên gọi cho loại đầu ra này, tức AI nói điều nó không biết bằng đúng giọng của điều nó biết.

`slop` có ba hình dạng

Một là bịa ra cái không có: một đường dẫn, một cái tên, một văn bản không tồn tại. Hai là khẳng định chắc nịch điều không có cơ sở: một con số, một chức danh, một trích dẫn gán cho người thật mà chưa có nguồn. Ba là báo "đã xong, đã kiểm" trong khi chưa hề kiểm. Ba hình dạng, một bản chất: tự tin vượt quá hiểu biết.

Vì sao AI hay bịa? Vì nó được tinh chỉnh để làm bạn hài lòng. Mặc định của nó là đồng tình và lấp chỗ trống bằng thứ nghe hợp lý. Bịa không phải lỗi hiếm, nó là xu hướng gốc.

Vì sao agent làm rủi ro lớn hơn, không nhỏ đi

Lỗi của một chatbot là một câu trả lời sai, bạn đọc rồi bỏ. Lỗi của một agent là một hành động sai, được làm ở quy mô, trước khi kịp có ai nhận ra. Một agent tự gửi, tự sửa, tự đăng mà không có người chốt chặn có thể nhân cái sai lên nhiều lần chỉ trong vài phút. Càng giao nhiều cho agent, kỷ luật kiểm chứng càng quan trọng, chứ không bớt đi.

Bốn nhịp khi gặp tin chưa chắc

Trước khi tin hay dùng một thông tin lạ, chạy bốn nhịp này, theo đúng thứ tự: khựng, soi, đối, lần.

Khựng lại. Chưa chia sẻ, chưa đưa vào bài, chưa giao cho agent xử tiếp. Phản xạ muốn dùng ngay là chỗ hỏng nhiều nhất.

Soi nguồn. Ai đứng sau thông tin này. Một tài khoản mới lập, một trang không rõ chủ, một bản AI tổng hợp đều phải hạ mức tin.

Đối chiếu. Nguồn đáng tin khác có nói cùng điều đó không. Một nguồn đứng một mình thì chưa đủ.

Lần về gốc. Tin thật gần như luôn có một bản gốc: một văn bản, một bản ghi, một số liệu công bố. Lần cho tới khi chạm bản gốc, đừng dừng ở bản kể lại.

Bốn nhịp này áp cho cả tin bạn đọc được lẫn thứ AI đưa cho bạn. AI cũng chỉ là một nguồn, và là nguồn cần soi kỹ hơn bình thường.

Kiểm chứng theo từng loại dữ kiện

Không phải dữ kiện nào cũng sai theo một kiểu, nên mỗi loại có một điểm ngờ riêng.

Tên người và chức danh là chỗ sai phổ biến nhất, nhất là sau các kỳ kiện toàn bộ máy, vì dữ liệu của AI thường trễ hơn thực tế. Số hiệu văn bản phải tra về bản gốc, đừng tin AI đọc hộ. Số liệu phải về nguồn công bố. Trích dẫn phải có người nói thật và nguồn thật, không gán bừa.

Tại cơ quan nhà nước. Sai một cái tên gắn với một chức danh trong văn bản chính thức là lỗi nặng nhất và cũng dễ xảy ra nhất. Sau mỗi đợt kiện toàn nhân sự, đặt mức ngờ cao nhất cho mọi cặp tên và chức danh mà AI đưa ra.

Mỗi loại dữ kiện về một gốc khác nhau

Loại dữ kiện	Về đâu để kiểm
Tên người, chức danh	Cổng thông tin cơ quan, quyết định bổ nhiệm, tin chính thức mới nhất
Số hiệu văn bản	Bản gốc văn bản, công báo, cơ sở dữ liệu pháp luật
Số liệu	Nơi công bố gốc: cơ quan thống kê, báo cáo gốc, không qua bản dẫn lại
Trích dẫn	Bản ghi âm, bản gốc bài nói, hoặc hỏi thẳng người nói

Càng về gần gốc, bằng chứng càng mạnh. Một văn bản chính thức hay một bản ghi mạnh hơn lời kể; lời kể mạnh hơn một dòng trên mạng xã hội, thứ có thể bị xóa hay cắt khỏi ngữ cảnh bất cứ lúc nào.

Năm mức khi kết luận một thông tin

Kiểm xong, đừng chỉ nói "đúng" hay "sai". Đặt vào một trong năm mức, để người đọc bản của bạn biết bạn chắc tới đâu.

Mức	Khi nào
Đúng	Khớp với bằng chứng, không thiếu gì đáng kể
Phần lớn đúng	Đúng cốt lõi, còn thiếu chút ngữ cảnh hoặc cần làm rõ
Nửa đúng	Đúng một phần, nhưng bỏ mất ngữ cảnh quan trọng làm lệch cách hiểu
Phần lớn sai	Có chút đúng nhưng tổng thể gây hiểu lầm
Sai	Bằng chứng bác bỏ

Mức này dùng cho cả việc kiểm nội bộ trước khi đăng lẫn việc viết một bài kiểm chứng riêng.

Lưu bản gốc ngay khi định trích

Trang mạng đổi nội dung, bị gỡ, hoặc bị che sau tường phí bất cứ lúc nào. Một bài báo, một công văn đăng trên mạng, một dòng trạng thái bạn định trích hôm nay có thể biến mất trước khi bài lên. Nên ngay lúc quyết định một nguồn có thể vào bài, lưu lại ngay: chụp màn hình cả trang kèm thanh địa chỉ và ngày giờ, lưu một bản gốc về máy, và lưu đường dẫn vào một dịch vụ lưu trữ như Wayback Machine hay archive.today. Lưu ngay thì trích dẫn còn đó để dùng; chậm tay thì nó bốc hơi trước giờ bài lên.

Nhờ một AI khác soi lại

Một mẹo đơn giản mà ít người làm: khi không chắc một đoạn AI vừa viết có vững không, đừng tự ngồi đoán, đưa nó sang một AI khác và bảo soi tìm chỗ sai. Bạn chỉ cần chép đoạn đó, mở một mô hình khác hoặc một cửa sổ chat mới, rồi hỏi thẳng: "Đoạn này có chỗ nào sai sự kiện, có chỗ nào sơ hở hay nói quá không?"

Vì sao cách này ăn? Cùng một AI, hỏi đi hỏi lại trong cùng một mạch trò chuyện, nó có xu hướng bênh cái nó vừa nói. Một AI khác bước vào từ đầu, không mắc cùng lối nghĩ, nên hay bắt được đúng chỗ mà cái đầu tiên cho qua. Giống như đưa bản thảo cho một đồng nghiệp chưa đọc lần nào: họ thấy ngay lỗi mà mình đã quen mắt nên bỏ qua.

Cách này không phải để tin máy này hơn máy kia, mà để hai góc nhìn không cùng một lối cùng soi một đoạn. Chỗ nào cả hai cùng thông qua thì bạn yên tâm hơn; chỗ nào chúng vênh nhau, đó đúng là chỗ bạn phải tự kiểm bằng nguồn gốc.

Câu hỏi chốt khi AI viện cớ

Đôi khi AI nói "tôi không kiểm chứng được vì [một lý do kỹ thuật]". Hãy hỏi lại một câu: cái gì cụ thể đang chặn nó lúc này? Nếu không có vật cản thật, mà chỉ là nó ngại làm, thì đó là một cái cớ bịa, và bạn đừng nhận. Nguyên tắc đó cũng đúng với chính mình khi làm việc dưới áp lực.

Ba điều AI không thay được bạn

Có ba thứ một agent dù mạnh đến đâu cũng không làm thay: bối cảnh thực tế của cơ quan và công việc, phán đoán về thể chế và chuyện nên hay không nên nói, rồi trách nhiệm cùng chữ ký cuối cùng. Tòa soạn nào nghiêm túc trên thế giới cũng giữ một nguyên tắc giống nhau: người đặt tên mình lên bài là người sở hữu bài, bất kể công cụ nào đã giúp làm ra nó.

Đây không phải hạn chế của AI. Đây là lý do bạn không thể bị thay thế. AI ở đây để giúp, không phải để thay.

Thiết lập AI tốt nâng cái sàn, tức giảm tần suất lỗi. Chỉ có sự tỉnh táo của nhà báo mới nâng được cái trần. Không có cấu hình nào xóa bỏ được nhu cầu kiểm chứng của con người, và đó chính là chỗ đứng không thể thay thế của bạn.

Quay lại Nội bộ · không phát hành bên ngoài

Kiểm chứng và chống slop

Lúc nguy nhất là khi AI nói chắc nịch

slop có ba hình dạng

Vì sao agent làm rủi ro lớn hơn, không nhỏ đi

Bốn nhịp khi gặp tin chưa chắc

Kiểm chứng theo từng loại dữ kiện

Mỗi loại dữ kiện về một gốc khác nhau

Năm mức khi kết luận một thông tin

Lưu bản gốc ngay khi định trích

Nhờ một AI khác soi lại

Câu hỏi chốt khi AI viện cớ

Ba điều AI không thay được bạn

Kiểm chứng và chống `slop`

`slop` có ba hình dạng