Văn AI lộ: nhận diện và sửa
AI viết tiếng Việt, nhưng tiếng Việt của ai
AI viết được tiếng Việt, nhưng một người đọc tinh ý, nhất là biên tập viên quen văn phong Hà Nội và văn bản hành chính, nhận ra văn AI gần như ngay lập tức. Vấn đề không phải sai chính tả, mà là một loạt dấu vết có quy luật. Biết các dấu vết này, bạn soát một bản AI viết nhanh như soát morasse.
Dấu vết thứ nhất: giọng vùng và câu bị động
Các mô hình có xu hướng nghiêng về từ vựng Nam Bộ kể cả khi được dặn viết giọng Hà Nội, và hay dựng câu bị động kiểu dịch từ tiếng Anh. Đây là nguồn lộ lớn nhất. Sửa bằng cách đảo về câu chủ động, trực tiếp, và thay từ địa phương bằng từ trung tính của văn phong hành chính.
Dấu vết thứ hai: mở bài sáo
Mấy kiểu mở bài sau là dấu hiệu nặng của văn AI: "Trong bối cảnh hiện nay", "Như chúng ta đã biết", "Ngày nay, thời đại 4.0", "Thời gian qua", "Gần đây", "Đáng chú ý là", "Có thể thấy rằng". Thay vì sáo ngữ, dẫn bằng một trong ba cách: dẫn bằng nguồn cụ thể, dẫn bằng sự việc gắn với cơ quan, hoặc dẫn bằng diễn biến mới nhất.
Dấu vết thứ ba: calque, tức dịch khung tư duy phương Tây
Nếu một cụm tiếng Việt nghe như đang đặt tên cho một khung phân tích phương Tây, ví dụ "Khoảng trống còn lại sau chỉ đạo" hay "Độ chênh giữa kỳ vọng và thực hiện", thay vì mô tả thẳng tình hình, thì đó là calque. Viết lại thành câu mô tả cụ thể, có số liệu, có số hiệu.
Tệ: "Khoảng trống còn lại sau chỉ đạo."
Tốt: "Chỉ thị số [X] ngày [Y] chưa quy định cơ chế báo cáo định kỳ về tiến độ giải ngân."
Tệ: "Độ chênh giữa kỳ vọng và thực hiện."
Tốt: "Chỉ tiêu [A] căn đến năm [B]; hết quý I mới đạt [C] căn, tức [D]% kế hoạch quý."
Dấu vết thứ tư: kỷ luật câu chữ
Câu phải đủ chủ ngữ vị ngữ, tự đứng vững mà không cần câu trước để hiểu; tránh câu cụt kiểu "gần hai tháng" hay "không phải vì tính năng kém". Không dùng gạch ngang dài trong văn xuôi. Không bullet hóa một luồng tường thuật liên tục. Không dùng cấu trúc lặp phủ định "không phải A, không phải B, mà C". Không chêm tiếng Anh khi đã có từ Việt thông dụng. Số liệu viết bằng chữ số và dùng ký hiệu %.
Phép thử đọc to
Cách bắt văn AI nhanh nhất không phải là soi từng quy luật, mà là đọc to đoạn văn lên. Nghe như đang đọc khẩu hiệu một hội nghị, như một bản thông cáo phát ra cho có, hay như văn mẫu điền vào chỗ trống thì viết lại. Nghe như bạn đang kể cho một đồng nghiệp ngồi cạnh nghe thì giữ. Tai bắt được giọng giả nhanh hơn mắt dò ra quy luật.
Một đoạn trước và sau
Tệ (văn AI):
Trong bối cảnh chuyển đổi số đang diễn ra mạnh mẽ, hội nghị đã diễn ra thành công tốt đẹp, đánh dấu một bước tiến quan trọng, thể hiện sự quyết tâm cao của các cấp các ngành trong việc đẩy mạnh ứng dụng công nghệ.
Tốt (viết lại):
Sáng [ngày], [cơ quan] họp về kế hoạch chuyển đổi số năm [năm]. Hội nghị chốt ba việc: [việc 1], [việc 2], [việc 3].
Bản tệ dài hơn mà không nói gì: không ai, không ngày, không việc cụ thể. Bản tốt ngắn hơn nhưng trả lời đủ ai, khi nào, làm gì.
Bài tập soi dấu vết
Lấy một đoạn bất kỳ do AI viết về một sự kiện của cơ quan. Đọc to lên. Gạch chân mọi mở bài sáo, mọi câu bị động kiểu dịch, mọi cụm calque, mọi chỗ chêm tiếng Anh thừa. Viết lại đoạn đó theo bốn nguyên tắc trên. Làm vài lần, mắt bạn tự bắt được dấu vết mà không cần nghĩ.
Thẻ tự soát trước khi giao
Trước khi giao một bản AI có dính tay, soát nhanh:
- Có mở bài sáo nào không ("Trong bối cảnh", "Thời gian qua", "Có thể thấy rằng")? Cắt.
- Có câu bị động kiểu dịch nào đảo được sang chủ động không? Đảo.
- Có cụm calque nào nghe như đặt tên cho một khung phân tích không? Viết thẳng lại.
- Có chỗ chêm tiếng Anh khi đã có từ Việt thông dụng không? Thay.
- Có gạch ngang dài chen vào văn xuôi cho "có nhịp" không? Đổi sang phẩy hoặc chấm.
- Có từ Nam Bộ lọt vào giọng Hà Nội không? Thay.
- Đọc to cả đoạn: còn nghe như khẩu hiệu không?
Dính từ hai ô trở lên thì bản đó cần thêm một lượt nữa.
Văn AI lộ không phải vì AI dốt tiếng Việt, mà vì nó viết theo thói quen của một thứ tiếng Việt dịch máy, giọng pha, sáo ở đầu. Con mắt biên tập là lớp lọc mà không cấu hình nào thay được.