Van Hiep Nguyen – 2025-10-11 12:01:19
VỀ MỘT HIỆN TƯỢNG ĐÁNG LO NGẠI LIÊN QUAN ĐẾN SỬ DỤNG CÔNG CỤ TRÍ TUỆ NHÂN TẠO (AI) HIỆN NAY: NGỤY TẠO TÀI LIỆU
(Theo gợi ý của một thành viên Diễn đàn Liêm chính Khoa học mà tôi rất quý, tôi xin đăng bài này trên trang của Diễn đàn, chỉ bỏ bớt phần PS tranh thủ PR cho buổi thuyết trình cuối tháng 11 của tôi ở Trường Đại học Sài Gòn)
Cần phải nói ngay, là thế hệ không còn trẻ như tôi luôn ủng hộ AI, không ngừng hoan hỉ dùng AI vì AI giúp mình được một số tác vụ, trong đó có những tác vụ làm mất thời gian khá nhiều trước đây, như viết thư trao đổi học thuật quốc tế (tôi thường đánh vật trong việc viết sao cho đúng chính tả, spelling, chứ từ vựng-ngữ pháp thì trình độ mình thế nào cứ viết thế đó thôi; AI xử lí spelling hoàn hảo). Hiện nay tôi vẫn dùng Ai hàng ngày.
Tuy nhiên…
Trong mấy đợt tham gia hội đồng chấm tuyển NCS đầu vào vừa qua, tôi thật sự kinh ngạc và lo ngại, bởi một số ứng viên chắc chắn đã dùng AI để viết phần Tổng quan (Overview). Họ viết Tổng quan hàng chục trang, thông kim bác cổ, trích dẫn Đông Tây tràn ngập, kiểu “biển người” như quân Trung Quốc xâm lược VN năm 1979. Tôi theo các thầy cô, tham gia đào tạo sau đại học trong ngành Ngôn ngữ học gần 30 năm nay, tôi phải nói ngay là người trần, cỡ thiên tài như Nguyễn Tài Cẩn, Cao Xuân Hạo… cũng không thể có đủ thời gian và tài liệu để đọc và viết được Tổng quan siêu hạng như thế. Nếu là viết bằng tiếng Việt thì tôi và các thầy cô trong hội đồng có thể đánh giá, phát hiện những tài liệu ngụy tạo, chẳng hạn đặt vài câu hỏi để kiểm tra xem ứng viên có đọc thực và hiểu vấn đề không (dĩ nhiên, không nên đặt câu hỏi quá đáng, xúc phạm học trò, kiểu “Em cho biết cuốn sách đó bìa màu gì?). Nhưng nếu là Tổng quan viết bằng tiếng Anh, dẫn tài liệu tiếng Anh thì rất khó để kiểm tra, phát hiện các ngụy tạo, bởi tôi và các thầy cô cũng không thể có ngần ấy tài liệu để đọc.
Tôi định viết cái stt về việc này, những rồi việc ngập đầu, chưa viết được.
Thì sáng nay…
Bạn Bùi Mạnh Hùng, cụ Tổng (tôi gọi bạn là cụ Tổng, Tổng chủ biên bộ sách Ngữ văn tiếng Việt đang được sử dụng rộng rãi hiện nay, bộ Kết nối tri thức), nhắn tin: “Mình muốn đọc bài này của Hiệp. Hiệp còn giữ không? Nếu có, gửi cho mình đọc nhé! Nguyễn Văn Hiệp (2015). Ẩn dụ ngữ pháp trong tiếng Việt nhìn từ lý thuyết ngữ pháp chức năng hệ thống. – Tạp chí Ngôn ngữ & Đời sống, số 7”.
Mình ngờ ngợ, chẳng lẽ mình viết bài này mà không nhớ (vì mình quan tâm đến ẩn dụ ngữ pháp theo quan điểm Halliday, từ những năm 2008, 2009, và đã hướng dẫn học trò, cũng như viết đây đó về vấn đề này), chẳng lẽ mình đãng trí như nhà thơ Lưu Trọng Lư ngày nào, đang nằm đọc sách, vùng dậy phán, thơ ông nào mà hay quá trời đất thế này “Giật mình ta thấy bồ hôi lạnh/Mộng đẹp bên chăn đã biến rồi!”, hóa ra đó chính là thơ của chính cụ Lưu Trọng Lư!
Mình và bạn Hùng đều nghi mọi chuyện do AI ngụy tạo.
Bèn nhắn tin hỏi bạn Hùng cho mình cái link có dẫn bài đó (xem ảnh chụp). Than ôi, đúng là AI ngụy tạo!
Mình lục CV kiểm tra, gửi cho Hùng các bài mình công bố năm 2015, không hề có bài đó, gửi kẻo bạn lại nghĩ bài kém quá nên mình giấu nhẹm:
1)Automatic detection of problematic rules in Vietnamese Treebank. Bài đăng trong Kỷ yếu Hội thảo quốc tế RIVE 2015, được đưa vào IEEE Xplore thuộc dữ liệu Scopus, Link:
[https://ieeexplore.ieee.org/document/7049867/metrics#metrics](https://l.facebook.com/l.php?u=https%3A%2F%2Fieeexplore.ieee.org%2Fdocument%2F7049867%2Fmetrics%3Ffbclid%3DIwZXh0bgNhZW0CMTAAYnJpZBExaE53b3dTdFFpNnlCYllkMQEe9JsLoNAjrzDq03LxbWpMZd_PTsohktf7xdHOStH1iVWr8XenDqE5yO-q4Ls_aem_m7gdMWy8zVakHjrjSPssFw%23metrics&h=AT133oTOVynyHiI18mQoccYS10WOHqwjyGT4wsVHgKKSzXfaGZ2u3fLjLIq4C75xT-7fYnOlhLDs-KhTd3ry9-qEndUOPoAfRvOLzCJYjnYu0O9hwNnorUR5t-OPWPESKcm5TXLMYG3Orusn&__tn__=-UK-R&c[0]=AT2LNOZg5jrwVrYCkMyhYJQ9EIQgVt8ZwiJxTYBDymZ1bXIwuEvLG2COsSZreLecNFnv9AQH51ioNZ6HsoQH2rIGOxi6niYN8SbKJqIUBmDv041ywtt9-OEIMBUCAh94LaXOy6SCnjoU0z49ksg77kjlEY60A0yZYJOxhI_JotrLDNDlTg) 2015 (đồng tác giả)
2)Vietnamese treebank construction and entropy-based error detection. Tạp chí ISI: “Language Resources and Evaluation” Springer Science, Dordeccht 2015 (đồng tác giả)
3)Ngôn ngữ học Việt Nam 30 năm đổi mới và phát triển. Tạp chí Ngôn ngữ, Số 8+9/2015.
4)Một số vấn đề mới trong giữ gìn và phát triển tiếng Việt. Kỷ yếu Hội thảo Khoa học Việt Nam học- Những phương diện văn hóa truyền thống. Nxb Khoa học Xã hội, 2015.
5)Ngôn ngữ giới trẻ hiện nay nhìn từ quan điểm của một số lí thuyết ngôn ngữ học hiện đại. Tạp chí Thông tin Khoa học xã hội, Số 6/2015
6)Ngữ pháp tạo sinh và việc đánh giá hiện tượng ngôn ngữ “phi chuẩn” của lớp trẻ hiện nay. Tạp chí Từ điển học & Bách khoa thư, Số 1/2015.
7)Ngữ pháp chức năng hệ thống và đánh giá ngôn ngữ “phi chuẩn” của giới trẻ hiện nay theo quan điểm của ngữ pháp chức năng hệ thống. Tạp chí Ngôn ngữ & Đời sống, Số 1/2015.
Không hề có bài của mình, mà AI phân tích như…thật! Thật đáng sợ.
Xem lại ảnh tin nhắn của Hùng, phát hiện thêm tài liệu chắc chắc là ngụy tạo, vì cuối đời, thầy Cơ chỉ viết về ngôn ngữ học tri nhận:
Trần Văn Cơ (2012): Ngữ pháp chức năng và ứng dụng trong phân tích diễn ngôn. Nxb Đại học Sư phạm.
Cả bài viết của GS Lê Quang Thiêm, chắc AI cũng ngụy tạo:
Lê Quang Thiêm (2010): Từ ẩn dụ từ vựng đến ẩn dụ ngữ pháp: hướng mở trong nghiên cứu ngôn ngữ học tri nhận”-Tạp chí Ngôn ngữ, Số 6.
Tài liệu ngụy tạo này, bên cạnh tội bịa đặt, còn tội xuyên tạc lịch sử: ẩn dụ ngữ pháp (grammatical metaphor) là di sản của Halliday, người sáng lập trường phái Ngữ pháp chức năng hệ thống (SFG), không liên quan gì đến Ngôn ngữ học tri nhận.
Thật là đáng báo động, thật giả lẫn lộn, “dĩ hư truyền hư”. Nền giáo dục mà chạy theo AI, không kiểm soát, thật đáng lo ngại
Shared link: https://ieeexplore.ieee.org/document/7049867/metrics#metrics
Statistics:
Likes: 1401, Shares: 316, Comments: 69
Like Reactions: 1133, Haha Reactions: 6, Wow Reactions: 16, Love Reactions: 229, Sad Reactions: 15, Angry Reactions: 0