Nguyễn Phước Duy – 2025-06-28 13:02:52
**Chia Sẻ Dữ Liệu Của Hơn 300 Nghìn Bài Luận Văn, Bài Tập Lớn Dùng AI ở Turnitin**
Chào các bạn,
Tôi là Phúc Dzũng, em của chủ tài khoản này. Bạn nào chơi FCO có thể biết tôi rất uy tin ở nhiều nhóm lớn. Từ năm 2022, anh tôi đã âm thầm thu thập hơn 300 nghìn bài luận và phát hiện đủ kiểu gian lận từ sinh viên cho tới giảng viên luôn. Hôm nay tôi đăng một phần dữ liệu thu thập được của các sinh viên / giảng viên có hành vi dùng AI để viết luận, giả số liệu, giả trích dẫn.
1️⃣ Dữ Liệu Thu Thập Được
Dưới đây là các mẫu bằng chứng.
[Các tệp tin anh Duy đã che tên] Bài tập lớn và luận văn của sinh viên FTU, ULIS, FPT, UEH trong năm 2023 và 2024:
[https://drive.google.com/drive/folders/1xTv_Z3M559nHsdxhSwlp7iNSt7wWSyr0?usp=drive_link](https://drive.google.com/drive/folders/1xTv_Z3M559nHsdxhSwlp7iNSt7wWSyr0?usp=drive_link)
[https://drive.google.com/drive/folders/14bsBMCzgtvb89QHWMcIAtaViNKRMQeJl?usp=drive_link](https://drive.google.com/drive/folders/14bsBMCzgtvb89QHWMcIAtaViNKRMQeJl?usp=drive_link)
[Phần tôi lười nên không che tên] Bài tập lớn và luận văn của sinh viên MTESOL trường đại học Sư Phạm TPHCM năm 2024, ngành Quản Trị Kinh Doanh đại học Quốc Tế (IU) năm 2025 (mẫu >50% dùng AI), và vài trường khác:
[https://drive.google.com/drive/folders/1YA5d3R-ief3_1mtgFJlTXnflrpuBzZEN?usp=drive_link](https://drive.google.com/drive/folders/1YA5d3R-ief3_1mtgFJlTXnflrpuBzZEN?usp=drive_link)
[https://drive.google.com/drive/folders/1O-HniRG9ylnDWJCE9hlpwi0d4skEaslz?usp=drive_link](https://drive.google.com/drive/folders/1O-HniRG9ylnDWJCE9hlpwi0d4skEaslz?usp=drive_link)
Mẫu hơn 1,000 tệp bài tập lớn và luận văn dùng AI (trong tổng số 300,000 tệp):
[https://drive.google.com/drive/folders/13K6aUxwq-nscxISaoQKh3BXhggYHBmY9?usp=sharing](https://drive.google.com/drive/folders/13K6aUxwq-nscxISaoQKh3BXhggYHBmY9?usp=sharing)
Tôi cũng có mẫu hơn 2,000 tệp (6 GB) và 3,000 tệp (14 GB) nhưng không mở công khai (sẽ công khai nếu nhận được phản hồi tốt để đăng vào bài sau).
2️⃣ Quá Trình “Không” Liêm
Gian lận kiểu cũ là sinh viên sao chép tài liệu từ một nguồn nào đó, dịch ra một ngôn ngữ thứ hai, rồi từ ngôn ngữ thứ hai dịch về tiếng Việt. Nhưng cũng có những sinh viên liều hơn là sao chép 100% nội dung trên mạng, rồi sau đó mua tài khoản Turnitin để kiểm tra phần trăm đạo văn rồi sửa bài đến khi nào phần trăm đạo văn dưới 20% hoặc 15% để đủ tiêu chuẩn nộp.
Gian lận kiểu mới là sinh viên dùng các công cụ AI như Claude hay ChatGPT để viết luận văn, sau đó cũng nộp lên một kênh Turnitin lậu để kiểm tra phần trăm văn bị “detect” là do AI viết. Sau đó sinh viên sẽ dùng các công cụ khác nhau để biến văn AI thành văn sạch, tức là văn không bị hệ thống nhận diện là AI.
Từ năm 2022, toàn bộ quá trình này đã được anh tôi ghi lại và lưu lại bài. Có rất nhiều sinh viên nộp bài lần đầu bị hệ thống phát hiện là do AI viết đến 80% bài luận, nhưng sau khi chỉnh sửa rất nhiều lần (từ 80% ban đầu xuống còn dưới 20% sau rất nhiều lần chỉnh sửa) và kiểm tra lại để tỷ lệ nội dung bị phát hiện là AI xuống còn 0%, họ có thể qua mặt hệ thống mà không bị phát hiện.
Có ý kiến phản biện sẽ hỏi rằng hệ thống kiểm tra AI của Turnitin có chính xác hay không thì câu trả lời là: CÓ bởi vì anh tôi đã dùng hệ thống để thử kiểm tra trên các bài báo khoa học từ Scihub thì tỷ lệ “false positive” rất thấp. Nhưng vấn đề ở đây là khi bạn thấy một bài luận được đăng lên Turnitin với tỷ lệ AI 80%, sau đó được chỉnh sửa và được đăng lên lại Turnitin rất nhiều lần để kiểm tra cho đến khi tỷ lệ AI 0% thì có phải chắc chắn là học sinh dùng AI để viết luận không?
3️⃣ Nhận thấy gì từ những tệp này?
Ai cũng biết phần lớn học sinh, sinh viên ngày nay rất tích cực sử dụng AI để viết bài tập, luận văn. Điều đáng nói là dù AI thông minh cỡ nào thì sản phẩm của các bạn lại toàn… 💩.
Vì sao tôi bảo là 💩? Vì hồi xưa, chưa có AI, sinh viên thức đêm cày luận văn còn hơn cả nông dân cày ruộng, còn bây giờ thì chỉ việc nhét mớ thông tin vào cho máy viết hộ. Kết quả là trích dẫn lung tung, dữ liệu giả mạo, phương pháp nghiên cứu lệch lạc từ đầu chí cuối. Hỏi thật nhé, mấy bạn sinh viên bây giờ có hiểu nổi những gì ghi trong chính luận văn của mình không?
Nếu bạn nghi ngờ điều tôi nói thì cứ thoải mái tìm xem thử các luận văn tốt nghiệp của ULIS năm 2024, hoặc của Đại học Quốc tế (UI) năm 2025. Tôi đã tận dụng NotebookLM Plus, Scihub cùng Zotero để tải về và kiểm tra toàn bộ phần trích dẫn, và nói thật lòng là nhiều bài sai be bét.
Vậy đó, hậu quả là gì? Chúng ta đang chứng kiến một thế hệ cử nhân, thạc sĩ và cả tiến sĩ không có trình độ thực sự. Nói trắng ra là toàn những người có bằng cấp “ảo” còn hơn cả các thế hệ trước. Nhưng bạn nghĩ vậy đã đủ tệ rồi á?
Bình tĩnh làm vài ly bia, tôi sẽ tiếp tục phân tích thêm những điểm thú vị hơn ở bài sau!
4️⃣ Mục Đích Tôi Đăng Bài Này Là Gì?
Nói về AI thì ai mà chẳng dùng đúng không? Nhưng tôi đăng bài này không phải để dằn mặt, cũng không phải để làm khó các bạn sinh viên hay thầy cô đâu.
Mục đích chính là để mọi người nhìn thẳng vào sự thật: nếu cứ tiếp tục nhắm mắt làm ngơ, phớt lờ chuyện này thì một ngày đẹp trời, bằng cấp nước mình sẽ chẳng khác gì tờ giấy in màu bán ngoài chợ trời, nhìn thì hào nhoáng nhưng bên trong thì rỗng tuếch.
Tôi muốn các bạn, nhất là những người làm giáo dục, hãy dũng cảm nhìn nhận: AI không xấu, cái xấu là cách ta lạm dụng nó để lừa mình, lừa người. Nếu đã dùng AI thì phải dùng cho ra người, dùng để hỗ trợ tư duy chứ không phải làm bình phong để trốn tránh việc học. Ngoài ra, đăng bài này còn là lời cảnh báo nhẹ nhàng tới các bạn thích ăn gian: tưởng qua mặt được hệ thống nhưng cuối cùng vẫn không qua nổi chính mình đâu.
Cuối cùng, tôi cũng mong đây sẽ là dịp để mọi người cùng bàn luận, góp ý, thậm chí phản biện gay gắt nếu thấy tôi nói sai. Ai có góc nhìn, kinh nghiệm thực tế, hay ý kiến trái chiều tôi xin tiếp thu.
Cảm ơn các bạn đã đọc!
Shared link: https://drive.google.com/drive/folders/1xTv_Z3M559nHsdxhSwlp7iNSt7wWSyr0?usp=drive_link
Statistics:
Likes: 426, Shares: 162, Comments: 40
Like Reactions: 339, Haha Reactions: 13, Wow Reactions: 7, Love Reactions: 59, Sad Reactions: 2, Angry Reactions: 1