Alméry Jacqueline – 2025-07-18 23:00:54
**Các bài báo chất lượng thấp dựa trên dữ liệu y tế công cộng đang tràn ngập tài liệu khoa học**
Một phân tích mới công bố cảnh báo hàng ngàn bài nghiên cứu y sinh chất lượng thấp và mang tính công thức đang tràn ngập các tạp chí khoa học, phần lớn dựa vào các cơ sở dữ liệu y tế mở như NHANES (Mỹ), UK Biobank (Anh), FAERS (Mỹ), Global Burden of Disease (GBD), và FinnGen (Phần Lan). Tình trạng này có thể là do sự lạm dụng trí tuệ nhân tạo sinh văn bản (như ChatGPT, Gemini) hoặc là sản phẩm của các lò bán bài (paper mills).
Từ năm 2021 đến 2024, số bài báo dựa vào dữ liệu từ các nguồn trên tăng từ khoảng 4.000 lên 11.500 bài, cao hơn khoảng 5.000 bài so với dự báo. Một số bài có tiêu đề dạng khuôn mẫu hoặc đưa ra kết luận đáng ngờ như việc uống sữa ít béo có thể ngăn ngừa trầm cảm, hay trình độ học vấn liên quan đến khả năng bị thoát vị sau phẫu thuật.
Tác giả đầu của nghiên cứu, nhà khoa học Matt Spick (ĐH Surrey, Anh) cảnh báo xu hướng này có thể làm suy giảm niềm tin vào khoa học mở. Nhóm của Spick đã phát triển công cụ phát hiện sớm để giúp biên tập viên, chuyên gia bình duyệt và giới nghiên cứu nhận diện lỗ hổng dễ bị lợi dụng trong hệ thống xuất bản học thuật.
Tạp chí *Journal of Global Health* cũng ghi nhận sự gia tăng đột biến các bản thảo kiểu này từ năm 2022, chiếm đến gần 20% tổng số bài nộp cho tạp chí trong năm 2024. Tạp chí đã ban hành quy định yêu cầu tác giả phải công khai số lượng bài báo trước đó sử dụng dữ liệu mở, khai báo việc sử dụng AI và mô tả cách họ kiểm tra sai lệch trong kết quả.
Nhóm nghiên cứu của Spick hy vọng các tạp chí khác sẽ áp dụng biện pháp tương tự để giám sát việc khai thác dữ liệu y tế công khai một cách có trách nhiệm và giảm bớt các bài báo rác.

Statistics:
Likes: 98, Shares: 6, Comments: 5
Like Reactions: 86, Haha Reactions: 3, Wow Reactions: 4, Love Reactions: 1, Sad Reactions: 4, Angry Reactions: 0