Anonymous participant – 2025-06-17 13:24:08
Những điều nên làm nhằm tối ưu tính minh bạch và độ tin cậy cho bài báo
Cáo buộc hành vi ngụy tạo dữ liệu hoặc kết quả là loại nghi vấn phổ biến nhất. Các nghi vấn này thường phát sinh từ các dấu hiệu bất thường trong các bảng kết quả. Tuy nhiên trong hầu hết trường hợp, nó chỉ dừng lại ở ranh giới sự nghi ngờ, chưa thể khẳng định chắc chắn. Các bảng kiểm và quy tắc phát hiện ngụy tạo dữ liệu đều không đủ mạnh và chắc chắn, chúng chỉ dựa trên các quy luật thống kê hoặc kinh nghiệm. Bất thường vẫn có thể là ngoại lệ vô hại, hoặc thực sự là vết nứt đầu tiên của niềm tin, nếu tiếp tục điều tra sâu hơn người ta có thể phát hiện chuỗi sai phạm hệ thống, làm sụp đổ sự nghiệp của một nhà khoa học danh tiếng.
Có lần, một bạn trẻ trong nhóm chia sẻ sự bất an, lo sợ về việc có thể vô tình phạm sai sót trong công bố khoa học, một khi bị phát hiện có thể làm cớ cho sự nghi ngờ hoặc chỉ trích, dẫn đến nguy hại cho sự nghiệp. Vì vậy tôi viết bài này, với mục tiêu gợi ý về một số điều giản dị mà ta nên làm khi công bố khoa học, để chủ động làm bài báo của mình trở nên minh bạch, đáng tin cậy hơn, giảm thiểu nghi ngờ từ người đọc, ngay cả những người phê bình nghiêm khắc.
Vì làm trong ngành y khoa, đối tượng của bài viết dành cho các bạn bác sĩ làm nghiên cứu sinh, và sử dụng ví dụ về y học.
1) Tường thuật rõ ràng quy trình nghiên cứu với một chuỗi logic chặt chẽ
Khuyết điểm phổ biến của nghiên cứu sinh là viết phần Methods rất sơ sài, không cung cấp đầy đủ thông tin về công cụ, thiết bị, kỹ thuật đo lường, điều kiện thí nghiệm. Điều này có thể vô tình khuếch đại sự nghi ngờ về tính xác thực của dữ liệu; vì kẻ gian thường có hành vi tránh cung cấp thông tin cụ thể nhưng luôn viết mơ hồ, chung chung để người khác khó kiểm chứng.
Việc mô tả đầy đủ các trường hợp bị loại trừ, khiếm khuyết dữ liệu hoặc mất theo dõi … và phân tích nguyên nhân cho thấy thái độ trung thực, nghiêm túc
Không chỉ trình bày đầy đủ, mọi điều viết ra cần phải tạo ra chuỗi chứng cứ thật chắc chắn, không sót bất kì kẽ hở nào về mặt logic, tưởng chừng vô hại nhưng có thể gây nghi ngờ về hành vi can thiệp chủ ý.
Ví dụ, logic về mặt thời điểm và trình tự: các thông số lâm sàng nên được đo cùng thời điểm, hoặc trong một khoảng cách thời gian đủ ngắn. Một xét nghiệm chẩn đoán cần được tiến hành trước khi chẩn đoán xác lập (nếu ngược lại có thể gây nghi ngờ chủ ý tạo ra thiên lệch chọn mẫu). Trình tự trước sau còn tạo ra tính độc lập: ví dụ bảng câu hỏi tự đánh giá nên được điền trước mọi quy trình thăm khám, xét nghiệm khách quan khác.
Ví dụ khác: các thông số mang tính chủ quan, kết quả từ phân tích thủ công (ví dụ điểm số hình ảnh học, giải phẫu bệnh lý, phân tích PSG, ECG) nên được phối kiểm bởi nhiều (2 hoặc hơn) chuyên viên độc lập. Dữ liệu thu thập từ phỏng vấn nên được ghi âm.
2) Cung cấp dữ liệu gốc, hoặc thay thế bằng một mô tả chi tiết về cấu trúc và đặc tính phân bố của dữ liệu.
Nếu không có trở ngại hay tranh chấp, hãy chủ động cung cấp dữ liệu gốc. Chỉ với điều này thôi, bạn đã có thể xóa tan mọi nghi ngờ, thậm chí khi không ai muốn mất thời gian kiểm tra lại dữ liệu của bạn.
Trong trường hợp không thể cung cấp toàn bộ dữ liệu, bạn cần ý thức rằng những trị số thống kê mô tả đơn giản như trung bình, độ lệch chuẩn … là không đủ và có thể được dùng làm cớ để nghi ngờ và tấn công bạn. Một cách vô tình, các con số trong bảng kết quả có thể phạm vào vài quy tắc máy móc vốn được dùng để kiểm thử về bất thường dữ liệu, ví dụ SD quá thấp, tần suất các con số lẻ có vẻ lặp lại, vv
Để giảm thiểu nghi ngờ và tạo cảm tưởng tin cậy, bạn nên cho người đọc nhìn thấy một cách trực quan hình ảnh phân bố của dữ liệu: ví dụ, trình bày histogram, density plot trong phụ lục, dùng scatter plot, heatmap, vv
3) Không chủ quan, quá tự tin và dễ hài lòng với một kết quả thuận lợi
Bạn sẽ ngạc nhiên khi biết rằng đạt kết quả quá đẹp cũng là một dấu hiệu nghi ngờ, việc báo cáo hàng loạt kết quả hoàn hảo tuyệt đối, phù hợp hoàn toàn với giả thuyết ban đầu chưa hẳn là điều tốt.
Để làm tăng sự tin cậy, trước hết bạn phải tự phản biện lại chính kết quả của mình và trình bày thông tin này trong bài báo (phụ lục).
Ví dụ, chủ động loại trừ các biến gây nhiễu khác là một bước khởi đầu. Xác nhận cỡ mẫu bằng power analysis, thực hiện một sensitivity analysis hoặc refutation analysis thông qua các mô hình hồi quy, để kiểm chứng hiệu ứng bạn tìm được có thực sự độc lập hay không.
Trong phần bàn luận bạn cần biện luận, giải thích cơ chế nào dẫn đến kết quả này ?
Để kết thúc, tôi hy vọng là các kinh nghiệm được chia sẻ trong bài này sẽ không được dùng như một cách đối phó về mặt hình thức, phản điều tra để ngụy trang cho vi phạm. Hành vi này từng bị phát hiện trong vụ gian lận hệ thống của Diederik Stapel, khi người ta thấy các bài báo có dữ liệu giả của ông ta chứa nhiều từ ngữ liên quan đến phương pháp, điều tra và sự chắc chắn hơn bình thường. Văn phong này thể hiện xu hướng nhấn mạnh kỹ thuật và khẳng định mạnh mẽ kết luận.
Các bạn nên làm đúng những gì được báo cáo, và trình bày đúng, đầy đủ những gì đã làm.
Statistics:
Likes: 44, Shares: 8, Comments: 0
Like Reactions: 40, Haha Reactions: 0, Wow Reactions: 0, Love Reactions: 3, Sad Reactions: 1, Angry Reactions: 0