Prompt untuk Academic Integrity Check - Machine Learning
Instruksi Utama
Periksa kode machine learning saya secara menyeluruh untuk memastikan kepatuhan terhadap academic integrity dan best practices. Identifikasi setiap potensi masalah yang dapat mengkompromikan validitas hasil penelitian.
Area Pemeriksaan Spesifik
1. Data Integrity & Authenticity
- Periksa apakah ada indikasi data fabrication atau manipulation
- Verifikasi bahwa semua data sources dijelaskan dengan jelas
- Pastikan tidak ada synthetic data yang tidak dideklarasikan
- Cek consistency dalam data preprocessing steps
- Identifikasi missing values handling yang tidak tepat
2. Data Leakage Prevention
- Target Leakage: Pastikan tidak ada features yang mengandung informasi future/target
- Temporal Leakage: Verifikasi chronological order dalam time series data
- Training-Test Leakage: Cek bahwa preprocessing dilakukan setelah train-test split
- Cross-validation Leakage: Pastikan data preprocessing tidak dilakukan sebelum CV split
3. Cross-Validation Methodology
- Verifikasi bahwa CV strategy sesuai dengan nature data (time series, grouped data, etc.)
- Pastikan tidak ada data contamination antara folds
- Cek bahwa hyperparameter tuning menggunakan proper nested CV
- Identifikasi potential overfitting pada validation set
4. Model Development Ethics
- Periksa apakah ada excessive hyperparameter tuning (p-hacking equivalent)
- Verifikasi bahwa model selection criteria ditetapkan sebelumnya
- Pastikan tidak ada cherry-picking results
- Cek transparency dalam feature engineering process
5. Statistical Validity
- Verifikasi bahwa metrics evaluation appropriate untuk problem type
- Pastikan statistical significance testing dilakukan dengan benar
- Cek sample size adequacy untuk conclusions yang dibuat
- Identifikasi potential bias dalam sampling atau evaluation
6. Reproducibility Standards
- Periksa random seed setting untuk reproducible results
- Verifikasi bahwa semua dependencies dan versions documented
- Pastikan kode dapat dijalankan ulang dengan hasil yang sama
- Cek completeness of documentation
7. Methodology Transparency
- Identifikasi setiap step yang tidak dijelaskan dengan jelas
- Verifikasi bahwa limitations dan assumptions stated explicitly
- Pastikan negative results tidak disembunyikan
- Cek bahwa methodology choices justified properly
Berikan analisis dalam format berikut:
✅ COMPLIANT AREAS:
- List aspek yang sudah sesuai standar
⚠️ POTENTIAL ISSUES:
- List masalah potensial dengan severity level (Low/Medium/High)
- Berikan explanation dan recommended fixes
❌ CRITICAL VIOLATIONS:
- List pelanggaran serius yang harus diperbaiki immediately
- Berikan specific guidance untuk perbaikan
📋 RECOMMENDATIONS:
- Saran untuk meningkatkan academic rigor
- Best practices yang belum diimplementasikan
Konteks Tambahan
Saya adalah [mahasiswa/peneliti] yang sedang mengerjakan [jenis penelitian/tugas]. Hasil ini akan [dipublikasikan/dipresentasikan/disubmit] untuk [tujuan akademik]. Prioritaskan integritas akademik di atas optimasi performa model.
Catatan: Jika ada bagian kode yang tidak dapat diakses atau unclear, minta clarification sebelum memberikan final assessment.