Sujarwo Suryaputra
linkedin

Consultant & Trainer

(Laboratory Management, Chemicals Risk Management,
GHS and Related Topics)

 

Dalam evaluasi hasil uji banding antar laboratorium berbasis nilai konsensus, pemilihan metode statistik yang tepat sangat penting untuk memastikan hasil yang akurat, adil dan dapat dipertanggung jawabkan secara ilmiah. Penyelenggara uji profisiensi menggunakan teknik statistik yang robust terhadap outlier. Berbagai teknik semacam itu telah diusulkan dalam literatur statistik, dan banyak di antaranya telah berhasil diterapkan dalam kegiatan uji profisiensi. Sebagian besar teknik statistik yang robust juga memberikan ketahanan terhadap distribusi outlier yang tidak simetris.

Panduan terkait penggunaan statistik pengolahan data berbasis nilai konsensus terdapat dalam Annex C pada ISO 13528:2022 yang secara khusus membahas metode-metode statistik robust untuk estimasi penentuan nilai evaluasi (assigned value) dan estimasi simpangan baku dalam konteks uji profisiensi. Annex C menjelaskan pendekatan-pendekatan pengolahan data seperti Median with Median Absolute Deviation (MADe), Normalized Interquartile Range (nIQR), Algoritma A, Algoritma S serta Q method and Hampel estimator. Annex C juga memberikan panduan dalam memilih metode berdasarkan jumlah peserta, karakteristik data dan tujuan uji profisiensi, sehingga penyelenggara dapat melakukan evaluasi yang objektif dan ilmiah.

Dalam tulisan ini, penulis melakukan perbandingan terhadap 3 (tiga) metode statistik yang tercantum dalam Annex C pada ISO 13528:2022, yang digunakan untuk mengolah data berbasis nilai konsensus dalam kegiatan uji profisiensi. Ketiga metode tersebut meliputi: (1) Median with MADe, (2) Algoritma A with iterated scale, dan (3) Q method and Hampel estimator (selanjutnya disebut sebagai Q/Hampel method). Adapun sebagai studi kasus, data yang digunakan merupakan hasil pengujian kadar sulfat (SO₄²⁻) dalam sampel air minum yang diperoleh dari suatu batch pelaksanaan uji profisiensi. Data ini diolah menggunakan ketiga pendekatan metode statistik tersebut untuk mengevaluasi karakteristik masing-masing metode dalam menetapkan nilai evaluasi (assigned value), estimasi simpangan baku dan menentukan rentang toleransi (range of tolerance) pada |Z| ≤ 2,00.

Evaluasi pola distribusi data hasil uji profisiensi dilakukan menggunakan perangkat lunak Distribution Analyzer dari Taylor Enterprises. Evaluasi distribusi data hasil uji profisiensi tersebut menunjukkan kesesuaian dengan distribusi normal pada tingkat signifikansi 5% (tingkat kepercayaan 95%), dan membentuk pola kurva Gaussian sebagaimana ditunjukkan pada visualisasi berikut:

Hasil pengolahan data menggunakan ketiga metode statistik yang disebutkan di atas, disajikan dalam bentuk visualisasi dalam Lampiran 1 untuk menggambarkan perbedaan karakteristik masing-masing pendekatan. Uraian berikut menyajikan pembahasan atas hasil perbandingan tersebut:

Dengan menggunakan Median with MADe, diperoleh nilai assigned value sebesar 20,38 mg/l dengan estimasi simpangan baku 1,68 mg/l. Dengan demikian, rentang toleransi ditetapkan pada 17,02 hingga 23,73 mg/l (berdasarkan kriteria |Z| ≤ 2,00). Rentang toleransi ini merupakan yang paling sempit di antara ketiga metode, menandakan bahwa pendekatan ini sangat ketat atau konservatif. Dengan kata lain, metode ini sangat efektif dalam mendeteksi penyimpangan kecil sekalipun dari hasil pengujian yang diharapkan, menjadikannya sesuai untuk keperluan pengawasan mutu eksternal yang ketat.

Metode kedua yang digunakan adalah Algoritma A with iterated scale, yang menghasilkan assigned value sebesar 20,58 mg/l dan simpangan baku sebesar 1,78 mg/l. Berdasarkan nilai tersebut, rentang toleransi ditetapkan antara 17,02 hingga 24,14 mg/l. Meskipun masih tergolong ketat, Algoritma A memberikan sedikit kelonggaran dibandingkan dengan Median with MADe. Metode ini lebih sesuai diterapkan pada data yang cenderung mengikuti distribusi normal, namun tetap mengakomodasi adanya deviasi kecil atau nilai ekstrem dalam jumlah terbatas.

Sementara itu, pengolahan data menggunakan Q/Hampel method disajikan pada grafik paling kanan dalam Lampiran 1. Hasil evaluasi dengan metode ini menunjukkan assigned value sebesar 20,69 mg/l dengan simpangan baku sebesar 2,08 ml, dan rentang toleransi diperluas menjadi 16,53 hingga 24,85 mg/l. Ini menjadikan Q/Hampel method sebagai metode yang paling toleran terhadap keragaman data dan outlier.

Hasil evaluasi terhadap ketiga metode menunjukkan bahwa mayoritas laboratorium peserta mampu menghasilkan nilai pengujian yang berada dalam rentang toleransi yang ditetapkan oleh masing-masing metode. Namun demikian, terdapat satu laboratorium, yaitu LAB-16-16B3, yang secara konsisten menunjukkan hasil ‘tidak memuaskan’ berdasarkan metode Median with MADe dan Algoritma A. Hal ini mengindikasikan adanya potensi outlier positif yang perlu dianalisis lebih lanjut, baik dari aspek teknis pelaksanaan pengujian maupun pengendalian mutu internal laboratorium tersebut.

Secara umum, evaluasi ini memberikan gambaran yang jelas mengenai karakteristik masing-masing metode. Metode Median with MADe menunjukkan performa paling ketat dan cocok digunakan untuk evaluasi kinerja peserta dengan toleransi kesalahan yang rendah. Q/Hampel method menawarkan fleksibilitas yang lebih tinggi, sehingga sesuai untuk evaluasi kinerja peserta dengan tingkat heterogenitas data yang signifikan. Sementara itu, Algorithm A with iterated scale berada di antara kedua pendekatan tersebut, menjadikannya pilihan yang seimbang antara ketelitian dan toleransi terhadap variasi untuk evaluasi kinerja peserta uji profisiensi.

Apabila diasosiasikan dengan Teorema Horwitz, estimasi simpangan baku yang diperoleh dari pengolahan data menggunakan ketiga metode tersebut masih berada di bawah nilai simpangan baku Horwitz (SD-Horwitz). Hal ini menunjukkan bahwa tingkat dispersi data yang dihasilkan masing-masing metode masih berada dalam batas yang dapat diterima secara teoritis untuk analisis kimia pada konsentrasi yang bersesuaian. Dengan demikian, ketiga metode statistik—Median with MADe, Algoritma A with iterated scale, serta Q/Hampel—masih layak dan valid untuk digunakan dalam pengolahan data uji profisiensi berbasis nilai konsensus. Pemilihan metode dapat disesuaikan dengan karakteristik data serta kebutuhan tingkat sensitivitas dalam evaluasi hasil antar laboratorium.

Dengan demikian, pemilihan metode pengolahan data sebaiknya mempertimbangkan konteks teknis, tujuan evaluasi, serta karakteristik distribusi data. Ketiga metode yang diperbandingkan dalam tulisan ini dapat digunakan secara sahih dan ilmiah, dan masing-masing memberikan kontribusi penting dalam meningkatkan keandalan serta integritas penyelenggaraan uji profisiensi melalui uji banding antar laboratorium. (Published on May 5th, 2025 by admin)

Lampiran 1. Visualisasi Perbandingan Pengolahan Data