Data yang Kotor

Ada artikel lain yang menarik dari HBR edisi Desember 2013, yaitu mengenai kebersihan data πŸ˜€
Ternyata selain kebersihan jiwa dan raga yang mempengaruhi kesehatan, demikian ibaratnya, ada hal lain yaitu kebersihan data yang mempengaruhi kesehatan suatu organisasi.

Tidak perlu jauh-jauh mengambil contoh, di tempat saya bekerja pun masih banyak dijumpai permasalahan sejenis.
Ketika suatu sistem baru yang mensyaratkan adanya informasi tertentu dari data yang tersimpan dari sistem lainnya, ternyata dijumpai adanya data yang sangat kotor. Ada yang tidak lengkap, tidak sesuai dengan spesifikasi data, dan sebagainya. Bagaimana kita memperbaikinya ?
Kebanyakan yang terjadi adalah tim yang di hilir (yang bertanggung jawab mengelola sistem) yang mana adalah tim teknis/IT yang harus bersih-bersih data tersebut (data cleansing). Tapi apakah langkah workaround tersebut akan menyelesaikan masalah dari hulu ? Bisa dibilang “Tidak”.

Suatu insert dalam artikel ini bertajuk “How Data Get Dirty” mengilustrasikan mengenai industri minyak yang menghabiskan biaya untuk memanaskan minyak mentah yang kental di bawah tanah dengan uap agar lebih mudah untuk dipompa. Untuk mencari tahu seberapa steam yang dibutuhkan, teknisi lapangan menembakkan inframerah pada garis yang dibuat untuk membaca dan mengirimkan data pada engineer reservoir. Berdasar data tersebutlah engineer dapat menentukan jumlah steam yang dibutuhkan.
Akan tetapi di lapangan ternyata garis penanda tersebut dapat kotor sehingga mempengaruhi pembacaan menjadi sampai 20 derajat Celcius di bawah nilai yang sebenarnya. Garis yang kotor berarti data yang kotor. Hal ini adalah masalah yang besar pada suatu perusahaan minyak, teknisi lapangan tidak tahu seberapa tidak akurat pembacaannya atau hasil pembacaan yang salah oleh engineer menyebabkan penggunaan steam lebih dari yang diperlukan (hal ini tentu saja menyebabkan meningkatnya biaya operasional sampai dengan puluhan juta dolar).
Ilustrasi ini adalah masalah kualitas daya yang sering dijumpai dalam setiap industri. Dan solusinya pun sangat mudah : Pastikan pekerja yang terlibat dalam membuat data (data creation) mengerti masalahnya. Ketika manajer pada perusahaan minyak menginstruksikan pekerja untuk membersihkan garis penanda, masalah tersebut tidak terjadi lagi.

Dari ilustrasi di atas, dapat disimpulkan bahwa solusi dari data yang kotor bukanlah teknologi yang lebih baik atau lebih canggih. Akan tetapi komunikasi yang lebih baik antara pembuat data (orang yang terlibat dalam data creation) dengan pengguna data. Misalnya, memastikan semua orang mengerti prosedur yang benar ketika menginputkan data ke dalam sistem, data apa saja yang merupakan mandatory dan bagaimana formatnya. Kadang kala ketika hal tersebut sudah ditentukan pun, ada pihak lain yang tidak mengerti hal tersebut dan mendefinisikan format lainnya (seperti masalah yang diutarakan sebelumnya). Jadi hal paling tepat adalah memindahkan tanggung jawab dari tim teknis (IT) ke pihak yang bertanggung jawab pada data entry. Hal ini bukan berarti melempar tanggung jawab, tetapi demi mencapai adanya data yang bersih.

Seperti yang disampaikan dalam artikel : Daripada mengeluarkan usaha besar-besaran untuk membersihkan data kotor yang sekarang, perusahaan seharusnya berfokus dalam memperbaiki bagaimana data dibuat (data creation).

Semoga bermanfaat πŸ™‚

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s