Perbedaan Data Analyst dan Data Scientist
A. Data Analyst
Data Analyst atau juga kadang disebut Business Data Analyst adalah profesi yang mengamati data, mencari pola dari data tersebut yang menunjukkan kondisi dari suatu perusahaan.
Data Analyst memiliki kemampuan mendalam di bidang bisnis yang digeluti oleh perusahaan tersebut. Dengan kemampuannya tersebut maka pola dari data yang diterima oleh aplikasi seperti Business Intelligence (BI) bisa di visualisasikan. Pola-pola data ini pada umumnya bersifat umum yang banyak dialami oleh perusahaan yang sejenis.
Semua aplikasi Business Intelligence, Data Mining dan Data Warehouse membutuhkan seorang Data Analyst untuk menerjemahkan data. Data tersebut perlu di terjemahkan ke dalam kalimat yang dipahami oleh level top management (visualisasi / presentasi/report) untuk pengambilan kebijakan dan mengarahkan perusahaan. Sehingga diketahui misalnya apakah penjualan naik / turun berapa persen dan sebagainya tergantung dari jenis data yang dihasilkan.
Untuk dapat membangun laporan, seorang Data Analyst harus menguasai query untuk mengetahui apakah laporan mengambil data yg benar dan laporan memiliki format yg benar untuk mempermudah pemahaman.Pekerjaan seorangĀ Data Analyst dibagi dalam tiga tahapan. Tahap pertama adalah mempersiapkan data, tahap kedua membuat hasil laporan data (visualisasi), dan tahap ketiga adalah mengintepretasikan hasil pengolahan data.
B. Data Scientist
Berbeda dengan Data Analyst yang hanya menganalisis dan mengeksplorasi data yang terstruktur atau relational database dan semi terstruktur seorang Data Scientist juga harus mampu mengeksplorasi data yang tidak terstruktur seperti text, emoticon, image ataupun hal-hal yang berhubungan dengan media social seperti facebook, twitter dll,
Data Scientist dan Data Analyst seringkali disamakan, Data Scientist tidak hanya menganalisis data tapi juga melakukan eksperimen untuk membuktikannya. Sementara Data Analyst tugasnya hanya menganalisis data.
Data Scientist diperlukan untuk menganalisa data dalam jumlah banyak yang terdapat dalam sistem Big Data. Seorang Data Scientist harus memiliki kemampuan di tiga bidang. Pertama adalah kemampuan tentang Business Logic di bidang yang digeluti oleh perusahaan yang sedang dia tangani, seperti halnya Data Analyst. Kedua adalah kemampuan statistika dan matematika yang cukup untuk mengetahui pola-pola data berikut dengan algoritmanya. Ketiga adalah kemampuan menggunakan tools dari sistem Big Data yang membantunya dalam mengolah dan menganalisis data seperti misalnya aplikasi Machine Learning Apache Mahout dan Apache Spark (source).
Untuk menjadi seorang Data Scientist, kita harus mempunyai pengetahuan mengenai database. Data Scientist juga harus memahami algorithm dan machine learning diantaranya: Decision Tree, K-Means, Neural Network, Linear Regression, Logistic Regression, FP-Growth, Association Rules dll juga harus menguasai ilmu statistik serta memahami tools atau pemograman untuk statistik seperti SPSS, Stata, SAS, Pyhton ataupun R, dari ketiga tools atau bahasa pemograman tersebut cukup kita menguasai salah satunya saja misalkan menguasai bahasa pemograman R saja, terlepas dari kelebihan dan kekurangannya dengan R selain open source R juga merupakan bahasa pemograman yang dikhusukan untuk keperluan analysis statistik serta R juga dapat dihubungkan dengan Spark framework apabila kita akan mengeksplorasi Bigdata atau massive datasets.
Data Scientist sangatlah diperlukan didalam setiap bisnis yang bergerak baik jasa ataupun produk, karena Data Scientist itu dapat memberi insight yang baru dari situasi belum disadari ataupun telah disadari dan baik bersifat strategis ataupun informasi dari fenomena yang sedang terjadi dan akan terjadi dengan menjadikan data itu sebagai informasi yang berguna.