Data Scientist v Data Engineer, apa bedanya?

Spesialis data dan insinyur data mungkin jabatan pekerjaan baru, tetapi peran pekerjaan utama telah ada untuk sementara waktu. Secara tradisional, siapa pun yang menganalisis data disebut "analis data" dan menjadi "Pengembang Bisnis Intelijen (BI)", yang menciptakan platform backend untuk mendukung analisis data.

Dengan munculnya data besar, data baru telah muncul di perusahaan dan pusat penelitian - ilmuwan data dan insinyur data.

Berikut ini adalah ikhtisar singkat tentang peran Analis Data, Programmer BI, Spesialis Data dan Insinyur Data.

Analis Data

Analis data adalah para profesional berpengalaman dengan kemampuan untuk meminta dan memproses data dalam organisasi mereka, untuk melaporkan, merangkum, dan memvisualisasikan data. Mereka tahu cara menggunakan alat dan teknik yang ada untuk menyelesaikan masalah, dan membantu orang di seluruh perusahaan memahami pertanyaan spesifik menggunakan laporan dan jadwal ad hoc.

Namun, mereka tidak diharapkan berurusan dengan analitik data besar, dan biasanya tidak diharapkan memiliki data matematika atau penelitian untuk mengembangkan algoritma baru untuk masalah tertentu.

Keterampilan dan alat: Analis data perlu memiliki pengetahuan dasar keterampilan dasar: statistik, pengumpulan data, visualisasi data, pencarian data, Microsoft Excel, SPSS, SPSS Modeler, SAS, SAS Miner, SQL, Microsoft Access, Tableau, SSAS.

Pengembang Kecerdasan Bisnis

Business Intelligence Manufacturers adalah profesional data yang memiliki hubungan lebih dekat dengan pemangku kepentingan internal untuk memahami kebutuhan pelaporan dan kemudian mengumpulkan persyaratan, membuat solusi pelaporan BI dan perusahaan. Mereka harus mendesain, mengembangkan dan memelihara database, paket ETL, kubus, dasbor, dan laporan analisis baru dan yang sudah ada.

Selain itu, mereka bekerja dengan basis data lintas dan multidimensi dan harus memiliki keterampilan yang luas dalam mengembangkan SQL untuk mengintegrasikan data dari berbagai sumber. Mereka menggunakan semua keterampilan ini untuk memenuhi kebutuhan swalayan perusahaan. Biasanya Produser BI tidak diharapkan untuk melakukan analisis data.

Keterampilan dan alat: ETL, pemrosesan laporan, OLAP, kubus, kecerdasan web, desain objek bisnis, Tableau, alat dasbor, SQL, SSAS, SSIS.

Insinyur Informasi

Insinyur data adalah spesialis data yang menyiapkan infrastruktur "data besar" yang dianalisis oleh spesialis data. Mereka adalah insinyur perangkat lunak yang merancang, membangun, mengintegrasikan, dan mengelola data besar dari berbagai sumber. Kemudian mereka menulis pertanyaan kompleks, memastikan mereka mudah diakses, bekerja dengan lancar, dan tujuan mereka adalah untuk mengoptimalkan kinerja ekosistem data besar perusahaan.

Mereka juga dapat menjalankan beberapa program ETL (Extract, Transform and Load) pada dataset besar dan membuat basis data besar yang dapat digunakan oleh para ilmuwan data untuk pelaporan atau analisis. . Juga, karena Insinyur Data lebih fokus pada desain dan arsitektur, mereka biasanya tidak berharap untuk mengetahui pembelajaran mesin atau analisis untuk data besar.

Keterampilan dan alat: Hadoop, MapReduce, Hive, Pig, MySQL, MongoDB, Cassandra, Aliran Data, NoSQL, SQL, Pemrograman.

Ilmuwan data

Data Scientist 21st Century Alchemist: Seseorang yang mengubah data mentah menjadi konsep yang disempurnakan. Ilmuwan data menggunakan pendekatan analitis untuk memecahkan masalah penting dalam statistik, pembelajaran mesin dan bisnis. Tugas utama mereka adalah membantu organisasi mengubah volume besar data besar menjadi wawasan yang berharga dan efektif.

Faktanya, ilmu data bukanlah arah yang sepenuhnya baru, tetapi dapat dilihat sebagai tingkat lanjut dari analisis data yang dikendalikan dan diotomatisasi oleh pembelajaran mesin dan ilmu komputer. Dengan kata lain, Ilmuwan Data memiliki keterampilan pemrograman yang kuat, algoritma baru, pemrosesan data besar, dan pengetahuan domain, selain analitik data, dibandingkan dengan "analis data". diharapkan.

Selain itu, Ilmuwan Data diharapkan untuk menginterpretasikan dan secara bebas berbagi temuan temuan mereka dengan cerita menarik tentang cara memvisualisasikannya, membuat aplikasi data, atau menyelesaikan masalah data (bisnis) mereka.

Keterampilan memecahkan masalah ilmuwan data membutuhkan pemahaman teknik analisis data tradisional dan baru untuk membangun model statistik atau mengidentifikasi pola dalam data. Contohnya termasuk membuat sistem rujukan, prediksi pasar saham, diagnosis berbasis pasien, atau menemukan transaksi palsu.

Data kadang-kadang dapat diberikan kepada para ilmuwan dengan data besar tanpa adanya masalah bisnis. Dalam hal ini, Peneliti Data yang ingin tahu diharapkan untuk mempelajari informasi, menemukan pertanyaan yang Anda butuhkan, dan memberikan temuan menarik! Ini sulit, karena para ahli analisis data yang kuat sangat bersemangat tentang analisis data, pengumpulan data, statistik, dan infrastruktur data besar. pasti punya banyak ilmu.

Mereka harus memiliki pengalaman bekerja dengan set data yang berbeda dari berbagai ukuran dan bentuk dan menggunakan algoritma mereka untuk data skala besar secara efektif dan efisien, yang biasanya berarti menyadari semua teknologi terbaru. Inilah sebabnya mengapa penting untuk mengetahui dasar-dasar ilmu dan pemrograman komputer, termasuk bahasa dan teknologi basis data (besar / kecil).

Keahlian dan alat: Python, R, Scala, Apache Spark, Hadoop, alat dan algoritma pencarian data, pembelajaran mesin, statistik.

MUORO - Data dan Analisis Genius muoro.io