Data Besar dan banyak lagi. Basis data. Apa bedanya?

Teknologi berkembang dengan cepat, dan para pemimpin teknologi akan segera melihat bahwa semua kelas teknologi sarjana semakin tua. Jika Anda adalah chief technology officer di sebuah perusahaan besar (CTO), Anda tidak punya banyak waktu untuk mempelajari teknologi baru karena Anda sibuk dengan pemadam kebakaran dan terlihat bagus di rapat dewan Anda berikutnya. kamu akan yakin. di depan semua orang yang mencoba melakukan hal yang sama. Pada waktunya, Anda mungkin bertanya pada diri sendiri: apa perbedaan antara big data dan database?

Setiap spesialis teknologi akan tahu apa databasenya. Ini hanyalah sebuah database yang tumbuh seiring waktu dan mempelajari hal-hal menarik melalui jajak pendapat. Ada konsep yang disebut basis data, dan inilah yang tersirat dari namanya. Jadi mari kita tidak masuk ke percakapan "Kimball dan Inman" dan katakan saja itu.

Repositori adalah serangkaian database yang tidak kompatibel dalam suatu organisasi yang dapat dihubungkan ke kunci publik. Misalnya, kami dapat mengaitkan catatan dalam banyak basis data menggunakan bidang unik yang disebut CUSTOMER_ID. Database di bagian berbeda yang berisi catatan yang ingin kami tautkan menggunakan CUSTOMER_ID:

Dengan menggunakan CUSTOMER_ID, Anda dapat dengan mudah mencetak daftar semua faktur yang belum dibayar di halaman yang sama dan daftar 10 permintaan layanan terbaru yang mengarahkan penjual ke pertemuan penjualan dengannya. Tentu saja, kami menggunakan Salesforce untuk semua ini hari ini, tetapi contoh sederhana ini memberikan wawasan tentang seberapa berguna menghubungkan sumber data yang berbeda. Basis data, kecuali ketika mereka melanjutkan dan menggunakan data besar untuk membuat keputusan yang sangat informatif. Saat membangun database, Anda biasanya tahu pertanyaan apa yang mungkin ingin Anda jawab karena beberapa orang tingkat C meminta Anda untuk mengukur kinerja Anda (KPI). Anda tidak dapat membangun basis data untuk membuatnya, karena ini adalah bisnis yang sangat mahal. Sekarang mari kita bicara tentang "data besar" dan gudang data.

Pertama, kita perlu mendefinisikan istilah "data besar", yang mendefinisikan sendiri. Dalam dua tahun terakhir, Anda sering mendengar statistik tentang 98% pembuatan data. Ini adalah data besar. Dimungkinkan untuk mengumpulkan semua database luar biasa yang saat ini sedang dibuat (ingat pencarian data?). Di dunia teknologi tinggi saat ini, kita dapat memahami apa yang tidak ada. Donald Rumsfeld menyebut mereka "tidak dikenal tidak dikenal" dan kita tahu apa yang tidak kita ketahui. Dalam dunia psikologi, gagasan ini dikenal sebagai cermin Johari. Tahukah Anda bahwa wiraniaga tidak menyadari bahwa kehadiran mereka memaksa semua orang di sekitar mereka untuk menginginkan Peter Pan turun dari lantai tertinggi? Fakta bahwa orang itu tidak tahu betapa menjengkelkannya mereka dan mengapa orang-orang di sekitar mereka tidak bisa mengacuhkannya adalah "tidak diketahui," karena tidak ada yang tahu berapa banyak aktivitas penjualan Rob. , gemuk, tusukan berbahaya. Pokoknya, teruskan.

Diposting di 7wData.be.