आजकल हर काम में AI (Artificial Intelligence), ML (Machine Learning) जैसे टूल हमारी मदद में आ रहे है और इसी के कारण कंप्यूटर साइंस के क्षैत्र में Big डाटा का नाम भी छाया हुआ है।
हालांकि, कुछ लोगों को अभी भी नही पता है कि बिग डेटा क्या है तो यह लेख उनके लिए ही है। आज हम इस आर्टिकल में बताएंगे की बिग डाटा असलियत में आखिर है क्या?
Big Data क्या है? (What is Big Data in Hindi)
Big Data यानि बड़ा डाटा इसका अर्थ है कि बहुत ज्यादा मात्रा में डेटा। हम कौन से डाटा की बात कर रहे है, आइए इसे एक उदाहरण से समझते हैं: अगर आप चार-पांच घंटे के facebook या twitter या अन्य सोशल मीडिया प्लेटफार्म का इस्तेमाल करते है।
आपको कोई सोशल मीडिया की पोस्ट पसंद आई तो उसके save करते है जो पोस्ट अपने Save की वह डाटा के रूप में फेसबुक या अन्य सॉफ्टवेयर कंपनियों के server में save हो जाती है। इसी डाटा को हम बिग डाटा कह सकते हैं। इस डाटा का उपयोग product marketing और behavior analysis के लिए किया जाता है।
बिग डेटा के प्रकार क्या हैं? (Types of Big Data in Hindi)
BIG DATA को अलग-अलग प्रकारों में बाँटा गया है। बिग डाटा को मुख्य रूप से तीन प्रकार के डाटा में विभक्त किया गया है।
1. Structured Data (स्ट्रक्चर्ड डेटा)
ऐसा कोई भी डाटा जिससे एक जगह स्टोर किया जा सके साथ ही एक्सेस और प्रोसेस दोनों किया जा सके उसे Structured Data कहा जाता है। स्ट्रक्चर्ड डेटा को रिलेशनल डेटा भी कहा जाता है।
क्या आप जानते है BIG DATA को बिग डाटा क्यों कहा जाता है ?
यह वास्तव में इतना बड़ा डाटा है जिसे store करने और process करना एक जटिल समस्या है।
Structured Data वह जानकारी है जो एक निश्चित तरीके से व्यवस्थित होती है, जैसे संख्याएं या दिनांक। अगर हम किसी स्टोर की वेबसाइट पर उसकी जानकारी को देखते हैं, जैसे कि चीज़ों की कीमत कितनी है या उन्हें कब बेचा गया, तो उसके भी स्ट्रक्चर्ड डेटा कहा जा सकता है।
आइए एक और example से इससे समझने की कोशिश करते है :-
Position | student name |
1st | Preet |
3rd | Aarti |
2nd | Rahul |
2. Unstructured Data
Unstructured data का मतलब है जिस डाटा को कम्पनी ने raw material के रूप में अपने पास रखा हुआ है उस डाटा का कोई classified structure तैयार नहीं किया गया है व इस data का store होने का कोई format नही होता है। दुनिया का लगभग 80% data unstructured data है।
टेक्स्ट फ़ाइलें, मीडिया, वेबसाइट, मोबाइल डेटा, उपग्रह(satellite) चित्र और ईमेल Unstructured Data के examples हैं।
3. Semistructured Data
semistructured data वह डाटा है जो की न data structure है न ही unstructured है इस प्रकार के data को semi-structure data कहा जाता है।
Semi structured data को हम structured form में देख तो सकते हैं किन्तु उसे define करना मुश्किल हैं।
XML में represent file, DBMS. semistructured data इसके उदाहरण है।
Big Data के चार Vs क्या है?
कुछ विशेषताएं होती हैं जिसे big data को define करना आसान हो जाता है, इन विशेषताओं को Four Vs का नाम दिया गया है. Four Vs यानि – Volume, Variety, Veracity और Velocity.
Volume
“Volume” का अर्थ उसके आकार में निहित होता है। इसका आकार आमतौर पर बहुत बड़ी मात्रा में होता है, जो अक्सर टेराबाइट (TB) और पेटाबाइट (PB) से भी अधिक होता है।
दूसरे शब्दों में कहें तो, “बिग डेटा” में डेटा सेट इतने बड़े होते हैं कि उन्हें नियमित लैपटॉप या कंप्यूटर से प्रोसेस नहीं किया जा सकता।
एक उच्च मात्रा वाले डेटा का उदाहरण है – भारत में एक दिन में फेसबुक पर अपलोड होने वाला डेटा।
डेटा हर साल 50 प्रतिशत की दर से बढ़ता है और किसी को यह नहीं पता कि नए डेटा कितना उत्पन्न होगा, लेकिन इकट्ठा की जा रही जानकारी विशाल होगी।
Variety
Variety (विविधता) बिग डेटा को वास्तव में बड़ा बनाती है। बिग डेटा जो है वह अलग-अलग sources से लिया जाता है और यह data सामान्यतया तीन प्रकार का होता है:- structured, semi-structured और Unstructured data।
Data की variety के लिए हमें अलग processing capabilities और विशेष algorithms की आवश्यकता होती है।
Variety का उदाहरण:- एक city में अलग अलग locations से ली जाने वाली CCTV कैमरा की Recording।
Veracity
Veracity का तात्पर्य data के trustworthiness से है data सही और accurate होगा या नहीं यह इस बात पर निर्भर करेगा की डाटा कहा से और कैसे कलेक्ट किया गया है
Velocity
Velocity का अर्थ है डेटा जनरेट होने की गति से है इसमें यह मायने रखता है कि कंपनी कितनी तेजी से इस डेटा का विश्लेषण करती है और इससे उपयोग करती है।
बिग डाटा के फायदे क्या हैं?
आप Big Data का उपयोग करके लोगों की preferences और पसंद-नापसंद को जान सकते हैं। लोगों की आवश्यकताओं को समझ सकते हैं। इसके माध्यम से आप अपने उत्पादों की लागत में कमी ला सकते हैं। यह आपको मार्केट में चल रहे ट्रेंड्स और नवाचारों को समझने में मदद करेगा।
FAQ: Big Data से सम्बन्धित सवाल – जवाब
बिग डेटा कैसे सीखे?
बिग डेटा एनालिटिक्स में बीटेक 4 साल का कोर्स है जिसे आप स्कूल खत्म करने के बाद पढ़ सकते हैं। IIT जैसे कुछ अच्छे कॉलेज इस कोर्स को करवाते है हैं, लेकिन आपको इसमें प्रवेश लेने के लिए JEE नाम की एक परीक्षा देनी होगी।
बिग डेटा करियर क्यों है?
एक बिग डेटा इंजीनियर वह होता है जो कंपनियों को बहुत सारी जानकारी प्रबंधित करने में मदद करता है। वे यह सुनिश्चित करने के लिए काम करते हैं कि सब कुछ smoothly चले और आने वाली किसी भी समस्या को ठीक करें। यह एक एक प्रसिद्ध और अधिक मांग वाला करियर विकल्प है।