मागील लेखामध्ये बिग डेटा म्हणजे काय हे पहिले. बिग डेटा हा नुसता बिग नाही आहे तर त्या डेटामध्ये विविध प्रकारची माहिती आहे आणि प्रचंड प्रमाणात माहिती आहे. मग या बिग डेटा असे जे संबोधतो त्याचा नक्कीचा स्रोत काय? किंवा हा डेटा निर्माण कुठून होतो? तर तसं पाहिलं तर विविध कंपन्यांच्या मार्फत जो डेटा निर्माण होतो तो, सरकारी माहिती, आपण ऑनलाइन ज्या काही गोष्टी शोधतो, म्हणजे सर्च करतो तो, सोशल मीडियामधून प्रचंड प्रमाणात डेटा निर्माण होतो तो, या व्यतिरिक्त विशिष्ट कार्यक्षेत्रामधून म्हणजे अॅस्ट्रॉनॉमिकल डेटा आणि रियल टाईम डेटामधून होणारा डेटा हे बिग डेटाचे स्रोत आहेत.
आपण जर सर्च इंजिन डेटाचा विचार केला तर आज अनेक प्रकारची सर्च इंजिन्स उपलब्ध आहेत. त्यात गुगल हे सर्च इंजिन प्रसिद्ध आहे. अगदी साधं जरी काही शोधायचं म्हटलं तरी आपण गुगल ओपन करतो किंवा कोणाला सांगायचं म्हटलं तर ‘गुगल कर’ असं म्हणतो. म्हणजे शोधायला गुगलचा वापर होतो आहे. साधारण जर गुगलचा सर्च इंजिनचा डेटा काढला तर 2019 साली 35 ते 36 कोटी सर्च झाले. हाच आकडा 2021 आली दुप्पट झाला होता. म्हणजे सर्च इंजिन किती प्रकारे हा डेटा (आपण विचारलेले प्रश्न किंवा एखादा विशिष्ट शब्द -किवर्ड) निर्माण करतो हे लक्षात येईल.
रियल टाईम डेटा म्हणजे प्रत्येक क्षणाला वेगवेगळ्या सेन्सर्स सोडून निर्माण होणारा डेटा. सॅटेलाइटद्वारे पास होणाऱ्या हजारो लहरींनी निर्माण होतो तो डेटा रियल टाईम म्हणून लक्षात घेतो. दररोज आपण प्रचंड डेटा निर्माण करत असतो.
म्हणजे आपण कुठेही गेलो तर आपले लोकेशन सुरू असते, आपल्याला सीसीटीव्हीचे कॅमेरे पकडत असतात, आपण फोटो कॅप्चर करत असतो, व्हिडिओ तयार करत असतो, आपलं फिटनेस वॉच आपला डेटा निर्माण करत असतो, खरेदी केली किंवा तिकीटं काढली तर तो सगळा डेटा गोळा होत असतो. इन्शुरन्स, बँका, एटीएममधून पैसे काढणे किंवा व्हॉट्सअप चॅट्स, व्हिडिओ, ऑडिओ पाठवणे, सोशल मीडियावर पोस्ट करणे, हा सगळा डेटा निर्माण होण्याची कारणे आहेत. अशा जगातल्या कोट्यावधी लोकांविषयीची सर्व माहिती, जी निर्माण होते ती प्रचंडच आहे, हा सगळा एक बिग डेटाचाच भाग आहे.
हा जो बिग डेटा आहे याचे अनेक उपयोग आणि फायदे आहेत. स्टॅटिस्टिक्स डेटा किंवा डेटा अॅनॅलिटीक्स वापरून काही निष्कर्ष काढले जातात. आता वेगवेगळ्या क्षेत्रामध्ये याचा उपयोग व्हायला लागला आहे. म्हणजे कायदा, व्यापार, फायनान्स, जाहिरात, उत्पादन, आरोग्यवस्था, शिक्षण, संशोधन अशी अनेक क्षेत्रे आहेत. फक्त हे करत असताना या डेटामधले वेगळे पॅटर्न सोडून त्याचे विश्लेषण करून निष्कर्ष काढायला लागतात.
उदाहरणार्थ एखाद्या भागामध्ये भूकंपाचं प्रमाण जास्त असेल तर मागील झालेल्या भूकंपाचे रिस्टर स्केल किती याचा डेटा गोळा करून त्याचं अॅनॅलिसिस करून भविष्यामध्ये कोणत्या वेळी किंवा किती रिस्टर स्केलचे भूकंप होऊ शकतात हे सांगता येणे शक्य आहे.
युएस जिऑलॉजिकल सर्वे ही संस्था याविषयी संशोधनात अग्रेसर आहे. त्यांनी उत्तर कॅलिफॉर्नियामध्ये पुढच्या काही वर्षात किती रिस्टर स्केलचा भूकंप होण्याची शक्यता आहे हे भाकीत केलं होतं. याचा फायदा नैसर्गिक आपत्तीपासून वाचण्यासाठी निश्चित झाला.
बिग डेटाचा वापर करून आपली विक्री वाढवता येते हे न्यूयॉर्क पोस्ट या मीडिया हाऊसने दाखवून दिले. लोक जे वाचतात त्यावर प्रतिक्रिया देतात. म्हणजेच वाचकांचा पत्रव्यवहार. त्यातल्या प्रतिक्रिया या सर्व गोळा करून त्याच्यावरून अंदाज बांधून लोकांना काय आवडते, काय आवडत नाही, लोक कशाप्रकारे टीका करतात किंवा त्याला प्रतिक्रिया देतात, या सर्वांचा अभ्यास करून कुठले लेख छापायचे, कुठले छापायचे नाही किंवा कशा पद्धतीने हेडिंग देऊन छापायचे हे यातील डेटामुळे ठरवता येते. यात जाहिरातींचा सुद्धा मोठा वाटा आहे. कुठल्या जाहिराती कधी प्रसिद्ध कराव्यात, कशा पद्धतीने प्रसिद्ध कराव्यात, याचा फायदा न्यूयॉर्क पोस्टला झाला व त्यांची व्यवसायामध्ये 100 टक्के पेक्षा जास्त वाढ झाली.
बिग बेटामुळे अतिशय वेगाने वाढणारी आणखीन एक शाखा म्हणजे डेटा सायन्स. आज या डेटा सायंटिस्टना त्यांचे प्राविण्य पाहून जगभरात प्रचंड प्रमाणात मागणी आहे. म्हणून तेवढा पगार देण्याची कंपनीची तयारी देखील आहे. एक काळ असा होता, की इंजिनियरिंग आणि मेडिकलकडे जाण्याचा कल जास्त होता. आता मात्र तसे होत नाही. आता आर्टिफिशियल इंटेलिजन्स आणि डेटा सायन्सची भर पडली असून विद्यार्थी या विषयाकडे करिअर म्हणून पाहतात. डेटा सायन्सला जोडून डेटा इंजिनिअरिंग हाही भाग आहे.
अर्थात दोघांमध्ये फरक आहे. डेटा इंजीनियरिंग म्हणजे डेटा कशा पद्धतीने स्टोर करणे या विषयीचे काम यामध्ये होते. डेटाबेस सिस्टीम, डेटा वेअर हाऊसिंग, त्यांची सिक्युरिटी, रिस्पॉन्स टाईम अशा अनेक गोष्टी येतात.
याचे एक उदाहरण म्हणजे रिचर्ड फेअरबँक आणि मायजेल मॉरिस या दोघांनी आपल्याकडे असलेल्या डेटाचे विश्लेषण कशा पद्धतीने करता येईल व त्यातून काही निष्कर्ष काढता येतील का? यावर विचार करायला सुरुवात केली. त्यांनी बँकेचा डेटा गोळा करायला घेतला. यामध्ये वेगवेगळ्या क्रेडिट कार्ड्स, त्यांचे नियम व चार्जेस, त्याची किंमत याविषयी डेटा गोळा करून काही निष्कर्ष काढले. हे घेऊन ते अनेक बँका, वित्तीय संस्थांकडे गेले. पण त्यांचं कोण ऐकून घेण्याच्या मनस्थितीत नव्हतं. मात्र सिग्नेट नावाच्या एका बँकेने त्यांना त्यांच्या या प्रस्तावाला मान्यता दिली. या प्रस्तावामध्ये क्रेडिट कार्ड त्याच्या वापरानुसार स्कीम तयार केल्या होत्या तसेच त्याच्या ऑफर्सही त्याच्या वापरानुसार होत्या. त्याच्या टर्म्स आणि कंडीशन वेगवेगळया होत्या. ही जी काही स्कीम आहे ही थोडीशी धाडसी होती व सिग्नेट या बँकेने ती अमलात आणली. पण पहिल्या काही वर्षांमध्ये असं लक्षात आलं की ह्या स्कीममुळे बँक तोट्यात जात आहे. हे सर्व होत असताना वेगवेगळ्या गुंतवणूकदार तसेच तज्ञांनी त्यांच्यावर टीका केली. पण दुसऱ्या बाजूला सिग्नेटकडे प्रचंड प्रमाणात डेटा गोळा होत होता. हा डेटा जसा गोळा होत गेला तसं त्याचं अॅनॅलिसिस होत गेलं आणि तोट्यात चालणारी ही बँक हळूहळू नफ्याकडे चालू लागली. त्यांना नंतर इतका नफा मिळाला की त्यांचे ही क्रेडिट कार्डचे युनिट मूळ बँकेकडून वेगळे करून फेअरबॉक्स या नावाने नव्याने स्थापन करण्यात आले.
आज या कंपनीचं नाव कॅपिटल वन प्रचलित आहे. लोकांना हे माहिती आहे पण सिग्नेट बँकेविषयी लोकांना माहिती नाही. थोडक्यात डेटा किती मौल्यवान आहे आणि त्याचा उपयोग कशा पद्धतीने करून घेता येतो हे आता लोकांच्या लक्षात आले. त्यामुळे नेटफ्लिक्स, अॅमेझॉन, गुगलसारख्या मोठ्या कंपन्या आज लोकांचा डेटा गोळा करून त्याचं अॅनॅलिसिस करून लोकांना काय हवं, काय नको, लोकांची आवड काय याचा विचार करून आपला कारभार चालवत आहेत. त्याच्यातून प्रचंड प्रमाणात नफाही मिळवत आहेत.
एकूणच येणाऱ्या काळामध्ये बिग डेटा, डेटा सायन्स डेटा इंजिनीअरिंग याला प्रचंड मागणी असणार आहे. या क्षेत्रामध्ये काम करणाऱ्या लोकांना विविध प्रोजेक्टवर काम करण्याची संधी मिळेल आणि संधीच नाही तर पैसा आणि करियर दोन्हीही उत्तम होणार आहे. आज संगणक पदवी घेणाऱ्या विद्यार्थ्यांसाठी हे क्षेत्र म्हणजे सोन्याची खाण आहे यामध्ये ‘नेम आणि फेम’ दोन्ही असणार आहे.
-विनायक राजाध्यक्ष
Previous Articleसमान नागरी कायद्यावर प्रक्रिया सुरु
Next Article अपभ्रंशाने कलंकित झालेली गोव्यातील स्थळनामे
Tarun Bharat Portal
Parasharam Patil is a versatile content writer, scriptwriter, and content producer at Tarun Bharat Media. Specializes in editorial news, local news entertainment, and political content. His captivating storytelling and deep industry knowledge make him an expert in crafting engaging narratives.








