5 छोटे-छोटे डेटा साइंस के सारांश

Hindi translation of “5 Bite-Sized Data Science Summaries

Cassie Kozyrkov
8 min readDec 16, 2020

--

हिंदी अनुवाद: आयुष मिश्रा, (Aayush Mishra)

मूल लेख: कैसी कॉज़ीरकोव (Cassie Kozyrkov)

संपादिका: प्रियंका वरगड़ीआ (Priyanka Vergadia)

टीम वर्क की भावना में, नेक्स्ट रिवाइंड वीडियो सीरीज़ ने कुछ लोगों से गूगल क्लाउड नेक्स्ट एसएफ 2018 से पांच पसंदीदा टॉक्स चुनने और केवल पांच मिनट में कैमरे के सामने उनके बारे में चर्चा करने को कहा।

5 पसंदीदा टॉक्स । 5 वीडियो सारांश। 5 मिनट या उससे कम।

क्या मैंने इसमें हिस्सा लिया? बिल्कुल! पहला कारण तो यह की मुझे उन चीजों को आपसे साझा करना बहुत पसंद है, जो मुझे खुशी देती हैं और दूसरा कारण यह की एक साल पहले मैं कैमरे के सामने बोलने में बहुत बुरी थी — मैं कभी भी इसकी बेरहम आंख को नहीं सह पाती थी, जो कभी झपकती ही नहीं, इसके लिए मुझे काफी अभ्यास करना पड़ा। अगर किस्मत का थोड़ा साथ मिले, तो मैं बाईं तरफ इशारा न करना सीख जाऊंगी जब मुझे दाएं तरफ इशारा करना चाहिए…

नाइस, कहां इशारा करना चाह रही हो।

5 पसंदीदा टॉक

यहां नेक्स्ट 2018 की मेरी 5 पसंदीदा टॉक हैं और जिन कारणों से मैंने उन्हें चुना है। मुझे पहली बार 300 से ज्यादा टॉक्स में से चुनने का मौका मिला, इसलिए ये विषय बेकार नहीं हैं! वे वास्तव में वही हैं जो मुझे लगता है कि डेटा साइंस के चाहने वाले सबसे अधिक पसंद करेंगे।

इसलिए, बिना किसी देरी के, यह रही मेरी सूची, सबसे कम निटी ग्रिटी से सबसे ज्यादा तक के क्रम में व्यवस्थित।

# 1 रियल बिजनेस पहले से ही मज़े और लाभ के लिए एआई का इस्तेमाल कर रहे हैं!

अगर आपने किसी के मन में इस तरह की भावना देखी है की, “ज़रूर, यह कुछ अद्भुत गणित है, लेकिन आप इसे प्रैक्टिकली इस्तेमाल नहीं कर सकते हैं।” ज़रा फिर से सोचिए! यह 2008 की बातें लगती हैं। पिछले एक दशक में बहुत कुछ बदल गया है। मुझे एक छोटा सा इतिहास का पाठ पढ़ाने की अनुमति दें जो वीडियो में नहीं है।

एआई आधी सदी से ऐसी चीज बनी हुई है जिसके बारे में बातें ज्यादा होती हैं और काम कम। आपको लगता होगा क्योंकि तब एल्गोरिदम नहीं थे, लेकिन डीप लर्निंग ( वही जिसे आप “एआई” कह रहे हैं ) 60 के दशक में जन्मा है

60 के दशक से कई एल्गोरिदम मौजूद थे, लेकिन उन दिनों के टूल्स इतने अच्छे नहीं थे और न ही प्रोसेसिंग पावर पर्याप्त मात्रा में थी।

वास्तविक कारण यह है कि टूल्स इतने अच्छे नहीं थे (सॉफ्टवेयर को प्रोटोटाइप रेडियो के जैसा मान सकते हैं, जिसे केवल ग्रेजुएशन के छात्र ही इस्तेमाल कर सकते थे, जिसे इन छात्रों ने ही चिपचिपी टेप और सपनों से बनाया था; जिसके पास सांस लेने से ही यह बिखर जाता थां।) और ना ही पर्याप्त मात्रा में प्रोसेसिंग पावर थी।

क्लाउड टेक्नोलॉजी के आने से पहले, आप तब तक प्रोटोटाइप नहीं बना सकते थे , जब तक आप पहले एक डेटा सेंटर न बना ले।

क्लाउड टेक्नोलॉजी ने यह सब कुछ बदल दिया। क्लाउड प्रोवाइडर अपने हार्डवेयर को सभी से साझा करते हैं, जो कोई भी खेल कर देखना चाहे,देख सकता है। जिसका मतलब है कि एआई एक पहले-इस्तेमाल-करें-फिर-विश्वास-करें जैसा ऑफर है, जो एक दशक पहले संभव नहीं था।

क्लाउड प्रोवाइडर भी सामान्य-उद्देश्य की खपत को ध्यान में रखते हुए टूल्स बनाते हैं और वे पहले की तुलना में काफी बेहतर हैं। मानव प्रजाति की यह बात मुझे बहुत पसंद है: जब भी कोई उपयोगी टूल का आविष्कार करता है, तो अन्य लोग कदम बढ़ाते हैं और इसका उपयोग करना आसान बनाते हैं। 1890 के रेडियो की तुलना में, आज के रेडियो को उपयोग करना बहुत आसान है और उनके पास वाली दीवार पर तेज गति से टक्कर के बाद बचने की भी अधिक संभावना है।

बहुत से लोगों को यह एहसास नहीं है कि, आज की एआई की कहानी असल में क्लाउड की कहानी है।

बेशक, यह सब डेटा के बिना बेकार है और यही एक कारण है कि एआई ट्रेंड कर रहा है,और भी ज्यादा! दुनिया इतना डेटा इकट्ठा कर रही है जितना पहले कभी नहीं किया गया, इसलिए व्यवसायों के पास अब एआई को बनाने के लिए ईंधन है। मेरे कहने का मतलब है कि: एआई अब रियल है, और यह रोमांचक है!

यही कारण है कि मैंने एक उपयोग के मामलों वाली टॉक को चुना: लोगों को यह जानने की जरूरत है कि यह अब साइंस-फिक्शन नहीं है। ऐआई है, और यह कमाल की चीज है!

लेकिन फिर मेरा इस समस्या से सामना हुआ कि राजेन की मूल टॉक उपयोग के मामलों का ऐसा भंडार है कि उनका सारांश देना असंभव होगा (क्या बड़ी समस्या है!) और इसलिए मैं अपने 3 मिनट का उपयोग मूल बात से कुछ सलाह के बेहतरीन बिट्स उठाने के लिए करूंगी और आपको पूरी मूल टॉक को देखने के लिए प्रेरित करूंगी।

ओरिजिनल टॉक कि समरी “ कस्टमर वैल्यू क्रीएट करें गूगल क्लाउड एआई के साथ” राजेन शेठ द्वारा

#2 मशीन लर्निंग क्या है और मैं इसे कैसे समझती हूं? (बिना पीएचडी के)

आप जानते हैं कि मैं हर मौके पर यह हाइलाइट करना चाहूंगी कि रिसर्च एआई और अप्लाइड एआई अलग-अलग विषय हैं… और अगर मैं अप्लाइड वाले पक्ष की सराहना करना चाहूं, तो आप शायद ही मुझसे यह मौका छोड़ने की उम्मीद करेंगे। है न?

हमें और साधारण टॉक चाहिए बेसिक और एप्लीकेशन के बारे में, ऐसी भाषा में जिसे इंजीनियर व टेक्नोलॉजी प्रेमी सराह सकते हैं।

लैक की ओरिज़नल टॉक पूरे समर्थन में थी, लिनियर अलजेब्रा जैसे पेचीदा गणित को छोड़कर, बेसिक और एप्लीकेशन के बारे ऐसी भाषा में सीधी सरल बात करने के, जिसे इंजीनियर और टेक्नोलॉजी प्रेमी सराह सकें, इसलिए इस टॉक ने पहले ही मेरे मन में जगह बना ली थी। यह वास्तविक उपयोग के मामलों के उदाहरणों के साथ विचारों में रंग भरती है, फिर यह चार बेहतरीन सलाह के साथ सौदे को खत्म करती है, और यही वे रत्न है, जिन्हें मैंने अपने बाकी 3 मिनट के लिए चुना है:

  • मशीन लर्निंग ऐसी कई समस्याएं हल कर सकती है, जिनके लिए आप आज नियम लिख रहे हैं।
  • मशीन लर्निंग के जरिए आप एप्लिकेशन को पर्सनलाइज करते हैं।
  • सिस्टम को इस उम्मीद के साथ डिजाइन करें कि अगले साल आपके पास और भी डेटा होगा।
  • एक ऐसे मंच का उपयोग करें, जो आपको बुनियादी ढांचे के बारे में परेशान नहीं करता और महान पूर्व-निर्मित मॉडल प्रदान करता है।
ओरिजिनल टॉक कि समरी “क्लाउड में एआई के उपयोग से अपने बिज़नेस को ट्रान्स्फॉर्म करें” लक लक्ष्मन द्वारा

# 3 अब आप SQL में मशीन लर्निंग कर सकते हैं (!!)

अगर आपका विशाल डेटाबेस मशीन लर्निंग के पास नहीं आता, तो मशीन लर्निंग को डेटाबेस के पास ले आओ! बि्ग क्वैरी ने आपको एसक्यूएल में लीनियर और लॉजिस्टिक रिग्रेशन दे रखा है। अब आपको अपने डेटाबेस को टेंसरफ्लो सेटअप में डालने के लिए, उसे एक्सपोर्ट करने की तकलीफ से नहीं गुजरना पड़ेगा!

अगर आप एक एक्सपर्ट एनालिस्ट हैं, तो आपकी ताकत गति है, लेकिन बड़े डेटासेट पर मशीन लर्निंग बहुत अधिक समय ले लेता है।

यह इतना बेहतरीन क्यों है? अगर आप एक एक्सपर्ट एनालिस्ट हैं, तो आपकी ताकत गति है। जितनी तेजी से आप देख सकते हैं कि डेटासेट में क्षमता है, उतनी ही आपको सराहना मिलती है। लेकिन, अगर आप बड़े स्तर पर काम करते हैं, तो शायद आप लंबे समय तक एक्सपोर्ट होने वाले डेटा से निपटना सीख लिया होगा, यहां तक ​​की एक छोटे से मशीन लर्निंग मॉडल को आज़माने के लिए भी आपको इंतजार से गुजरना पड़ेगा। लेकिन अब और नहीं!

यह। है। तुरंत। संतुष्टि।

बिगक्वैरी एमएल बड़े स्तर पर काम करने वाले लोगों के लिए एनालिटिक्स में ही तेजी नहीं लाता है, बल्कि यह आरओसी कर्व्स और फीचर डिस्ट्रीब्यूशन एनालिसिस के साथ भी बोनस के रूप में ऐसा करता है। मैं अपने 2 मिनट का उपयोग आपको इसकी एक झलक दिखाने के लिए करती हूँ। अगर आप प्रेरित हैं, यहां नावेद और अभिषेक की मूल टॉक का पूरा डेमो है।

ओरिजिनल टॉक कि समरी “बिग क्वेरी में प्रीडिक्टिव एनैलिसिस कैसे करें” अभिषेक कश्यप द्वारा

# 4 डेटा साइंटिस्ट, आपको अब बुनियादी ढांचे में एक ब्लैक बेल्ट की जरूरत नहीं है।

यह कहानी है बेहतर टूल्स की, जो डेटा साइंटिस्ट को अपना पसंदीदा काम करने में मदद करती है। यह व्यापक सशक्तीकरण के बारे में भी है: बेहतर टूल्स आम लोगों को उन टेक्नोलॉजी तक पहुंचने में मदद करते हैं, जिनसे वह अपने उज्जवल भविष्य को गढ़ सकते हैं। मैंने पहले से ही एक अन्य ब्लॉग पोस्ट में इसकी गाथा गा रखी है (आप बोरिंग बिट्स के बिना एआई को क्या कहते हैं?), लेकिन बेकार के कामों को रास्ते से बाहर निकलना ताकि लोग क्रिएटिव होने और अपने पसंदीदा हिस्सों को करने पर ध्यान केंद्रित कर सकें, यह मुझे उत्साह से भर देता है| इसीलिए क्यूबफ्लो (Kubeflow) टॉक मेरी पसंदीदा सूची का हिस्सा है।

क्यूबफ्लो (Kubeflow) मशीन लर्निंग के बेकार कामों के पहाड़ के लिए एक लिफ्ट की तरह है!

एक डेटा साइंटिस्ट होने के नाते, आप हाइब्रिड क्लाउड वातावरण में स्केलेबल मशीन लर्निंग बहुत पसंद करेंगे, लेकिन मेरी आंखों में देखें और मुझे बताएं कि आप वास्तव में कीमती मॉडलिंग और एनालिसिस का समय क्यूबरनेट्स ऑप्टिमाइज्ड वर्चुअल मशीन, डेटा एक्सफिल्ट्रेशन से बचाव जैसी चीजों पर खर्च करना चाहेंगे। नहीं? खैर, आपकी किस्मत अच्छी है कि आपको यह सब नहीं करना पड़ेगा।

आपको क्यूबफ्लो (Kubeflow) के आपकी रक्षा में आने तक के लंबे समय तक इंतजार करने के लिए बधाई, अब आपको हर बार एक नया कंप्यूटर बनाने की जरूरत नहीं पड़ेगी।

मैं अपने 3 मिनट का इस्तेमाल आपका मशीन लर्निंग की कंपोजेबिलिटी, स्केलेबिलिटी और पोर्टेबिलिटी के बारे में बताने के लिए करूंगी, फिर आपको डेविड की मूल टॉक से बताऊंगी कि, क्यूबफ़्लो और इलास्टीफ़ाइल से(डेटा पोर्टेबिलिटी) क्या कर सकते हैं ।

ओरिजिनल टॉक कि समरी “मशीन लर्निंग मेड ईजी बाइ क्यूबफ्लो एण्ड इलास्टीफाइल” डेविड एरॉनचिक द्वारा

# 5 TensorFlow और भी गले लगाने लायक बनने की राह पर

इमानदारी से: शीर्ष 5 में एक जगह टेंसरफ्लो की तो होनी ही थी। यह डेटा साइंस का इतना अहम हिस्सा जो है। मेरी खुशी का कारण लॉरेंस की मूल टॉक में यह है, कि यह ऐसे बेहतरीन नए फीचर्स के बारे में बताती है, जो टेंसरफ्लो को न केवल हमेशा से बेहतर बनाते हैं, बल्कि और यूज़र फ्रेंडली भी बनाते हैं। मैं उसके बारे में इतनी उत्साहित थी, कि मैंने वीडियो बनाने से पहले ही ब्लॉग लिख दिया। अगर आप चीजों को देखना पसंद नहीं करते हैं, तो आप उनमें टेक्स्ट यहां प्राप्त कर सकते हैं: टेंसरफ्लो के बारे में 9 चीजें जिन्हें आपको जानना चाहिए। या अगले पैराग्राफ में सारांश पढ़ सकते हैं।

टेंसरफ्लो विशालकाय डेटासेट पर बेहतरीन एआई के लिए डिज़ाइन की गई डाटा साइंस की औद्योगिक लेथ मशीन है।

अगर आप विशाल डेटासेट के साथ काम करते हैं या बेहतरीन एआई मॉडल बनाना चाहते हैं, तो टेंसरफ्लो आपके रडार पर होगा ही। यह डेटा साइंस की औद्योगिक लेथ मशीन है और अपने शुरुआती दिनों में यह औद्योगिक लेथ मशीन से यूजर फ्रेंडली होने के बारे में सलाह लिया करती थी| अगर आप चिल्लाते हुए भाग गए थे, तो वापस आ जाइए! अब यह और गले से लगाने के लायक है और इसमें कुछ शानदार नए फीचर हैं।

मैं अपने 2.5 मिनट का इस्तेमाल अपने पसंदीदा हाइलाइट्स दिखाने के लिए करूंगी, जिसमें सेल्फ-एक्सप्रेशन के मौके शामिल हैं जो आपको अधिक स्वादिष्ट लगेंगे अगर पायथन आपकी मातृभाषा है, अन्य भाषाओं के मेजबान जो एक पाइथोनिस्ट नहीं हैं, वह भी इसका उपयोग कर सकते हैं — जावास्क्रिप्ट सहित (ब्राउज़र में ही सब कुछ करने के लिए तैयार रहें!)।इसके साथ डेटा प्रोसेसिंग, मॉडल शेयरिंग मैं भी बेहतरी आई है और मोबाइल और टोस्टर जैसी चीजों पर काम करने के लिए सपोर्ट भी।

ओरिजिनल टॉक कि समरी “टेन्सरफ्लो में ये चीज़ें हैं नई” लॉरेंस मोरोनी द्वारा

अन्य 300+ टॉक्स भी बहुत अच्छी थी, लेकिन इन पांचों ने मेरे डेटा साइंस वाले दिल में एक खास जगह बनाई है। आशा है कि आप इनका आनंद लेंगे! ( देखें नेक्स्ट रिवाइंड वीडियो श्रृंखला विभिन्न प्रकार के तकनीकी विषयों पर फ्लैश सारांश देखने के लिए।)

--

--

Cassie Kozyrkov

Head of Decision Intelligence, Google. This account is for translated Hindi versions of my English language articles. twitter.com/quaesita