मशीन लर्निंग को उपयोगी बनाने के लिए डॉटडेटा प्रमुख डेटा सुविधाओं को निकालता है

अपनी एंटरप्राइज़ डेटा तकनीक और रणनीति को ऊपर उठाएं रूपांतरण 2021.


कई आर्टिफिशियल इंटेलिजेंस विशेषज्ञों का कहना है कि एआई एल्गोरिथम चलाना काम का ही हिस्सा है। डेटा तैयार करना और उसे साफ करना एक शुरुआत है, लेकिन असली चुनौती यह पता लगाना है कि क्या पढ़ना है और जवाब कहां देखना है। क्या यह लेन-देन के बहीखाते में छिपा है? या शायद रंग पैटर्न में? एआई एल्गोरिदम की जांच करने के लिए सही सुविधाओं को खोजने के लिए अक्सर व्यवसाय के गहन ज्ञान की आवश्यकता होती है ताकि एआई एल्गोरिदम को सही जगह पर देखने के लिए निर्देशित किया जा सके।

डॉटडाटा उस कार्य को स्वचालित करना चाहता है। कंपनी उद्यमों के लिए सर्वोत्तम सुविधाओं को चिह्नित करने में मदद करना चाहती है एआई प्रसंस्करण, और ऐसी सुविधाओं को देखने के लिए सबसे अच्छी जगह खोजने के लिए। कंपनी ने डॉटडाटा पाय लाइट लॉन्च किया है, जो उनके मशीन लर्निंग टूलकिट का एक कंटेनरीकृत संस्करण है जो उपयोगकर्ताओं को अवधारणा के सबूत (पीओसी) को जल्दी से बनाने की अनुमति देता है। उत्तर की तलाश में डेटा मालिक या तो टूलकिट डाउनलोड कर सकते हैं और इसे स्थानीय रूप से चला सकते हैं या इसे डॉटडेटा की क्लाउड सेवा में चला सकते हैं।

वेंचरबीट नए उत्पाद पर चर्चा करने के लिए डॉटडेटा के संस्थापक और सीईओ रयोही फुजीमाकी के साथ बैठ गया और समय से अधिक डेटा वाले किसी भी व्यक्ति के लिए एआई वर्कलोड को सरल बनाने के लिए कंपनी के व्यापक दृष्टिकोण में इसकी भूमिका पर चर्चा की।

वेंचरबीट: क्या आप अपने टूल को डेटाबेस या एआई इंजन के रूप में अधिक समझते हैं?

रयोही फुजीमाकी: हमारा टूल एआई इंजन से अधिक है लेकिन यह है [tightly integrated with] आँकड़े। कई कंपनियों में तीन प्रमुख डेटा चरण होते हैं। सबसे पहले, डेटा लेक है, जो मुख्य रूप से कच्चा डेटा है। फिर डेटा वेयरहाउस चरण है, जो कुछ हद तक साफ और स्थापत्य है। यह अच्छी स्थिति में है, लेकिन यह अभी तक आसानी से उपभोग योग्य नहीं है। फिर डेटा मार्ट है, जो डेटा टेबल का एक उद्देश्य-उन्मुख, उद्देश्य-विशिष्ट सेट है। यह आसानी से एक द्वारा सेवन किया जाता है व्यापारिक सूचना या मशीन लर्निंग एल्गोरिदम।

हम बीच में डेटा के साथ काम करना शुरू करते हैं डेटा लेक और डेटा वेयरहाउस मंच। [Then we prepare it] मशीन लर्निंग एल्गोरिदम के लिए। हमारी वास्तविक मुख्य क्षमता, हमारी मुख्य क्षमता, इस प्रक्रिया को स्वचालित करना है।

वेंचरबीट: एक विशाल समुद्र में डेटा के सही बिट्स खोजने की प्रक्रिया?

फुजिमाकी: हम इसे “फीचर इंजीनियरिंग” के रूप में सोचते हैं, जो कच्चे डेटा से शुरू होता है, कहीं डेटा लेक और डेटा वेयरहाउस चरण के बीच, बहुत सारे डेटा को साफ करने और मशीन लर्निंग एल्गोरिदम को खिलाने के लिए।

वेंचरबीट: मशीन लर्निंग महत्वपूर्ण विशेषताओं को खोजने में मदद करता है?

फुजिमाकी: हाँ। फ़ीचर इंजीनियरिंग मूल रूप से डोमेन विशेषज्ञता के आधार पर मशीन सीखने की समस्या को ठीक कर रहा है।

वेंचरबीट: यह कितनी अच्छी तरह काम करता है?

फुजिमाकी: हमारे सर्वोत्तम ग्राहक केस अध्ययनों में से एक सदस्यता प्रबंधन व्यवसाय से आता है। वहां कंपनी ग्राहकों को मैनेज करने के लिए उनके प्लेटफॉर्म का इस्तेमाल कर रही है। समस्या यह है कि बहुत सारे अस्वीकृत या विलंबित लेनदेन हैं। यह उनके लिए लगभग 300 मिलियन डॉलर की समस्या है।

डॉटडेटा से पहले, उन्होंने एक तालिका से 14 मूल स्तंभों के आधार पर सुविधाओं के सेट के निर्माण के लिए 112 प्रश्नों को मैन्युअल रूप से तैयार किया था। उनकी सटीकता लगभग 75% थी। लेकिन हमने उनके डेटा सेट से सात टेबल लिए और 122,000 फीचर पैटर्न की खोज की। सटीकता 90% से अधिक हो गई।

वेंचरबीट: तो, मैन्युअल रूप से खोजी गई सुविधाएँ अच्छी थीं, लेकिन आपकी मशीन लर्निंग को एक हज़ार गुना अधिक सुविधाएँ मिलीं और सटीकता बढ़ गई?

फुजिमाकी: हाँ। यह सटीकता सिर्फ एक तकनीकी सुधार है। अंत में वे लगभग 35% खराब लेनदेन से बच सकते थे। यह लगभग 100 मिलियन डॉलर है।

हम एक तालिका में 14 अलग-अलग स्तंभों से सात तालिकाओं में लगभग 300 स्तंभों की खोज में गए। हमारा मंच यह पहचानने जा रहा है कि कौन से फीचर पैटर्न अधिक आशाजनक और अधिक महत्वपूर्ण हैं, और हमारी महत्वपूर्ण विशेषताओं का उपयोग करके वे सटीकता में काफी सुधार कर सकते हैं।

वेंचरबीट: तो यह किस प्रकार की विशेषताओं की खोज करता है?

फुजिमाकी: आइए उत्पाद मांग पूर्वानुमान के एक अन्य मामले के अध्ययन को देखें। खोजी गई विशेषताएं बहुत, बहुत सरल हैं। मशीन लर्निंग पिछले 14 दिनों में बिक्री जैसे लेन-देन तालिकाओं से अस्थायी एकत्रीकरण का उपयोग कर रहा है। जाहिर है, यह कुछ ऐसा है जो अगले सप्ताह के उत्पाद की मांग को प्रभावित कर सकता है। बिक्री या घरेलू सामानों के लिए, मशीन लर्निंग एल्गोरिदम 28-दिन की खिड़की ढूंढ रहा था जो सबसे अच्छा भविष्यवक्ता था।

वेंचरबीट: क्या यह सिर्फ एक खिड़की है?

फुजिमाकी: हमारा इंजन स्वचालित रूप से घरेलू सामान के लिए विशिष्ट बिक्री प्रवृत्ति पैटर्न का पता लगा सकता है। इसे आंशिक या वार्षिक आवधिक पैटर्न कहा जाता है। एल्गोरिदम वार्षिक आवधिक पैटर्न का पता लगाएगा जो विशेष रूप से क्रिसमस या थैंक्सगिविंग जैसे मौसमी घटना प्रभाव के लिए महत्वपूर्ण हैं। इस उपयोग के मामले में, बहुत अधिक भुगतान इतिहास है, एक बहुत ही आकर्षक इतिहास है।

वेंचरबीट: क्या अच्छा डेटा खोजना मुश्किल है?

फुजिमाकी: इसमें अक्सर बहुत कुछ होता है, लेकिन यह हमेशा अच्छा नहीं होता है। कुछ विनिर्माण ग्राहक अपनी आपूर्ति श्रृंखलाओं का अध्ययन कर रहे हैं। मुझे एक निर्माण कंपनी का यह केस स्टडी पसंद है। वे डॉटडेटा का उपयोग करके सेंसर डेटा का विश्लेषण कर रहे हैं, और इसमें बहुत कुछ है। वे कुछ विफलता पैटर्न का पता लगाना चाहते हैं, या निर्माण प्रक्रिया से उपज को अधिकतम करने का प्रयास करते हैं। हम अपने स्ट्रीम प्रेडिक्शन इंजन को तैनात करके उनका समर्थन कर रहे हैं [internet of things] कारखाने में सेंसर।

वेंचरबीट: आपका टूल मानव को इन सभी संयोजनों को खोजने और कल्पना करने की कोशिश करने से बचाता है। इसे डेटा साइंस करना आसान बनाना चाहिए।

फुजिमाकी: परंपरागत रूप से, इस प्रकार की फीचर इंजीनियरिंग के लिए बहुत अधिक डेटा इंजीनियरिंग कौशल की आवश्यकता होती है, क्योंकि डेटा बहुत बड़ा होता है और बहुत सारे संयोजन होते हैं।

हमारे अधिकांश उपयोगकर्ता आज डेटा वैज्ञानिक नहीं हैं। कुछ प्रोफाइल हैं। एक जैसा है [business intelligence] उपयोगकर्ता का प्रकार। एक विज़ुअलाइज़ेशन विशेषज्ञ की तरह जो वर्णनात्मक विश्लेषण के लिए एक डैशबोर्ड बना रहा है और भविष्य कहनेवाला विश्लेषण करने के लिए कदम बढ़ाना चाहता है।

एक अन्य डेटा इंजीनियर या सिस्टम इंजीनियर है जो इस तरह की डेटा मॉडल अवधारणा से परिचित है। सिस्टम इंजीनियर मशीन लर्निंग और एआई करने के लिए हमारे टूल को आसानी से समझ और इस्तेमाल कर सकते हैं। स्वयं डेटा वैज्ञानिकों की रुचि कुछ बढ़ रही है, लेकिन हमारा मुख्य उत्पाद मुख्य रूप से उन प्रकार के लोगों के लिए उपयोगी है।

वेंचरबीट: आप खोज की प्रक्रिया को स्वचालित कर रहे हैं?

फुजिमाकी: मूल रूप से हमारे ग्राहक बहुत, बहुत आश्चर्यचकित होते हैं जब हमने दिखाया कि हम इस सुविधा निष्कर्षण को स्वचालित कर रहे हैं। यह सबसे जटिल, लंबा हिस्सा है। आमतौर पर लोगों ने कहा है कि इसे स्वचालित करना असंभव है क्योंकि इसके लिए बहुत अधिक डोमेन ज्ञान की आवश्यकता होती है। लेकिन हम इस हिस्से को स्वचालित कर सकते हैं। हम डेटा में हेरफेर करने के लिए मशीन सीखने से पहले प्रक्रिया को स्वचालित कर सकते हैं।

वेंचरबीट: तो यह केवल सर्वोत्तम सुविधाओं को खोजने का चरण नहीं है, बल्कि इससे पहले आने वाला कार्य है। विशेषताओं को स्वयं पहचानने का कार्य।

फुजिमाकी: हाँ! हम उत्पन्न करने के लिए AI का उपयोग कर रहे हैं एआई इनपुट. बहुत सारे खिलाड़ी हैं जो अंतिम मशीन लर्निंग को स्वचालित कर सकते हैं। हमारे अधिकांश ग्राहकों ने डॉटडेटा को चुना क्योंकि हम पहले सुविधाओं को खोजने के हिस्से को स्वचालित कर सकते हैं। यह हिस्सा हमारी गुप्त चटनी की तरह है, और हमें इस पर बहुत गर्व है।

वेंचरबीट

तकनीकी निर्णय लेने वालों के लिए परिवर्तनकारी तकनीक और लेनदेन के बारे में ज्ञान हासिल करने के लिए वेंचरबीट का मिशन एक डिजिटल टाउन स्क्वायर बनना है। जब आप अपने संगठनों का नेतृत्व करते हैं तो हमारा मार्गदर्शन करने के लिए हमारी साइट डेटा तकनीकों और रणनीतियों पर आवश्यक जानकारी प्रदान करती है। हम आपको हमारे समुदाय का सदस्य बनने के लिए आमंत्रित करते हैं:

  • आपकी रुचि के विषयों पर अप-टू-डेट जानकारी
  • हमारे समाचार पत्र
  • गेटेड विचार-नेता सामग्री और हमारे बेशकीमती आयोजनों के लिए रियायती पहुंच, जैसे कि रूपांतरण 2021: और अधिक जानें
  • नेटवर्किंग सुविधाएँ, और बहुत कुछ

सदस्य बने

(Visited 4 times, 1 visits today)

About The Author

You might be interested in

कैसे-Roku-की-असामान्य-कॉर्पोरेट-संस्कृति-ने-इसे-बड़ी-कंपनियों.jpg
0
Microsoft-और-कम-से-कम-एक-दर्जन-स्टार्टअप-डेटा-केंद्रों.jpg
0

LEAVE YOUR COMMENT