डेटा विश्वसनीयता प्लेटफ़ॉर्म डेटाफ़ोल्ड $20M . बढ़ाता है

डेटाफोल्ड, एक स्टार्टअप जो वर्कफ़्लो को स्वचालित करता है और डेटा गुणवत्ता बनाए रखता है, ने आज घोषणा की कि उसने NEA (न्यू एंटरप्राइज एसोसिएट्स) के नेतृत्व में एक श्रृंखला के फंडिंग के दौर में $20 मिलियन जुटाए हैं। निवेश, जिसमें एम्प्लीफाई पार्टनर्स, डेटाब्रिक्स और डीबीटी लैब्स की भागीदारी भी देखी गई, का उपयोग कंपनी द्वारा अपने डेटा विश्वसनीयता प्लेटफॉर्म को और विकसित करने और अपनी टीम का विस्तार करने के लिए किया जाएगा।

किसी भी डेटा-संचालित संगठन के लिए, दिन-प्रतिदिन के आधार पर डेटा पाइपलाइनों की गुणवत्ता सुनिश्चित करना अच्छी तरह से कार्य करने वाले डैशबोर्ड की कुंजी है, ठीक से प्रशिक्षित एआई और एमएल मॉडल, और सटीक विश्लेषण। हालांकि, डेटा की विविधता और मात्रा में विस्फोट के साथ-साथ डेटा उत्पादों को तेजी से वितरित करने की बढ़ती आवश्यकताओं के साथ, परीक्षण, निगरानी और गुणवत्ता आश्वासन के मैन्युअल तरीकों का उपयोग करने वाले डेटा इंजीनियर अक्सर खुद को संघर्ष करते हुए पाते हैं। वे जटिलता को बनाए रखने में विफल रहते हैं।

उच्च गुणवत्ता वाली डेटा पाइपलाइन सुनिश्चित करने के लिए समाधान

2020 में स्थापित, डेटाफोल्ड इन चुनौतियों को हल करने और अपने एंड-टू-एंड विश्वसनीयता प्लेटफॉर्म के साथ डेटा तबाही को रोकने का प्रयास करता है। समाधान डेटा उत्पादों को विकसित करने की प्रक्रिया में कई थकाऊ कार्यप्रवाहों को स्वचालित करता है, उच्च गुणवत्ता वाले डेटा को खोजने से लेकर परीक्षण परिवर्तनों / सुधारों को उत्पादन में तैनात करने से पहले और पहले से ही उत्पादन में डेटा पाइपलाइनों की निगरानी तक।

“डेटाफोल्ड बहुत अधिक एकीकृत डेटा कैटलॉग प्रदान करता है जो डेटा डेवलपर्स को हजारों के समूह से प्रासंगिक डेटासेट खोजने में सक्षम बनाता है और तुरंत आकलन करता है कि वे कैसे काम करते हैं, जिसका अर्थ है कि प्रत्येक कॉलम में डेटा का वितरण, गुणवत्ता मीट्रिक (चाहे कोई कॉलम पॉप्युलेट हो या अधिकतर) नल्ड) और डेटासेट की वंशावली, “डेटाफोल्ड के संस्थापक और सीईओ ग्लीब मेझांस्की ने वेंचरबीट को बताया।

Bigeye और Monte Carlo जैसी कंपनियां भी डेटा विश्वसनीयता सुनिश्चित करने के क्षेत्र में काम करती हैं, हालांकि Mezhanskiy ने कहा कि इनमें से अधिकांश और बड़े संगठनों द्वारा आंतरिक रूप से स्थापित अन्य समाधान डेटा पाइपलाइन के उत्पादन में होने पर मुद्दों का पता लगाने पर केंद्रित हैं। नतीजतन, जब तक टीम टूटे हुए डेटा के बारे में सीखती है, तब तक नुकसान हो चुका होता है, जिसमें अधिकारी गलत डैशबोर्ड नंबरों या पूर्वाग्रह से प्रशिक्षित एमएल मॉडल के आधार पर निर्णय लेते हैं।

दूसरी ओर, डेटाफोल्ड, उत्पादन में जाने और नुकसान करने से पहले डेटा विसंगतियों की लगातार पहचान करने पर ध्यान केंद्रित करता है। समाधान की प्रमुख विशेषता, डेटा डिफ, परिवर्तन प्रबंधन वर्कफ़्लो में डेटा परीक्षण को स्वचालित करती है और इसे CI/CD प्रक्रिया और कोड रिपॉजिटरी में एकीकृत करती है। यह डेटा प्रैक्टिशनर्स को दिखाता है कि डेटा प्रोसेसिंग कोड में परिवर्तन परिणामी डेटा और डाउनस्ट्रीम उत्पादों को कैसे प्रभावित करेगा, जैसे कि बीआई डैशबोर्ड, उन्हें उन मुद्दों को पकड़ने की इजाजत देता है जो कोड के उत्पादन तक पहुंचने से पहले हॉटफिक्स/परिवर्तन से उत्पन्न हो सकते हैं और डेटा की गणना की जाती है।

“डेटाफोल्ड का उपयोग करने से पहले, हमारी ग्राहक टीमें कई घंटे बिता रही होंगी” [on] एक ही कार्य। लेकिन, हमारे टूलींग के साथ, उन्हें लगभग पांच मिनट लगते हैं। इसलिए यह परीक्षण का एक विशाल, बड़े पैमाने पर त्वरण है,” मेझांस्की ने जोर देकर कहा कि कंपनी “कुछ दर्जन ग्राहकों” के साथ काम करती है और उन्हें 100% कोड परीक्षण सुनिश्चित करने में मदद करती है।

इसके अलावा, अपने प्रतिस्पर्धियों की तरह, कंपनी पुराने डेटा उत्पादों और पाइपलाइनों में विफलताओं की निगरानी और पता लगाने के लिए मशीन लर्निंग का भी लाभ उठाती है जो पहले से ही उत्पादन में हैं।

“हम मूल रूप से डेटा को प्रोफाइल करते हैं, मेट्रिक्स की गणना करते हैं, उन्हें हमारे मशीन लर्निंग मॉडल के खिलाफ चलाते हैं, और इस सवाल का जवाब देते हैं कि डेटा अपेक्षित व्यवहार करता है या नहीं। यदि ऐसा नहीं होता है, तो हम ग्राहक को सुस्त या किसी अन्य चैनल पर सचेत करते हैं, ”सीईओ ने कहा।

डेटाफोल्ड के साथ जुड़े कुछ प्रमुख ग्राहकों में पैट्रियन, थम्बटैक, फेयर, डची, एमिनो, ट्रूबिल और वाइटल शामिल हैं।

डेटा विश्वसनीयता के लिए आगे की राह

आगे बढ़ते हुए, डेटाफोल्ड अपने उत्पाद को आगे बढ़ाने की योजना बना रहा है, और अधिक जांच और परीक्षण डेटा इंजीनियरों को स्वचालित करने की अपनी क्षमता का विस्तार करता है। कंपनी का मानना ​​है कि डेटा इंजीनियर जो करते हैं उसका 80% से अधिक स्वचालित हो सकता है।

इसके साथ ही, यह एक स्मार्ट-अलर्टिंग फीचर भी लॉन्च करने की योजना बना रहा है जो डेटा विसंगतियों को प्राथमिकता देगा, टीमों को यह तय करने में मदद करेगा कि कौन से मुद्दे सबसे महत्वपूर्ण हैं और पहले उन्हें संबोधित करने की आवश्यकता है। फिलहाल इस फीचर का परीक्षण कुछ चुनिंदा ग्राहकों के साथ किया जा रहा है।

निकट अवधि में, डेटाफोल्ड को इन सुधारों से पांच गुना वृद्धि दर्ज करने की उम्मीद है। कंपनी अगले साल के अंत तक अपनी टीम को 40 या उससे अधिक तक बढ़ाएगी।

वेंचरबीट

वेंचरबीट का मिशन तकनीकी निर्णय लेने वालों के लिए परिवर्तनकारी तकनीक और लेन-देन के बारे में ज्ञान हासिल करने के लिए एक डिजिटल टाउन स्क्वायर बनना है। जब आप अपने संगठनों का नेतृत्व करते हैं तो हमारा मार्गदर्शन करने के लिए हमारी साइट डेटा तकनीकों और रणनीतियों पर आवश्यक जानकारी प्रदान करती है। हम आपको हमारे समुदाय का सदस्य बनने के लिए आमंत्रित करते हैं:

  • आपकी रुचि के विषयों पर अप-टू-डेट जानकारी
  • हमारे समाचार पत्र
  • गेटेड विचार-नेता सामग्री और हमारे बेशकीमती आयोजनों के लिए रियायती पहुंच, जैसे रूपांतरण 2021: और अधिक जानें
  • नेटवर्किंग सुविधाएँ, और बहुत कुछ

सदस्य बने

(Visited 6 times, 1 visits today)

About The Author

You might be interested in

प्यू-अमेरिका-के-42-उपयोगकर्ता-मुख्य-रूप-से-मनोरंजन-के.jpg
0

LEAVE YOUR COMMENT