नया AI सहायक मानव की तरह वेब ऐप्स ब्राउज़, खोज और उपयोग कर सकता है

अभी भी एक डेमो वीडियो से दिखा रहा है कि ACT-1 एक ब्राउज़र में Redfin.com पर खोज कर रहा है।
बड़े आकार में / अभी भी एक डेमो वीडियो से दिखाया गया है कि ACT-1 एक ब्राउज़र में Redfin.com पर एक खोज कर रहा है जब “मुझे एक घर खोजने” के लिए कहा गया।

निपुण

कल, कैलिफोर्निया स्थित एआई फर्म एडेप्ट ने घोषणा की एक्शन ट्रांसफार्मर (एसीटी -1), एक एआई मॉडल जो उच्च-स्तरीय लिखित या मौखिक आदेश दिए जाने पर मानव सहायक की तरह सॉफ़्टवेयर में कार्य कर सकता है। यह कथित तौर पर वेब ऐप संचालित कर सकता है और वेबसाइटों पर क्लिक, स्क्रॉलिंग और सही क्षेत्रों में टाइप करते समय बुद्धिमान खोज कर सकता है जैसे कि यह कंप्यूटर का उपयोग करने वाला व्यक्ति हो।

एक डेमो वीडियो में ट्वीट किए निपुण द्वारा, कंपनी एक टेक्स्ट एंट्री बॉक्स में किसी को टाइप करते हुए दिखाती है, “मुझे ह्यूस्टन में एक घर ढूंढें जो 4 के परिवार के लिए काम करता है। मेरा बजट 600K है”। कार्य सबमिट करने पर, ACT-1 स्वचालित रूप से Redfin.com को वेब ब्राउज़र में ब्राउज़ करता है, वेबसाइट के उचित क्षेत्रों पर क्लिक करता है, एक खोज प्रविष्टि टाइप करता है, और स्क्रीन पर मिलान करने वाला घर दिखाई देने तक खोज पैरामीटर बदलता है।

एक और प्रदर्शन वीडियो निपुण की वेबसाइट ACT-1 ऑपरेटिंग सेल्सफोर्स को “नई लीड के रूप में एडेप्ट में मैक्स नी जोड़ें” और “जेम्स वेल के साथ एक कॉल लॉग इन करें कि वह 100 विजेट खरीदने के बारे में सोच रहा है” जैसे संकेतों के साथ दिखाता है। ACT-1 फिर दाएं बटन पर क्लिक करता है, स्क्रॉल करता है और इन कार्यों को पूरा करने के लिए उचित फॉर्म भरता है। अन्य डेमो वीडियो एक ब्राउज़र के माध्यम से ACT-1 को Google शीट्स, क्रेगलिस्ट और विकिपीडिया को नेविगेट करते हुए दिखाते हैं।

एक कुशल प्रचार वीडियो जिसमें ACT-1, एक वेब-आधारित स्प्रैडशीट ऐप, Google पत्रक का संचालन कर रहा है।

यह कैसे हो सकता है? निपुण अधिनियम -1 को “बड़े पैमाने पर ट्रांसफार्मर” के रूप में वर्णित करता है। एआई में, ए ट्रांसफार्मर मॉडल एक प्रकार का तंत्रिका नेटवर्क है जो उदाहरण डेटा पर प्रशिक्षण द्वारा कुछ करना सीखता है, और यह डेटा सेट में वस्तुओं के बीच संदर्भ और संबंधों का ज्ञान बनाता है। ट्रांसफॉर्मर हाल के कई एआई नवाचारों के पीछे रहे हैं, जिनमें भाषा मॉडल जैसे जीपीटी-3 जो लगभग मानवीय स्तर पर लिख सकता है।

ACT-1 के मामले में, प्रशिक्षण डेटा स्पष्ट रूप से पहले सॉफ्टवेयर का संचालन करने वाले मनुष्यों से आया था, और AI मॉडल ने उससे सीखा। कोई है जो खुद को पहचाना हैकर न्यूज पर ACT-1 के लिए एक डेवलपर के रूप में लिखा थाहमने मानव प्रदर्शनों और प्रतिक्रिया डेटा के संयोजन का उपयोग किया! प्रदर्शनों को रिकॉर्ड करने और मॉडल-उपभोज्य तरीके से उपकरण की स्थिति का प्रतिनिधित्व करने के लिए आपको कस्टम सॉफ़्टवेयर की आवश्यकता है।

प्रशिक्षण के बाद, ACT-1 मॉडल एक क्रोम एक्सटेंशन के माध्यम से एक वेब ब्राउज़र के साथ इंटरैक्ट करता है जो “ब्राउज़र में क्या हो रहा है और कुछ क्रियाएं कर सकता है, जैसे कि क्लिक करना, टाइप करना और स्क्रॉल करना,” एडेप्ट के अनुसार। कंपनी एसीटी -1 की अवलोकन क्षमता का वर्णन वेबसाइटों पर सामान्यीकरण करने में सक्षम होने के रूप में करती है, इसलिए एक साइट पर सीखे गए नियम दूसरों पर लागू हो सकते हैं।

जबकि ब्राउज़िंग को स्वचालित करने के लिए स्क्रिप्ट पहले से मौजूद हैं (और अक्सर इसका उपयोग किया जाता है बुरे इरादों के साथ पावर बॉट), डेमो में निहित ACT-1 की शक्तिशाली, सामान्यीकृत प्रकृति मशीन स्वचालन को एक नए स्तर पर ले जाती है। पहले से ही, ट्विटर पर लोग गंभीरता से और आधा-मजाक दोनों कर रहे हैं अलार्म उठाना दुरुपयोग की संभावना पर जो यह तकनीक ला सकती है। क्या हमें एक बुद्धिमान प्रणाली को अपने कंप्यूटर इंटरफेस पर इतना नियंत्रण रखने की अनुमति देनी चाहिए?

जबकि वे चिंताएँ अभी के लिए विशुद्ध रूप से काल्पनिक हैं – विशेष रूप से चूंकि ACT-1 स्वायत्त रूप से संचालित नहीं होती है – उन्हें ध्यान में रखना कुछ है क्योंकि हम सामान्यीकृत मानव-स्तर AI की ओर बढ़ते हैं जो इंटरनेट के माध्यम से बाहरी दुनिया के साथ इंटरफेस कर सकते हैं। निपुण भी संदर्भ इस लक्ष्य को अपनी वेबसाइट पर लिखते हुए लिखा है, “हमारा मानना ​​है कि सामान्य बुद्धि की सबसे स्पष्ट रूपरेखा एक ऐसी प्रणाली है जो एक कंप्यूटर के सामने वह सब कुछ कर सकती है जो एक इंसान कर सकता है।”

amar-bangla-patrika