फेसबुक चाहता है कि मशीनें हमारी आंखों से दुनिया देखें

पिछले दो वर्षों से, फेसबुक एआई रिसर्च (एफएआईआर) ने दुनिया भर के 13 विश्वविद्यालयों के साथ काम किया है ताकि पहले व्यक्ति वीडियो के सबसे बड़े डेटा सेट को इकट्ठा किया जा सके- विशेष रूप से गहन-शिक्षण छवि-पहचान मॉडल को प्रशिक्षित करने के लिए। डेटा सेट पर प्रशिक्षित एआई उन रोबोटों को नियंत्रित करने में बेहतर होंगे जो लोगों के साथ बातचीत करते हैं, या स्मार्ट चश्मे से छवियों की व्याख्या करते हैं। “मशीनें हमारे दैनिक जीवन में हमारी मदद तभी कर पाएंगी जब वे वास्तव में हमारी आंखों से दुनिया को समझें,” फेयर में क्रिस्टन ग्रूमन कहते हैं, जो परियोजना का नेतृत्व करते हैं।

ऐसी तकनीक उन लोगों का समर्थन कर सकती है जिन्हें घर के आसपास सहायता की आवश्यकता होती है, या उन कार्यों में लोगों का मार्गदर्शन करते हैं जिन्हें वे पूरा करना सीख रहे हैं। Google ब्रेन और न्यूयॉर्क में स्टोनी ब्रुक विश्वविद्यालय के कंप्यूटर विज़न शोधकर्ता माइकल रयू कहते हैं, “इस डेटा सेट में वीडियो बहुत करीब है कि मनुष्य दुनिया को कैसे देखता है, जो Ego4D में शामिल नहीं है।”

लेकिन संभावित दुरुपयोग स्पष्ट और चिंताजनक हैं। शोध को फेसबुक द्वारा वित्त पोषित किया गया है, एक सोशल मीडिया दिग्गज जिस पर हाल ही में अमेरिकी सीनेट में आरोप लगाया गया है लोगों की भलाई पर लाभ डालना-जैसा कि एमआईटी टेक्नोलॉजी रिव्यूज द्वारा पुष्टि की गई है खुद की जांच.

फेसबुक और अन्य बिग टेक कंपनियों का बिजनेस मॉडल लोगों के ऑनलाइन व्यवहार से ज्यादा से ज्यादा डेटा चुराना और उसे विज्ञापनदाताओं को बेचना है। परियोजना में उल्लिखित एआई उस पहुंच को लोगों के दैनिक ऑफ़लाइन व्यवहार तक बढ़ा सकता है, जिससे यह पता चलता है कि आपके घर के आसपास कौन सी वस्तुएं हैं, आपने किन गतिविधियों का आनंद लिया, आपने किसके साथ समय बिताया, और यहां तक ​​​​कि जहां आपकी निगाह टिकी हुई थी – व्यक्तिगत जानकारी की एक अभूतपूर्व डिग्री।

ग्रूमन कहते हैं, “गोपनीयता पर काम करने की ज़रूरत है क्योंकि आप इसे खोजपूर्ण शोध की दुनिया से बाहर ले जाते हैं और कुछ ऐसा उत्पाद है।” “वह काम भी इस परियोजना से प्रेरित हो सकता है।”

फेसबुक

प्रथम-व्यक्ति वीडियो के सबसे बड़े पिछले डेटा सेट में रसोई में लोगों के 100 घंटे के फ़ुटेज होते हैं। Ego4D डेटा सेट में नौ देशों (यूएस, यूके, भारत, जापान, इटली, सिंगापुर, सऊदी अरब, कोलंबिया और रवांडा) में 73 विभिन्न स्थानों में 855 लोगों द्वारा रिकॉर्ड किए गए 3,025 घंटे के वीडियो शामिल हैं।

प्रतिभागियों की अलग-अलग उम्र और पृष्ठभूमि थी; कुछ को उनके नेत्रहीन दिलचस्प व्यवसायों के लिए भर्ती किया गया था, जैसे कि बेकर, यांत्रिकी, बढ़ई, और भूस्वामी।

पिछले डेटा सेट में आमतौर पर केवल कुछ सेकंड लंबे अर्ध-स्क्रिप्टेड वीडियो क्लिप होते थे। Ego4D के लिए, प्रतिभागियों ने एक बार में 10 घंटे तक हेड-माउंटेड कैमरे पहने और बिना स्क्रिप्ट वाली दैनिक गतिविधियों का पहला-व्यक्ति वीडियो कैप्चर किया, जिसमें सड़क पर चलना, पढ़ना, कपड़े धोना, खरीदारी करना, पालतू जानवरों के साथ खेलना, बोर्ड गेम खेलना और अन्य लोगों के साथ बातचीत। कुछ फ़ुटेज में ऑडियो, इस बारे में डेटा भी शामिल है कि प्रतिभागियों की नज़र कहाँ केंद्रित थी, और एक ही दृश्य पर कई दृष्टिकोण। रयू कहते हैं, यह अपनी तरह का पहला डेटा सेट है।

(Visited 4 times, 1 visits today)

About The Author

You might be interested in

प्यू-अमेरिका-के-42-उपयोगकर्ता-मुख्य-रूप-से-मनोरंजन-के.jpg
0

LEAVE YOUR COMMENT