रनवे लिखित संकेतों का उपयोग करके एआई-संचालित टेक्स्ट-टू-वीडियो संपादन को छेड़ता है

रनवे के से अभी भी
बड़े आकार में / रनवे के “टेक्स्ट टू वीडियो” टीज़र प्रोमो से अभी भी छवि-निर्माण क्षमताओं का सुझाव है।

मार्ग

आज सुबह पोस्ट किए गए एक ट्वीट में, आर्टिफिशियल इंटेलिजेंस कंपनी रनवे एक नई सुविधा छेड़ा इसके एआई-संचालित वेब-आधारित विडियो संपादक जो लिखित विवरण से वीडियो संपादित कर सकता है, जिसे अक्सर “संकेत” कहा जाता है। एक प्रचार वीडियो वाणिज्यिक वीडियो संपादन या पीढ़ी की दिशा में बहुत शुरुआती कदम दिखाता है, हाल ही में टेक्स्ट-टू-इमेज संश्लेषण मॉडल जैसे प्रचार को प्रतिबिंबित करता है स्थिर प्रसार लेकिन कुछ आशावादी रूपरेखा के साथ वर्तमान सीमाओं को कवर करने के लिए।

रनवे का “टेक्स्ट टू वीडियो” प्रदर्शन रील एक टेक्स्ट इनपुट बॉक्स दिखाता है जो “आयात शहर की सड़क” (पहले से मौजूद वीडियो क्लिप का सुझाव देता है) या “इसे और अधिक सिनेमाई दिखने” (एक प्रभाव लागू करने) जैसे संपादन आदेशों की अनुमति देता है। यह किसी व्यक्ति को “ऑब्जेक्ट हटाएं” टाइप करता है और एक ड्राइंग टूल के साथ स्ट्रीटलाइट का चयन करता है जो फिर गायब हो जाता है (हमारे परीक्षण से, रनवे पहले से ही अपने “इनपेंटिंग” टूल का उपयोग करके मिश्रित परिणामों के साथ एक समान प्रभाव कर सकता है)। प्रचार वीडियो स्थिर प्रसार के समान स्थिर-छवि टेक्स्ट-टू-इमेज पीढ़ी की तरह दिखता है (ध्यान दें कि वीडियो गति में इन उत्पन्न दृश्यों में से किसी को भी चित्रित नहीं करता है) और टेक्स्ट ओवरले, चरित्र मास्किंग (इसकी “ग्रीन स्क्रीन का उपयोग करके) प्रदर्शित करता है “सुविधा, जो पहले से ही रनवे में मौजूद है), और बहुत कुछ।

वीडियो जनरेशन वादे एक तरफ, रनवे के टेक्स्ट टू वीडियो घोषणा के बारे में जो सबसे नया लगता है वह टेक्स्ट-आधारित कमांड इंटरफ़ेस है। वीडियो संपादक भविष्य में प्राकृतिक भाषा संकेतों के साथ काम करना चाहते हैं या नहीं, यह देखा जाना बाकी है, लेकिन प्रदर्शन से पता चलता है कि वीडियो उत्पादन उद्योग में लोग सक्रिय रूप से भविष्य की ओर काम कर रहे हैं जिसमें वीडियो को संश्लेषित करना या संपादित करना कमांड लिखना जितना आसान है।

रनवे का वेब-आधारित वीडियो संपादक पहले से ही एआई का उपयोग वस्तुओं को मुखौटा बनाने के लिए करता है "हरा पर्दा" प्रभाव।
बड़े आकार में / रनवे का वेब-आधारित वीडियो संपादक पहले से ही “ग्रीन स्क्रीन” प्रभाव बनाने के लिए वस्तुओं को मास्क करने के लिए एआई का उपयोग करता है।

एआरएस टेक्निका

रॉ एआई-आधारित वीडियो पीढ़ी (कभी-कभी “टेक्स्ट2वीडियो” कहा जाता है) इसकी उच्च कम्प्यूटेशनल मांगों और मेटाडेटा के साथ एक बड़े ओपन-वीडियो प्रशिक्षण सेट की कमी के कारण एक आदिम स्थिति में है जो वीडियो-पीढ़ी के मॉडल के बराबर प्रशिक्षित कर सकता है लायोन-5बी स्थिर छवियों के लिए। सबसे होनहार सार्वजनिक टेक्स्ट2वीडियो मॉडल में से एक, जिसे कहा जाता है कॉगवीडियो, तड़का हुआ फ्रेम दर के साथ कम रिज़ॉल्यूशन में सरल वीडियो उत्पन्न कर सकता है। लेकिन टेक्स्ट-टू-इमेज मॉडल की आदिम स्थिति को देखते हुए अभी एक साल पहले बनाम आजअगले कुछ वर्षों में सिंथेटिक वीडियो निर्माण की गुणवत्ता में छलांग और सीमा से वृद्धि की उम्मीद करना उचित प्रतीत होता है।

रनवे एक वेब-आधारित वाणिज्यिक उत्पाद के रूप में उपलब्ध है जो Google क्रोम ब्राउज़र में मासिक शुल्क पर चलता है, जिसमें लगभग के लिए क्लाउड स्टोरेज शामिल है $35 प्रति वर्ष. लेकिन टेक्स्ट टू वीडियो फीचर बंद “अर्ली एक्सेस” टेस्टिंग में है, और आप प्रतीक्षा सूची के लिए साइन अप कर सकते हैं रनवे की वेबसाइट.

amar-bangla-patrika