ओपन एआई के सोरा के तर्ज पर चीन ने तैयार किया देश का पहला टेक्स्ट टू वीडियो एआई मॉडल विदु, जानें क्या है इसकी खूबियां?

एडिट
On the lines of Sora of Open AI China launched country's first text to video AI model Vidu know features

प्रतिकात्मक फोटो (फोटो- IANS)

झोंगगुआनकुन फोरम 2024 में चीन ने एक नए एआई मॉडल को लॉन्च किया है जिसकी आजकल खूब चर्चा हो रही है। चीन ने देश का पहला टेक्स्ट टू वीडियो एआई मॉडल विदु को लॉन्च किया है जिसे लेकर यह कहा जा रहा है कि यह ओपनएआई के सोरा को टक्कर दे सकता है। यह एक साधारण से प्रॉम्प्ट के जरिए बहुत ही शानदार और रियल लाइफ जैसे वीडियो बना सकता है।

चाइना डेली की एक रिपोर्ट के अनुसार, विदु को चीनी एआई फर्म शेंगशु टेक्नोलॉजी और सिंघुआ यूनिवर्सिटी ने विकसित किया है जो एक आसान से प्रॉम्प्ट के जरिए 16 सेकेंड के छोटे क्लिप को 1080 पिक्सल के हाई-डेफिनिशन में तैयार करने में समर्थ है। ऐसे में आइए जान लेते हैं कि विदु की क्या है खूबियां और यह कैसे काम करता है।

विदु की खूबियां

मार्केट टेक पोस्ट के मुताबिक, विदु एकदम से रियल में दिखने वाले वीडियो को बनाता है जिसमें लोगों के चेहरे के भावनाओं से लेकर क्लिप में दिखने वाली चीजों पर कैसी रौशनी पड़नी चाहिए, इसका भी इसको बहुत ही अच्छे से जानकारी है।

रिपोर्ट में कहा गया है कि इसकी प्रमुख तकनीक यूनिवर्सल विजन ट्रांसफार्मर (यू-वीआईटी) है। ये ट्रांसफार्मर और डिफ्यूजन मॉडल को जोड़कर वीडियो को तैयार करता है जिसमें यह बताना मुश्किल हो जाता है कि यह रियल वीडियो है या फिर किसी एआई से जेनरेट किया हुआ है।

ग्लोबल टाइम्स के अनुसार, कुछ मीडिया संस्थानों ने यह दावा किया है कि विदु को इस तरीके से ट्रेंड किया गया है कि वह चीनी संस्कृति को अच्छे से समझ कर उस हिसाब से वीडियो जेनरेट कर सकता है।

दावा यह भी है कि वह अपने वीडियो में उन चीजों को भी बहुत ही आसानी से शामिल कर सकता है जैसे पांडा और पौराणिक लूंग (ड्रैगन) जो चीनी संस्कृति के लिए बहुत ही खास माने जाते हैं। विदु के लिए ये अच्छी बात है क्योंकि इस कारण चीनी लोग इसे काफी पसंद भी कर सकते हैं।

क्या है ओपनएआई का सोरा

इस साल की शुरुआत में अमेरिका की टेक कंपनी ओपनएआई ने चैटजीपीटी के बाद सोरा जैसे टेक्स्ट टू वीडियो जेनरेटिव एआई मॉडल को लॉन्च किया था। लॉन्च के बाद ओपनएआई ने एक्स प्लेटफॉर्म पर एक पोस्ट किया था और बताया था कैसे सोरा एक प्रॉम्प्ट के जरिए 60 सेकेंड तक का हाई डेफिनिशन वाला वीडियो तैयार कर सकता है।

ओपनएआई ने बताया कि सोरा को बहुत ही डिटेल के साथ शानदार वीडियो जेनरेट करने के लिए ट्रेंड किया गया है। वह कैरेक्टर के चेहरे को भी अच्छे से तैयार कर सकता है और उस पर भावनाओं को भी अच्छे से दर्शा सकता है।

हालांकि यह मॉडल अभी बीटा मोड में है जिसका मतलब यह हुआ है इस पर अभी टेस्टिंग चल रही है और इसका एक्सेस अभी कुछ ही लोगों को दिया गया है। मिंट के अनुसार, ओपनएआई की सीटीओ मीरा मुराती ने कहा है कि इस साल के अंत तक आम यूजर्स सोरा को इस्तेमाल कर पाएंगे।

यह भी पढ़ें
Here are a few more articles:
Read the Next Article