झोंगगुआनकुन फोरम 2024 में चीन ने एक नए एआई मॉडल को लॉन्च किया है जिसकी आजकल खूब चर्चा हो रही है। चीन ने देश का पहला टेक्स्ट टू वीडियो एआई मॉडल विदु को लॉन्च किया है जिसे लेकर यह कहा जा रहा है कि यह ओपनएआई के सोरा को टक्कर दे सकता है। यह एक साधारण से प्रॉम्प्ट के जरिए बहुत ही शानदार और रियल लाइफ जैसे वीडियो बना सकता है।
चाइना डेली की एक रिपोर्ट के अनुसार, विदु को चीनी एआई फर्म शेंगशु टेक्नोलॉजी और सिंघुआ यूनिवर्सिटी ने विकसित किया है जो एक आसान से प्रॉम्प्ट के जरिए 16 सेकेंड के छोटे क्लिप को 1080 पिक्सल के हाई-डेफिनिशन में तैयार करने में समर्थ है। ऐसे में आइए जान लेते हैं कि विदु की क्या है खूबियां और यह कैसे काम करता है।
विदु की खूबियां
मार्केट टेक पोस्ट के मुताबिक, विदु एकदम से रियल में दिखने वाले वीडियो को बनाता है जिसमें लोगों के चेहरे के भावनाओं से लेकर क्लिप में दिखने वाली चीजों पर कैसी रौशनी पड़नी चाहिए, इसका भी इसको बहुत ही अच्छे से जानकारी है।
रिपोर्ट में कहा गया है कि इसकी प्रमुख तकनीक यूनिवर्सल विजन ट्रांसफार्मर (यू-वीआईटी) है। ये ट्रांसफार्मर और डिफ्यूजन मॉडल को जोड़कर वीडियो को तैयार करता है जिसमें यह बताना मुश्किल हो जाता है कि यह रियल वीडियो है या फिर किसी एआई से जेनरेट किया हुआ है।
ग्लोबल टाइम्स के अनुसार, कुछ मीडिया संस्थानों ने यह दावा किया है कि विदु को इस तरीके से ट्रेंड किया गया है कि वह चीनी संस्कृति को अच्छे से समझ कर उस हिसाब से वीडियो जेनरेट कर सकता है।
दावा यह भी है कि वह अपने वीडियो में उन चीजों को भी बहुत ही आसानी से शामिल कर सकता है जैसे पांडा और पौराणिक लूंग (ड्रैगन) जो चीनी संस्कृति के लिए बहुत ही खास माने जाते हैं। विदु के लिए ये अच्छी बात है क्योंकि इस कारण चीनी लोग इसे काफी पसंद भी कर सकते हैं।
क्या है ओपनएआई का सोरा
इस साल की शुरुआत में अमेरिका की टेक कंपनी ओपनएआई ने चैटजीपीटी के बाद सोरा जैसे टेक्स्ट टू वीडियो जेनरेटिव एआई मॉडल को लॉन्च किया था। लॉन्च के बाद ओपनएआई ने एक्स प्लेटफॉर्म पर एक पोस्ट किया था और बताया था कैसे सोरा एक प्रॉम्प्ट के जरिए 60 सेकेंड तक का हाई डेफिनिशन वाला वीडियो तैयार कर सकता है।
ओपनएआई ने बताया कि सोरा को बहुत ही डिटेल के साथ शानदार वीडियो जेनरेट करने के लिए ट्रेंड किया गया है। वह कैरेक्टर के चेहरे को भी अच्छे से तैयार कर सकता है और उस पर भावनाओं को भी अच्छे से दर्शा सकता है।
हालांकि यह मॉडल अभी बीटा मोड में है जिसका मतलब यह हुआ है इस पर अभी टेस्टिंग चल रही है और इसका एक्सेस अभी कुछ ही लोगों को दिया गया है। मिंट के अनुसार, ओपनएआई की सीटीओ मीरा मुराती ने कहा है कि इस साल के अंत तक आम यूजर्स सोरा को इस्तेमाल कर पाएंगे।