OpenAI ने अखेरीस सोमवारी सोरा, त्याचे कृत्रिम बुद्धिमत्ता (AI) व्हिडिओ जनरेशन मॉडेल लाँच केले. फेब्रुवारीमध्ये, कंपनीने निवडक व्यक्तींसाठी सोराचे पूर्वावलोकन केले आणि आता, त्याने सोरा टर्बो डब केलेल्या मॉडेलचा एक वेगळा प्रकार रिलीज केला. सोरा 1080p रिझोल्यूशनमध्ये व्हिडिओ तयार करू शकते जे 20 सेकंदांपर्यंतचे असू शकते. एआय मॉडेल स्टँडअलोन प्लॅटफॉर्मवर तैनात केले गेले आहे जे सध्या वेबसाइट म्हणून उपलब्ध आहे. विशेष म्हणजे, सोरा सध्या केवळ ChatGPT च्या सशुल्क सदस्यांसाठी निर्दिष्ट दर मर्यादेसह उपलब्ध आहे.
OpenAI चे Sora AI व्हिडिओ जनरेशन मॉडेल
मध्ये अ ब्लॉग पोस्टएआय फर्मने सोरा लॉन्च करण्याची घोषणा केली आणि मॉडेलच्या क्षमतांची तपशीलवार माहिती दिली. सोरा या वर्षाच्या सुरुवातीला पहिल्यांदा अनावरण करण्यात आले होते आणि मॉडेलला वारंवार विलंब झाला आहे. कंपनीने सांगितले होते की विलंबाचे कारण मॉडेलची सुरक्षा आणि गोपनीयता मापदंड मजबूत करणे आहे.
तथापि, जवळपास नऊ महिन्यांच्या विलंबानंतर, OpenAI ने सोरा ला एक स्वतंत्र प्लॅटफॉर्म म्हणून लॉन्च केले आहे ज्यामध्ये प्रवेश केला जाऊ शकतो. येथेहे सध्या फक्त ChatGPT Plus आणि Pro सदस्यांसाठी उपलब्ध आहे. सदस्यता नसलेले सध्या वेबसाइटवर नवीन खाते तयार करू शकत नाहीत. दरम्यान, प्लस वापरकर्ते दर महिन्याला 480p रिझोल्यूशनवर 50 व्हिडिओ किंवा 720p वर कमी व्हिडिओंपर्यंत मर्यादित आहेत.
ChatGPT प्रो सबस्क्रिप्शन, जे नुकतेच प्रति महिना $200 (अंदाजे रु. 16,970) दराने सादर करण्यात आले होते, ते वापरकर्त्यांना “10 पट अधिक वापर, उच्च रिझोल्यूशन आणि अधिक कालावधी” असलेले व्हिडिओ निर्माण करू देते. तथापि, “कमी व्हिडीओज” प्रमाणेच, कंपनीने उच्च रिझोल्यूशन आणि दीर्घ कालावधीसाठी काय आवश्यक आहे हे निश्चित केले नाही.
सोरा सध्या वाइडस्क्रीन, वर्टिकल आणि स्क्वेअर आस्पेक्ट रेशोमध्ये व्हिडिओ तयार करू शकते. वापरकर्ते व्युत्पन्न केलेल्या व्हिडिओंमध्ये सामग्री विस्तारित करण्यासाठी, रीमिक्स करण्यासाठी आणि मिश्रित करण्यासाठी त्यांचे व्हिडिओ आणि प्रतिमा देखील अपलोड करू शकतात. एआय मॉडेल मजकूर प्रॉम्प्ट वापरून सुरवातीपासून व्हिडिओ तयार करण्यास देखील अनुमती देते. याव्यतिरिक्त, स्टोरीबोर्ड इंटरफेस वापरकर्त्यांना प्रत्येक फ्रेमसाठी विशिष्ट इनपुट सेट करू देतो.
तांत्रिकतेकडे येत असताना, ओपनएआयने स्पष्ट केले की सोरा हे एक प्रसार मॉडेल आहे, जिथे 20-सेकंद कालावधीत सामग्री सातत्य ठेवण्यासाठी एआयकडे एकाच वेळी अनेक फ्रेम्सची दूरदृष्टी असते. एआय मॉडेल ट्रान्सफॉर्मर आर्किटेक्चर वापरते, आणि DALL-E 3 कडून रिकॅप्शनिंग तंत्र घेते.
OpenAI ने मॉडेल डेटाबद्दल तपशील देखील हायलाइट केला. कंपनीने दावा केला आहे की तिने सार्वजनिक डोमेनमधून डेटा भागीदारीद्वारे आणि मॉडेलसह काम करणाऱ्या लोकांकडून डेटाची विस्तृत श्रेणी मिळवली आहे. सार्वजनिक डेटा मशीन लर्निंग डेटासेट आणि वेब क्रॉलमधून संकलित केल्याचे सांगण्यात आले.
कंपनीने Shutterstock Pond5 सोबत भागीदारी केली आणि AI मॉडेलसाठी प्रोप्रायटरी डेटा व्युत्पन्न करण्यासाठी डेटासेट सुरू केले. शेवटी, एआय प्रशिक्षक, रेड टीमर्स आणि कर्मचाऱ्यांकडून सोरासाठी डेटा देखील गोळा केला गेला.
वास्तववादी AI व्हिडिओ जनरेशन मॉडेलशी संबंधित जोखीम कमी करण्यासाठी, ओपनएआय दृश्यमान वॉटरमार्क तसेच मेटाडेटा दोन्ही जोडत आहे, जो कोलिशन फॉर कंटेंट प्रोव्हेन्स अँड ऑथेंटिसिटी (C2PA) ने सेट केलेल्या मानकांनुसार आहे. कंपनीने असा दावा देखील केला आहे की त्यांनी मीडिया अपलोडसाठी मॉडेलमध्ये संरक्षण जोडले आहे ज्यात लोकांचा समावेश आहे.
एआय फर्मने असेही म्हटले आहे की सोराला बाल लैंगिक शोषण आणि लैंगिक डीपफेक यांसारख्या गैरवर्तनाचे हानिकारक प्रकार असलेले व्हिडिओ तयार करण्यापासून अवरोधित केले जाईल. याव्यतिरिक्त, लोक करू शकतील अपलोडची संख्या लॉन्चच्या वेळी मर्यादित असेल.