Google DeepMind ने Genie 2 AI मॉडेलचे अनावरण केले, AI एजंटना प्रशिक्षित करण्यासाठी प्ले करण्यायोग्य 3D वर्ल्ड व्युत्पन्न करू शकते

Google DeepMind ने बुधवारी जिनी आर्टिफिशियल इंटेलिजेंस (AI) मॉडेलच्या उत्तराधिकारीचे अनावरण केले, जे अंतहीन 2D गेम वर्ल्ड व्युत्पन्न करू शकते. Genie 2 डब केलेले, नवीन AI मॉडेल सिंगल इमेज प्रॉम्प्टवर आधारित अद्वितीय क्रिया-नियंत्रित, खेळण्यायोग्य 3D वातावरण निर्माण करण्यास सक्षम आहे. Genie 2 ला AI “जागतिक मॉडेल” म्हणून संबोधून, कंपनीने सांगितले की ते सातत्यपूर्ण वस्तूंसह एक मिनिटापर्यंतचे वातावरण निर्माण करू शकते. कंपनीने म्हटले आहे की हे व्युत्पन्न केलेले जग मानवाद्वारे खेळले जाऊ शकते किंवा एआय एजंटना प्रशिक्षण देण्यासाठी वापरले जाऊ शकते.

Google DeepMind ने Genie 2 AI मॉडेलचे अनावरण केले

मध्ये अ ब्लॉग पोस्टकंपनीने नवीन AI मॉडेल आणि त्याच्या क्षमतांची तपशीलवार माहिती दिली. जरी त्याचे पूर्ववर्ती केवळ 2D प्लॅटफॉर्मर गेमसाठी गेम वर्ल्ड तयार करू शकत होते, तर Genie 2 AI मॉडेल सुसंगत मॉडेलसह पूर्ण 3D जग तयार करू शकते ज्यांच्याशी संवाद साधला जाऊ शकतो. याचा अर्थ मानव किंवा AI एजंट या वातावरणात चालणे, धावणे, पोहणे, चढणे आणि अधिक क्रिया करू शकतात.

Genie 2 ची जनरेटिव्ह क्षमता त्यास मार्ग, इमारती आणि ऑब्जेक्ट्स व्युत्पन्न करण्यास अनुमती देते जे इनपुट इमेजमध्ये दिसू शकत नाहीत. हे घटक सुरवातीपासून मॉडेलद्वारे डिझाइन आणि प्रस्तुत केले आहेत. याव्यतिरिक्त, फाउंडेशन मॉडेल या वातावरणात सातत्य राखण्यास सक्षम आहे. याचा अर्थ जेव्हा एखादा खेळाडू एका क्षेत्रापासून दूर जातो आणि परत येतो तेव्हाही वातावरण सारखेच राहते.

याशिवाय, जिनी 2 प्रथम-व्यक्ती दृश्ये, सममितीय दृश्ये किंवा तृतीय-व्यक्ती दृश्ये यासारखे भिन्न दृष्टीकोन निर्माण करण्यास सक्षम आहे. पुढे, वापरकर्ते व्युत्पन्न केलेल्या जगातील वस्तूंशी संवाद साधू शकतात आणि दार उघडणे, फुगा फोडणे किंवा शिडी चढणे यासारख्या क्रिया करू शकतात. मॉडेलला पाण्याचे तरंग, धूर, गुरुत्वाकर्षण, दिशात्मक प्रकाश, प्रतिबिंब आणि बरेच काही यासारखे भौतिकशास्त्र-संबंधित प्रभाव निर्माण करण्यासाठी देखील सूचित केले जाऊ शकते.

तांत्रिक तपशीलांकडे येत असताना, DeepMind ने स्पष्ट केले की Genie 2 हे ऑटोरेग्रेसिव्ह लेटेंट डिफ्यूजन मॉडेल आहे आणि त्याला मोठ्या व्हिडिओ डेटासेटवर प्रशिक्षित केले गेले आहे. ट्रान्सफॉर्मर आर्किटेक्चरमध्ये ऑटोएनकोडर देखील समाविष्ट आहे जे या जगाची फ्रेम-बाय-फ्रेम निर्मिती सक्षम करते.

उल्लेखनीय म्हणजे, DeepMind ने या वर्षाच्या सुरुवातीला स्केलेबल इंस्ट्रक्टेबल मल्टीवर्ल्ड एजंट किंवा SIMA डब केलेले AI मॉडेल देखील जारी केले, जे मूलत: 3D जगामध्ये एजंटिक AI कार्य करण्यास सक्षम आहे. कंपनीचे म्हणणे आहे की Genie 2 समान एआय एजंटना अद्वितीय वातावरण प्रदान करण्यास आणि त्यांना विविध वास्तविक जीवनातील परिस्थितींसाठी प्रशिक्षण देण्यास सक्षम आहे.

जागतिक मॉडेल अद्वितीय वातावरण निर्माण करू शकत असल्याने, Google म्हणते की यामुळे डेटा दूषित होण्याचा धोका दूर होईल आणि विकासकांना AI एजंटच्या क्षमतेचे अचूक मूल्यांकन करण्याची परवानगी मिळेल.

Source link

Join WhatsApp

Join Now

Leave a Comment