ह्यूमने एआय व्हॉइस कस्टमायझेशनसाठी इंटरप्रिटेबिलिटी-आधारित व्हॉइस कंट्रोल वैशिष्ट्य सादर केले आहे

Published On: December 4, 2024 3:02 am

न्यू यॉर्क स्थित आर्टिफिशियल इंटेलिजेंस (AI) फर्म ह्यूमने सोमवारी एका नवीन साधनाचे अनावरण केले जे वापरकर्त्यांना AI आवाज सानुकूलित करण्यास अनुमती देईल. डब केलेले व्हॉईस कंट्रोल, हे नवीन वैशिष्ट्य विकसकांना त्यांच्या चॅटबॉट्स आणि इतर एआय-आधारित अनुप्रयोगांमध्ये हे आवाज एकत्रित करण्यात मदत करण्याच्या उद्देशाने आहे. व्हॉईसची मोठी श्रेणी ऑफर करण्याऐवजी, कंपनी आवाजांच्या 10 वेगवेगळ्या आयामांवर ग्रॅन्युलर कंट्रोल ऑफर करते. प्रत्येक परिमाणात इच्छित पॅरामीटर्स निवडून, वापरकर्ते त्यांच्या ॲप्ससाठी अद्वितीय आवाज व्युत्पन्न करू शकतात.

कंपनीने नवीन एआय टूलची तपशीलवार माहिती दिली आहे ब्लॉग पोस्टह्यूमने सांगितले की एंटरप्राइझना त्यांच्या ब्रँड ओळखीशी जुळण्यासाठी योग्य AI आवाज शोधण्याच्या समस्येचे निराकरण करण्याचा प्रयत्न करत आहे. या वैशिष्ट्यासह, वापरकर्ते आवाजाच्या आकलनाचे विविध पैलू सानुकूलित करू शकतात आणि विकासकांना AI-आधारित अनुप्रयोगांसाठी अधिक ठाम, आरामशीर किंवा उत्साही आवाज तयार करण्यास अनुमती देतात.

ह्यूमचे व्हॉइस कंट्रोल सध्या बीटामध्ये उपलब्ध आहे, परंतु प्लॅटफॉर्मवर नोंदणीकृत कोणीही ते प्रवेश करू शकते. गॅझेट्स 360 कर्मचारी सदस्य टूलमध्ये प्रवेश करण्यास आणि वैशिष्ट्याची चाचणी घेण्यास सक्षम होते. लिंग, खंबीरपणा, उत्साह, आत्मविश्वास, उत्साह, अनुनासिकता, आरामशीरपणा, गुळगुळीतपणा, कोमलता आणि घट्टपणा यासह 10 भिन्न परिमाणे विकासक समायोजित करू शकतात.

प्रॉम्प्ट-आधारित कस्टमायझेशन जोडण्याऐवजी, कंपनीने प्रत्येक मेट्रिक्ससाठी -100 ते +100 पर्यंत एक स्लाइडर जोडला आहे. कंपनीने म्हटले आहे की आवाजाच्या मजकूर वर्णनाशी संबंधित अस्पष्टता दूर करण्यासाठी आणि भाषांवर बारीक नियंत्रण देण्यासाठी हा दृष्टीकोन घेतला गेला आहे.

आमच्या चाचणीमध्ये, आम्हाला आढळले की दहा परिमाणांपैकी कोणतेही बदल केल्याने एआय व्हॉईसमध्ये एक श्रवणीय फरक पडतो आणि हे टूल वेगवेगळ्या परिमाणे योग्यरित्या सोडवण्यास सक्षम होते. एआय फर्मने असा दावा केला आहे की हे एक नवीन “अनियंत्रित दृष्टीकोन” विकसित करून साध्य केले गेले आहे जे विशिष्ट पॅरामीटर्स भिन्न असताना प्रत्येक बेस व्हॉइसची बहुतेक वैशिष्ट्ये संरक्षित करते. विशेष म्हणजे, ह्यूमने प्राप्त केलेल्या डेटाच्या स्रोताचा तपशील दिला नाही.

विशेष म्हणजे, एआय व्हॉईस तयार केल्यानंतर, डेव्हलपरना त्याचे एम्पॅथिक व्हॉइस इंटरफेस (ईव्हीआय) एआय मॉडेल कॉन्फिगर करून ते ॲप्लिकेशनमध्ये तैनात करावे लागेल. कंपनीने निर्दिष्ट केले नसताना, या प्रायोगिक वैशिष्ट्यासाठी EVI-2 मॉडेलचा वापर केला गेला होता.

भविष्यात, ह्यूमने बेस व्हॉईसची श्रेणी वाढवण्याची, अतिरिक्त व्याख्या करण्यायोग्य परिमाणे सादर करण्याची, अत्यंत बदलांखाली आवाज वैशिष्ट्यांचे संरक्षण वाढवण्याची आणि आवाज वैशिष्ट्यांचे विश्लेषण आणि कल्पना करण्यासाठी प्रगत साधने विकसित करण्याची योजना आखली आहे.

Source link