Home / CG Business / OpenAI’s AI Voice Agents Now Have Emotions: They Can Be Sympathetic, Storytellers – Trak.in

CG Business

OpenAI’s AI Voice Agents Now Have Emotions: They Can Be Sympathetic, Storytellers – Trak.in

22 March 2025 08:17

Contents

सुपीरियर स्पीच-टू-टेक्स्ट सटीकता बढ़ाया पाठ-से-भाषण क्षमता डेवलपर अभिगम और एकीकरण भविष्य की संभावनाओं

वॉयस टेक्नोलॉजी के लिए एक बड़ी प्रगति में, ओपनई बेहतर के साथ वॉयस एजेंटों को ऊंचा करने के लिए डिज़ाइन किए गए ऑडियो मॉडल का एक नया सूट पेश किया है भाषण से पाठ और भाषण के पाठ क्षमताओं। दुनिया भर में डेवलपर्स अब इन मॉडलों को होशियार, अधिक अनुकूलनीय वॉयस एप्लिकेशन बनाने के लिए एक्सेस कर सकते हैं।

Openai के AI वॉयस एजेंटों में अब भावनाएं हैं: वे सहानुभूतिपूर्ण, कहानीकार हो सकते हैं

सुपीरियर स्पीच-टू-टेक्स्ट सटीकता

नया लॉन्च किया गया GPT-4O- ट्रांसक्राइब करें और GPT-4O-MINI-TRANSCRIBE मॉडल सेट ए भाषण मान्यता के लिए उच्च बेंचमार्क। Openai के पिछले की तुलना में फुसफुसाना मॉडल, वे विविध वातावरणों में बेहतर सटीकता प्रदान करते हैं, प्रभावी रूप से हैंडलिंग:

शोरगुल की पृष्ठभूमि
प्रादेशिक उच्चारण
अलग -अलग भाषण गति

ये प्रगति मॉडल को वास्तविक दुनिया के अनुप्रयोगों के लिए आदर्श बनाती हैं कॉल सेंटर ऑटोमेशन, बैठक प्रतिलेखनऔर आवाज-सक्षम आभासी सहायक।

बढ़ाया पाठ-से-भाषण क्षमता

की शुरूआत GPT-4O-MINI-TTS मॉडल टेक्स्ट-टू-स्पीच तकनीक में महत्वपूर्ण सुधार लाता है। विशेष रूप से, यह असाधारण प्रदान करता है आवाज की अचलता। डेवलपर्स अनुकूलित कर सकते हैं कि एआई कैसे बोलता है, इसे विभिन्न टन और शैलियों के लिए सिलाई करता है, जिसमें शामिल हैं:

सहानुभूति ग्राहक सेवा प्रतिनिधि
संलग्न कहानीकार
पेशेवर कथाकार

जबकि वर्तमान संस्करण केवल कृत्रिम आवाज़ों का समर्थन करता है, Openai ने परिचय देने की योजना बनाई है कस्टम आवाज विकल्प भविष्य के अपडेट में।

डेवलपर अभिगम और एकीकरण

डेवलपर्स इन नए मॉडल का उपयोग करके मूल रूप से एकीकृत कर सकते हैं ओपनई के एपीआई। मौजूदा पाठ-आधारित एआई सिस्टम के साथ सरलीकृत ऑनबोर्डिंग और संगतता के साथ, व्यवसाय आसानी से अपने वॉयस एप्लिकेशन को बढ़ा सकते हैं। इसके अलावा, Openai का उन्नत आसवन तकनीक गुणवत्ता से समझौता किए बिना कुशल प्रदर्शन सुनिश्चित करें।

भविष्य की संभावनाओं

Openai का उद्देश्य इन ऑडियो मॉडल की क्षमताओं का विस्तार करना है बहुमूत्र अनुप्रयोग दोनों को शामिल करना आवाज और वीडियो। यह अगला कदम उद्योगों में उपयोगकर्ताओं के लिए और भी अधिक इमर्सिव अनुभव प्रदान करेगा।

इन उन्नत ऑडियो मॉडल का लॉन्च AI- संचालित वॉयस तकनीक में एक महत्वपूर्ण कदम है, जो व्यवसायों और डेवलपर्स के लिए नई संभावनाओं को अनलॉक करता है।

छवि स्रोत

Source link

Tagged:Agents Emotions OpenAIs Storytellers Sympathetic Trak.in Voice

SatyapalWebsite Manager

I am an Engineer and a passionate Blogger, who loves to share topics on Chhattisgarh Bollywood Chollywood news, and love share a quick update of chhattisgarhi Films, Chhattisgarh Actors-Actress News, Chhattisgarh Related Information