Home / CG Business / OpenAI’s AI Voice Agents Now Have Emotions: They Can Be Sympathetic, Storytellers – Trak.in

OpenAI’s AI Voice Agents Now Have Emotions: They Can Be Sympathetic, Storytellers – Trak.in

Screenshot 2025 03 22 at 8.16.09 AM


वॉयस टेक्नोलॉजी के लिए एक बड़ी प्रगति में, ओपनई बेहतर के साथ वॉयस एजेंटों को ऊंचा करने के लिए डिज़ाइन किए गए ऑडियो मॉडल का एक नया सूट पेश किया है भाषण से पाठ और भाषण के पाठ क्षमताओं। दुनिया भर में डेवलपर्स अब इन मॉडलों को होशियार, अधिक अनुकूलनीय वॉयस एप्लिकेशन बनाने के लिए एक्सेस कर सकते हैं।

Openai के AI वॉयस एजेंटों में अब भावनाएं हैं: वे सहानुभूतिपूर्ण, कहानीकार हो सकते हैं

सुपीरियर स्पीच-टू-टेक्स्ट सटीकता

नया लॉन्च किया गया GPT-4O- ट्रांसक्राइब करें और GPT-4O-MINI-TRANSCRIBE मॉडल सेट ए भाषण मान्यता के लिए उच्च बेंचमार्क। Openai के पिछले की तुलना में फुसफुसाना मॉडल, वे विविध वातावरणों में बेहतर सटीकता प्रदान करते हैं, प्रभावी रूप से हैंडलिंग:

  • शोरगुल की पृष्ठभूमि
  • प्रादेशिक उच्चारण
  • अलग -अलग भाषण गति

ये प्रगति मॉडल को वास्तविक दुनिया के अनुप्रयोगों के लिए आदर्श बनाती हैं कॉल सेंटर ऑटोमेशन, बैठक प्रतिलेखनऔर आवाज-सक्षम आभासी सहायक

बढ़ाया पाठ-से-भाषण क्षमता

की शुरूआत GPT-4O-MINI-TTS मॉडल टेक्स्ट-टू-स्पीच तकनीक में महत्वपूर्ण सुधार लाता है। विशेष रूप से, यह असाधारण प्रदान करता है आवाज की अचलता। डेवलपर्स अनुकूलित कर सकते हैं कि एआई कैसे बोलता है, इसे विभिन्न टन और शैलियों के लिए सिलाई करता है, जिसमें शामिल हैं:

  • सहानुभूति ग्राहक सेवा प्रतिनिधि
  • संलग्न कहानीकार
  • पेशेवर कथाकार

जबकि वर्तमान संस्करण केवल कृत्रिम आवाज़ों का समर्थन करता है, Openai ने परिचय देने की योजना बनाई है कस्टम आवाज विकल्प भविष्य के अपडेट में।

डेवलपर अभिगम और एकीकरण

डेवलपर्स इन नए मॉडल का उपयोग करके मूल रूप से एकीकृत कर सकते हैं ओपनई के एपीआई। मौजूदा पाठ-आधारित एआई सिस्टम के साथ सरलीकृत ऑनबोर्डिंग और संगतता के साथ, व्यवसाय आसानी से अपने वॉयस एप्लिकेशन को बढ़ा सकते हैं। इसके अलावा, Openai का उन्नत आसवन तकनीक गुणवत्ता से समझौता किए बिना कुशल प्रदर्शन सुनिश्चित करें।

भविष्य की संभावनाओं

Openai का उद्देश्य इन ऑडियो मॉडल की क्षमताओं का विस्तार करना है बहुमूत्र अनुप्रयोग दोनों को शामिल करना आवाज और वीडियो। यह अगला कदम उद्योगों में उपयोगकर्ताओं के लिए और भी अधिक इमर्सिव अनुभव प्रदान करेगा।

इन उन्नत ऑडियो मॉडल का लॉन्च AI- संचालित वॉयस तकनीक में एक महत्वपूर्ण कदम है, जो व्यवसायों और डेवलपर्स के लिए नई संभावनाओं को अनलॉक करता है।

छवि स्रोत






Source link

Tagged: