यदि आप एक ऑडियोबुक के प्रशंसक हैं, तो Apple ने AI-नैरेटेड पुस्तकों के अपने पहले बैच को लॉन्च करके आपको भविष्य का स्वाद दिया है। लेकिन जब यह कदम बड़े प्रभाव के साथ एक आकर्षक है, तो कथाकारों के रोबोटिक स्वर दिखाते हैं कि कुछ समय के लिए बहुत पसंद की जाने वाली मानवीय आवाज़ें आसपास होंगी।
आप Apple Books ऐप में ‘AI कथन’ की खोज करके AI-आवाज़ वाले ऑडियोबुक पा सकते हैं, जो टेक्स्ट-टू-स्पीच अनुवाद का उपयोग करते हैं। यह रोमांस या फिक्शन किताबों (दोनों मुफ्त और भुगतान के लिए) की एक सूची लाता है जो “एप्पल बुक्स द्वारा वर्णित” विवरण के साथ आता है।
ऐप्पल बुक्स दो प्रकार की एआई आवाज प्रदान करता है – मैडिसन नामक एक सोप्रानो और जैक्सन नामक बैरिटोन आवाज – जिसमें दोनों अमेरिकी उच्चारण हैं और वर्तमान में केवल अंग्रेजी में बोलते हैं। आप ऐप्पल बुक्स-वर्णित शीर्षकों में से किसी एक के तहत ‘पूर्वावलोकन’ बटन पर टैप करके उनकी आवाज़ का स्वाद ले सकते हैं।
अभी, निस्संदेह Apple की दोनों AI आवाजों में एक रोबोटिक, कृत्रिम गुणवत्ता है। आप जल्द ही स्टीफन फ्राई या जूलिया व्हेलन जैसे लोकप्रिय कथाकारों के गर्म, अभिव्यंजक स्वरों के लिए उन्हें गलत नहीं समझेंगे। लेकिन एआई कथाकारों को पार करने के लिए अनजान घाटी एक कठिन बाधा बनी हुई है, वे निस्संदेह हमारे कानों के लिए एक तेज़ ट्रैक पर हैं।
सहज रूप में, सेब कहते हैं (नए टैब में खुलता है) इसकी एआई आवाजों को ऑडियोबुक को “सभी के लिए अधिक सुलभ” बनाने के लिए विकसित किया गया है। लेकिन वे बहु-अरब डॉलर के ऑडियोबुक उद्योग को तकनीकी दिग्गज के लिए अधिक सुलभ बनाते हैं। और नई ऐप्पल बुक्स सुविधा अमेज़ॅन की पसंद के साथ एक भयंकर लड़ाई की शुरुआत है और हमारे ऑडियोबुक-प्रेमी कानों के लिए स्पॉटिफी है।
चिंता व्यक्त करना
अभी के लिए, हम ज्यादातर एआई कथाकारों को छोटे स्वतंत्र प्रकाशकों की पुस्तकों तक सीमित देखेंगे। यह सभी उपकरणों पर पाठकों के लिए उपलब्ध ऑडियो पुस्तकों की संख्या में विस्फोट कर सकता है, क्योंकि डिजिटल कथन प्रकाशकों और लेखकों के लिए एक नया बाजार खोलता है जो पहले प्रिंट से ऑडियो तक की छलांग लगाने में असमर्थ थे।
लेकिन बड़े प्रकाशकों और वॉयस एक्टर्स से पुशबैक भी रोबो-नैरेटर्स के उदय को धीमा कर सकता है। अमेज़ॅन के किंडल ई-रीडर्स ने कई साल पहले आधिकारिक तौर पर अपनी टेक्स्ट-टू-स्पीच शक्तियों को खो दिया था, भले ही एक्सेसिबिलिटी मेनू में वर्कअराउंड हो। यह निर्णय कम से कम आंशिक रूप से कॉपीराइट मुद्दों और ऑडियो पुस्तकों को कानूनी रूप से कला के विशिष्ट टुकड़ों के रूप में माना जा रहा था।
अमेज़ॅन के स्वामित्व वाली श्रव्य भी है लम्बाई में लिखा है (नए टैब में खुलता है) कौन से वर्णनकर्ता विभिन्न प्रकार की पुस्तकों के अनुकूल हैं और कैसे प्रकाशक सही पुस्तकों का चयन करते हैं। इसके ब्लॉग का कहना है कि “ऑडियोबुक्स के मामले में सबसे महत्वपूर्ण पहलू यह है कि आवाज पुस्तक के स्वर और शैली से मेल खाती है”। यदि Apple Books की तरह, आपके पास केवल दो आवाज़ें हैं, तो इसे प्राप्त करना कुछ कठिन है।
ऑडिबल का यह भी कहना है कि “अनुभवी वॉयस एक्टर्स पिच, इंटोनेशन, वॉल्यूम और एक्सेंट के साथ खेलकर मुखर विशेषताओं के बीच बहुत आसानी से अंतर करने में सक्षम होते हैं”, और यह निश्चित रूप से एआई वॉयस एक्टर्स को कुछ गहन मुखर प्रशिक्षण करने की आवश्यकता होती है, और शायद कुछ लेने की भी भावनात्मक मिररिंग में रात की कक्षाएं।
लेकिन नई ऐप्पल बुक्स सुविधा स्पष्ट रूप से एआई वॉयस टेक्नोलॉजी में एक अपरिहार्य उछाल की शुरुआत है। और ऑडियोबुक के लिए वास्तव में बड़ा क्षण तब हो सकता है जब एआई, रोबोटिक रूप से एक स्क्रिप्ट पढ़ने के बजाय, एक प्रसिद्ध आवाज अभिनेता का प्रतिरूपण कर सकता है – एक छलांग जो बहुत दूर नहीं हो सकती है, अमेज़ॅन की पसंद से हाल के शोकेस के आधार पर।
नकली साम्राज्य
आखिरकार, डीपफेक केवल सिंथेटिक के भयावह रूप से आश्वस्त करने वाले वीडियो तक ही सीमित नहीं हैं मॉर्गन फ़्रीमैन (नए टैब में खुलता है) या टॉम क्रूज (नए टैब में खुलता है) – एआई-संचालित वॉयस तकनीक भी तेजी से विकसित हो रही है।
वायरल वेब ऐप्स जैसे उबेरडक (नए टैब में खुलता है) आप पिछले साल के दौरान पिछले राष्ट्रपतियों या कार्टून पात्रों की आवाज में भाषण उत्पन्न करते हैं अमेज़न ने दिखाया (नए टैब में खुलता है) एक हल्का भयानक नया एलेक्सा कौशल जो अपनी दादी की आवाज में एक बच्चे को द विजार्ड ऑफ ओज़ पढ़ सकता है।
पसंद के साथ गूगल वेवनेट (नए टैब में खुलता है) साथ ही तकनीक को आगे बढ़ा रहे हैं, एआई की आवाजें केवल और अधिक ठोस होती जा रही हैं। अभी के लिए, ऑडियोबुक्स में व्यापक रूप से अपनाने की बाधाएं तकनीकी के बजाय अधिक कानूनी और नैतिक होंगी। लेकिन ऐप्पल बुक्स के कृत्रिम कथाकार हमारे सिंथेटिक भविष्य की आवाज हैं – और बहुत दूर के भविष्य में, प्रसिद्ध आवाज कथाकार कॉपीराइट की संभावना रखते हैं और अपनी आवाजों को भी लाइसेंस देते हैं।
अभी के लिए, ऐप्पल बुक्स में सबूत बताते हैं कि ये एआई आवाज वर्तमान में भावनात्मक कहानी कहने के बजाय गैर-फिक्शन और तथ्यात्मक कार्यों के लिए सबसे उपयुक्त हैं। उपन्यासों के लिए, फिल्मों की तरह, हम अभी भी कृत्रिम अभिनेताओं से कुछ दूर हैं जो रोबोटिक मोड़ या फ्लैट नोट के साथ रहस्य को बर्बाद किए बिना हमारे दिल के तार को दृढ़ता से खींचने में सक्षम हैं। लेकिन एआई ऑडियोबुक्स की एक धार निश्चित रूप से आ रही है, परवाह किए बिना।