व्हॉइस असिस्टंट म्हणजे काय? गुगलची मीना आणि अलेक्सा-सिरीमध्ये फरक काय?

ॲपलने ‘सिरी’ बाजारात आणली तेव्हा लोकांसाठी 'असिस्टंट' ही संकल्पनाच नवीन होती. सिरी लगेचच प्रसिद्ध झाली. सिरीनंतर ॲमेझोनची ॲलेक्सा आली. इथपर्यंत लोकांच्या अपेक्षा चांगल्याच वाढल्या होत्या. गाणी लावणं, हवामानाची माहिती मिळवणं यासोबतच लोकांना आपल्या असिस्टंटशी माणसांप्रमाणे संवाद साधायचा होता. हे सिरी आणि ॲलेक्सामध्ये किंवा मायक्रोसॉफ्टच्या कोर्टानामध्ये मिळत नव्हतं. ही कमतरता कदाचित गुगल भरून काढणार आहे.
नाही म्हणायला गुगलनेही गुगल असिस्टंट बाजारात आणला आहे, पण गुगलला त्याहून चांगली सर्व्हिस द्यायची आहे. म्हणून त्यांनी ‘मीना’ नावाची नवीन असिस्टंट तयार केली आहे.
इतर वर्च्युअल असिस्टंट आणि ‘मीना’मध्ये काय फरक आहे ?
मीना हे एक चॅटबॉट असिस्टंट असणार आहे. म्हणजेच चॅट-गप्पा मारणारं सॉफ्टवेअर. ॲलेक्सा किंवा सिरीला तुम्ही सांगितलेलं काम फक्त करायचं असतं, त्यामुळं तुमच्या वाक्यातले नेमके शब्द घेतले, तरी त्या काम करु शकतात. पण गप्पा अशा नसतात ना राव!! गप्पा मारताना आपण कधी विनोद करतो, कधी उपरोध असतो, थोडक्यात, आपण आपली भाषा आपल्याला हवी तशी वाकवतो. साहजिकच, गप्पा मारणाऱ्या या सॉफ्टवेअरला भाषा, त्यातले शब्द, तिचं व्याकरण हे सगळं जरा जास्त चांगलं माहित असणं अपेक्षित असतं. त्यामुळे चॅटबॉट तयार करणं हे नुसतं बोलण्याचं काम नव्हे!!
तांत्रिक भाषेत सांगायचं तर, चॅटबॉट हे कृत्रिम बुद्धिमत्ता म्हणजेच आर्टिफिशियल इंटेलिजन्स असलेलं सॉफ्टवेअर असतं. गुगलने तयार केलेल्या नव्या चॅटबॉटमध्ये न्युरल नेटवर्क असणार आहे. त्यात २६० कोटी मापदंड (parameter ) बसवण्यात आले असून एंड टू एंड कार्यप्रणाली असेल. म्हणजे युझर आणि असिस्टंट यांच्यात तिसऱ्या कोणाचाही हस्तक्षेप नसेल. हो, पण मराठीत याचा अर्थ काय?
आपल्या मेंदूत अनेक पेशी असतात. जीवशास्त्रात त्यांना न्यूरॉन्स म्हणतात. आपल्या मेंदूत या न्यूरॉन्सचं जाळं असतं आणि ते शरीरातल्या वेगवेगळ्या ठिकाणांना जोडलेलं असतं. म्हणजे, हाताला चटका लागला, की मेंदू हात मागे घेण्याची सूचना देतो तेव्हा हातातल्या संवेदना मेंदूत पोचलेल्या असतात, मेंदूतले काही न्यूरॉन्स चटका-त्याची तीव्रता याची आकडेमोड करतात, त्यानुसार पुढचे न्यूरॉन्स हात मागे घेण्याची सूचना करतात, पण तेव्हाच हात मागे घेताना आजूबाजूची एखादी वस्तू हाताला इजा पोचवेल असे वाटल्यास डोळ्यांकडून इतर न्यूरॉन्सला तशी महिती मिळते आणि हाताला त्याबरहुकूम सूचना इतर न्यूरॉन्सकडून मिळते.
थोडक्यात, मेंदूत या कोट्यावधी न्यूरॉन्सचं जाळं असतं आणि ते एकमेकांना असंख्यप्रकारे जोडले गेलेले असतात. कोणताही निर्णय घेण्यासाठी मेंदूला आपल्या नकळत असंख्य गोष्टींबद्दल महिती पुरवली जाते आणि ती वेगवेगळ्या प्रकारे, वेगवेगळ्या मापदंडांवर पारखली जाऊन मेंदू आपला निर्णय घेतो. या मीनामध्ये कृत्रिम न्यूरॉन्सचं जाळं आहे आणि आपल्या गप्पा तिला कळाव्यात यासाठी तिला २६० कोटी मापदंड शिकवले गेलेले आहेत.
मीनाला ४००० कोटी शब्द शिकवले गेले आहेत. युझरशी संवाद साधण्यासाठी पब्लिक डोमेन आणि सोशल मिडियावरून माहिती गोळा केली जाईल असं कंपनी सांगतेय. या माहितीच्या आधारे युझर म्हणजेच वापरकर्त्याशी आणखी चांगल्याप्रकारे, वेगवेगळ्या विषयांवर आणि अचूक शब्दात संवाद साधला जाईल. गुगलचा दावा आहे की मीना सध्याच्या कोणत्याही वॉईस असिस्टंटपेक्षा चांगली आहे. या दाव्याबद्दल सांगताना गुगलने एक उदाहरण दिलंय. ते उदाहरण असं की संभाषणाच्या क्षमतेबद्दल मीना ही माणसांइतकीच चांगली आहे. संवेदनशीलता आणि सरासरी विशिष्टता (SSA )च्या परीक्षेत माणसांनी ८६ टक्के गुण मिळवले, तर मीनाने पहिल्याच प्रयत्नात ७६ टक्के गुण मिळवले आहेत.
खरं तर प्रत्येक कंपनीची कृत्रिम बुद्धिमत्ता चाचणीची स्वतःची एक पद्धत असते. गुगलचं म्हणणं आहे की इतर कंपन्यांच्या कृत्रिम बुद्धिमत्ता असलेल्या असिस्टंटना मुलभूत ज्ञान आणि समज नसते. त्यामुळे विचारलेल्या प्रश्नांना निश्चित आणि स्पष्ट उत्तरे मिळत नाहीत. मीना या सर्व कमतरता पूर्ण करणारी आहे.
तर मंडळी, कृत्रिम बुद्धिमत्ता असलेल्या मशीनशी बोलायला आवडेल की खऱ्याखुऱ्या माणसांशी बोलायला जास्त आवडेल? तुमची निवड काय?निवड काहीही असो, कधीकधी या असिस्टंटशी गप्पा मारायला जाम मज्जा येते हो..