व्हॉइस असिस्टंट म्हणजे काय? गुगलची मीना आणि अलेक्सा-सिरीमध्ये फरक काय?

बोभाटा

February 03, 2020

ॲपलने ‘सिरी’ बाजारात आणली तेव्हा लोकांसाठी 'असिस्टंट' ही संकल्पनाच नवीन होती. सिरी लगेचच प्रसिद्ध झाली. सिरीनंतर ॲमेझोनची ॲलेक्सा आली. इथपर्यंत लोकांच्या अपेक्षा चांगल्याच वाढल्या होत्या. गाणी लावणं, हवामानाची माहिती मिळवणं यासोबतच लोकांना आपल्या असिस्टंटशी माणसांप्रमाणे संवाद साधायचा होता. हे सिरी आणि ॲलेक्सामध्ये किंवा मायक्रोसॉफ्टच्या कोर्टानामध्ये मिळत नव्हतं. ही कमतरता कदाचित गुगल भरून काढणार आहे.

नाही म्हणायला गुगलनेही गुगल असिस्टंट बाजारात आणला आहे, पण गुगलला त्याहून चांगली सर्व्हिस द्यायची आहे. म्हणून त्यांनी ‘मीना’ नावाची नवीन असिस्टंट तयार केली आहे.
इतर वर्च्युअल असिस्टंट आणि ‘मीना’मध्ये काय फरक आहे ?

Image Source

मीना हे एक चॅटबॉट असिस्टंट असणार आहे. म्हणजेच चॅट-गप्पा मारणारं सॉफ्टवेअर. ॲलेक्सा किंवा सिरीला तुम्ही सांगितलेलं काम फक्त करायचं असतं, त्यामुळं तुमच्या वाक्यातले नेमके शब्द घेतले, तरी त्या काम करु शकतात. पण गप्पा अशा नसतात ना राव!! गप्पा मारताना आपण कधी विनोद करतो, कधी उपरोध असतो, थोडक्यात, आपण आपली भाषा आपल्याला हवी तशी वाकवतो. साहजिकच, गप्पा मारणाऱ्या या सॉफ्टवेअरला भाषा, त्यातले शब्द, तिचं व्याकरण हे सगळं जरा जास्त चांगलं माहित असणं अपेक्षित असतं. त्यामुळे चॅटबॉट तयार करणं हे नुसतं बोलण्याचं काम नव्हे!!

तांत्रिक भाषेत सांगायचं तर, चॅटबॉट हे कृत्रिम बुद्धिमत्ता म्हणजेच आर्टिफिशियल इंटेलिजन्स असलेलं सॉफ्टवेअर असतं. गुगलने तयार केलेल्या नव्या चॅटबॉटमध्ये न्युरल नेटवर्क असणार आहे. त्यात २६० कोटी मापदंड (parameter ) बसवण्यात आले असून एंड टू एंड कार्यप्रणाली असेल. म्हणजे युझर आणि असिस्टंट यांच्यात तिसऱ्या कोणाचाही हस्तक्षेप नसेल. हो, पण मराठीत याचा अर्थ काय?

Image Source

आपल्या मेंदूत अनेक पेशी असतात. जीवशास्त्रात त्यांना न्यूरॉन्स म्हणतात. आपल्या मेंदूत या न्यूरॉन्सचं जाळं असतं आणि ते शरीरातल्या वेगवेगळ्या ठिकाणांना जोडलेलं असतं. म्हणजे, हाताला चटका लागला, की मेंदू हात मागे घेण्याची सूचना देतो तेव्हा हातातल्या संवेदना मेंदूत पोचलेल्या असतात, मेंदूतले काही न्यूरॉन्स चटका-त्याची तीव्रता याची आकडेमोड करतात, त्यानुसार पुढचे न्यूरॉन्स हात मागे घेण्याची सूचना करतात, पण तेव्हाच हात मागे घेताना आजूबाजूची एखादी वस्तू हाताला इजा पोचवेल असे वाटल्यास डोळ्यांकडून इतर न्यूरॉन्सला तशी महिती मिळते आणि हाताला त्याबरहुकूम सूचना इतर न्यूरॉन्सकडून मिळते.

थोडक्यात, मेंदूत या कोट्यावधी न्यूरॉन्सचं जाळं असतं आणि ते एकमेकांना असंख्यप्रकारे जोडले गेलेले असतात. कोणताही निर्णय घेण्यासाठी मेंदूला आपल्या नकळत असंख्य गोष्टींबद्दल महिती पुरवली जाते आणि ती वेगवेगळ्या प्रकारे, वेगवेगळ्या मापदंडांवर पारखली जाऊन मेंदू आपला निर्णय घेतो. या मीनामध्ये कृत्रिम न्यूरॉन्सचं जाळं आहे आणि आपल्या गप्पा तिला कळाव्यात यासाठी तिला २६० कोटी मापदंड शिकवले गेलेले आहेत.

Image Source

मीनाला ४००० कोटी शब्द शिकवले गेले आहेत. युझरशी संवाद साधण्यासाठी पब्लिक डोमेन आणि सोशल मिडियावरून माहिती गोळा केली जाईल असं कंपनी सांगतेय. या माहितीच्या आधारे युझर म्हणजेच वापरकर्त्याशी आणखी चांगल्याप्रकारे, वेगवेगळ्या विषयांवर आणि अचूक शब्दात संवाद साधला जाईल. गुगलचा दावा आहे की मीना सध्याच्या कोणत्याही वॉईस असिस्टंटपेक्षा चांगली आहे. या दाव्याबद्दल सांगताना गुगलने एक उदाहरण दिलंय. ते उदाहरण असं की संभाषणाच्या क्षमतेबद्दल मीना ही माणसांइतकीच चांगली आहे. संवेदनशीलता आणि सरासरी विशिष्टता (SSA )च्या परीक्षेत माणसांनी ८६ टक्के गुण मिळवले, तर मीनाने पहिल्याच प्रयत्नात ७६ टक्के गुण मिळवले आहेत.

खरं तर प्रत्येक कंपनीची कृत्रिम बुद्धिमत्ता चाचणीची स्वतःची एक पद्धत असते. गुगलचं म्हणणं आहे की इतर कंपन्यांच्या कृत्रिम बुद्धिमत्ता असलेल्या असिस्टंटना मुलभूत ज्ञान आणि समज नसते. त्यामुळे विचारलेल्या प्रश्नांना निश्चित आणि स्पष्ट उत्तरे मिळत नाहीत. मीना या सर्व कमतरता पूर्ण करणारी आहे.

Image Source

तर मंडळी, कृत्रिम बुद्धिमत्ता असलेल्या मशीनशी बोलायला आवडेल की खऱ्याखुऱ्या माणसांशी बोलायला जास्त आवडेल? तुमची निवड काय?निवड काहीही असो, कधीकधी या असिस्टंटशी गप्पा मारायला जाम मज्जा येते हो..

अजून पहा

बोभाटा.कॉम

व्हॉइस असिस्टंट म्हणजे काय? गुगलची मीना आणि अलेक्सा-सिरीमध्ये फरक काय?

बोभाटा

सबस्क्राईब करा

अजून पहा