ഇൻറർനെറ്റ് സെർച്ചിന്റെ ഭാവിയെച്ചൊല്ലി ഗൂഗിളും മൈക്രോസോഫ്റ്റും തമ്മിലുള്ള പോരാട്ടം ശക്തമാകുമ്പോൾ, ഇന്ത്യയിലെ 15 കോടി കർഷകർക്കായുള്ള പ്രധാന സർക്കാർ പദ്ധതികളിൽ വാട്ട്സ്ആപ്പ് ഉടൻ തന്നെ ഒരു പ്രധാന സെർച്ച് എൻജിൻ ആയി മാറിയേക്കാം. സെൻസേഷണൽ ആയ എഐ ചാറ്റ്ബോട്ട് ചാറ്റ്ജിപിടിയും ഒരു ദേശീയ തലത്തിലുള്ള പ്രോഗ്രാമും ചേർന്നാണ് പദ്ധതി നടപ്പാക്കുന്നത്. ഒരു ക്രൗഡ് സോഴ്സിങ്ങ് മോഡലിലൂടെ നിരവധി പ്രാദേശിക ഭാഷകളിൽ ഇന്ത്യൻ ശബ്ദങ്ങളുടെ സാമ്പിളുകൾ അടങ്ങിയ വിശാലമായ ഡേറ്റാസെറ്റുകൾ നിർമിക്കാൻ ഇത് ലക്ഷ്യമിടുന്നു.
ഇലക്ട്രോണിക്സ് ആൻഡ് ഐടി മന്ത്രാലയത്തിലെ (മെയ്റ്റി) ഒരു ചെറിയ ടീമായ ഭാഷിണി നിലവിൽ ഒരു വാട്ട്സ്ആപ്പ് അധിഷ്ഠിത ചാറ്റ്ബോട്ട് നിർമിക്കുകയാണ്. അത് ചോദ്യങ്ങൾക്ക് ഉചിതമായ പ്രതികരണങ്ങൾ നൽകുന്നതിന് ചാറ്റ്ജിപിടി സൃഷ്ടിച്ച വിവരങ്ങളെ ആശ്രയിക്കുന്നു. ആളുകൾ, പ്രത്യേകിച്ച് ഗ്രാമപ്രദേശങ്ങളിലെ കർഷകർ, അവരുടെ ചോദ്യങ്ങൾ ടൈപ്പ് ചെയ്യാൻ എപ്പോഴും സാധിക്കണമെന്നില്ല എന്നതിനാൽ, വോയ്സ് നോട്ടുകൾ വഴി ചാറ്റ്ബോട്ടിൽ ചോദ്യങ്ങൾ ചോദിക്കാം.
ചാറ്റ്ബോട്ടിലെ ചോദ്യങ്ങൾ വോയ്സ് നോട്ടുകളിലൂടെ ലളിതമായി ചോദിക്കാം, തുടർന്ന് ഇത് ചാറ്റ്ജിപിടി സൃഷ്ടിച്ച വോയ്സ് അടിസ്ഥാനമാക്കിയുള്ള പ്രതികരണം നൽകും.
ഈ വർഷം ആദ്യം ദാവോസിൽ നടന്ന ലോക സാമ്പത്തിക ഫോറത്തിൽ ഇതേക്കുറിച്ച് സൂചിപ്പിച്ച മൈക്രോസോഫ്റ്റ് സിഇഒ സത്യ നാദെല്ലയെ ഈ ചാറ്റ്ബോട്ടിന്റെ ഒരു മോഡൽ കാണിച്ചിരുന്നതായി ഉദ്യാഗസ്ഥർ പറയുന്നു. പ്രധാനമന്ത്രി ആവാസ് യോജനയുടെ വിശദാംശങ്ങളെക്കുറിച്ചുള്ള ചോദിച്ച ഒരു വോയ്സ് നോട്ടിന് ചാറ്റ് ബോട്ട് തടസമില്ലാതെ നൽകിയ പ്രതികരണങ്ങളിലൂടെ ഈ ബോട്ടിന്റെ ഒരു ഡെമോ ഇന്ത്യൻ എക്സ്പ്രസ് കണ്ടു.
പരീക്ഷണ ഘട്ടത്തിലുള്ള ചാറ്റ്ബോട്ട്, ഇന്ത്യയിലെ ഗ്രാമീണ, കാർഷിക ജനവിഭാഗങ്ങളെ, പ്രത്യേകിച്ചും സർക്കാർ പദ്ധതികളെയും സബ്സിഡികളെയും ഏറ്റവും കൂടുതൽ ആശ്രയിക്കുന്ന സമൂഹത്തിലെ വിഭാഗങ്ങളെയും അവർ സംസാരിക്കുന്ന വിവിധ ഭാഷകളെയും കണക്കിലെടുത്താണു വികസിപ്പിക്കുന്നത്. ആ സാഹചര്യത്തിൽ, രാജ്യത്തെ ഗ്രാമീണ ജനത സംസാരിക്കുന്ന പ്രാദേശിക ഭാഷകൾ വിജയകരമായി തിരിച്ചറിയാനും മനസിലാക്കാനും കഴിയുന്ന ഒരു ഭാഷാ മാതൃക നിർമിക്കേണ്ടത് പ്രധാനമാണെന്നു പദ്ധതിയുമായി ബന്ധപ്പെട്ട ഉദ്യോഗസ്ഥർ പറഞ്ഞു.
സങ്കീർണമായ ചോദ്യങ്ങൾക്കു പോലും ആകർഷകമായും വാചാലമായും പ്രതികരിക്കുന്ന ചാറ്റ്ജിപിടിയുടെ കഴിവ് പലരെയും ആകർഷിച്ചിട്ടുണ്ടെങ്കിലും ഇന്ത്യൻ ഭാഷകൾക്കായി ഒരു ദേശീയ ഡിജിറ്റൽ പബ്ലിക് പ്ലാറ്റ്ഫോം നിർമിക്കുന്നത് ഭാഷിണി ടീമിന്റെ വാട്ട്സ്ആപ്പ് ചാറ്റ്ബോട്ടിനു പ്രധാനമാണ്. അത്തരമൊരു ഭാഷാ മാതൃക നിർമിക്കുന്നതിന്, ഇന്ത്യയിൽ സംസാരിക്കുന്ന വിവിധ പ്രാദേശിക ഭാഷകളുടെ വലിയ ഡേറ്റാസെറ്റുകൾ ഉണ്ടായിരിക്കുന്നത് ഉചിതമാണെന്ന് ഉദ്യോഗസ്ഥർ പറഞ്ഞു.
ഇവിടെയാണ് ഭാഷാ ദാൻ എന്ന ഒരു സംരംഭം വരുന്നതെന്ന് അദ്ദേഹം വിശദീകരിച്ചു. ഒന്നിലധികം ഇന്ത്യൻ ഭാഷകളിലെ വോയ്സ് ഡേറ്റാസെറ്റുകൾ ക്രൗഡ് സോഴ്സ് ചെയ്യാൻ ലക്ഷ്യമിടുന്ന ഒരു പ്രധാന പദ്ധതിയാണിത്. പ്രോജക്റ്റിന്റെ വെബ്സൈറ്റിൽ, ആളുകൾക്കു മൂന്നു പ്രധാന വഴികളിൽ സംഭാവന നൽകാം: ഒന്നിലധികം ഇന്ത്യൻ ഭാഷകളിൽ അവരുടെ ശബ്ദ സാമ്പിളുകളിലൂടെ ഒരു വാചകം വായിക്കാം, ഒരു വാചകം ടൈപ്പ് ചെയ്യാം, ഒരു ഭാഷയിലെ വാചകം മറ്റൊരു ഭാഷയിലേക്കു വിവർത്തനം ചെയ്യുകയുമാവാം.
“ഈ ചാറ്റ്ബോട്ട് ഉപയോഗിക്കുന്ന ഭൂരിഭാഗം ആളുകൾക്കും ഇംഗ്ലിഷ് അറിയില്ല. അതിനാൽ, അവരുടെ വോയിസ് ഇൻപുട്ടുകൾ ചാറ്റ്ബോട്ടിൽ പ്രവർത്തിക്കുന്നതിന്, കഴിയുന്നത്ര ഇന്ത്യൻ ഭാഷകളിൽ ഞങ്ങളുടെ ഭാഷാ പ്രോസസിങ് മോഡലുകളെ പരിശീലിപ്പിക്കേണ്ടതു പ്രധാനമാണ്. ഭാഷാ ദാൻ പോർട്ടലിലൂടെ രാജ്യത്തെ ജനങ്ങൾ സംഭാവന ചെയ്ത നിരവധി ഇന്ത്യൻ ഭാഷകളിലെ ശബ്ദങ്ങളുടെ ഒരു ശേഖരം ഞങ്ങൾക്കുണ്ട്. ദൂരദർശൻ സംപ്രേക്ഷണം ചെയ്യുന്ന എല്ലാ ഭാഷകളുടെയും വിപുലമായ ഡേറ്റാബേസ് ഞങ്ങളുടെ പക്കലുണ്ട്. അതിനാൽ ഈ ഡാറ്റാസെറ്റുകൾ ഉപയോഗിച്ചാണു ഞങ്ങൾ ചാറ്റ്ബോട്ടിലെ ഭാഷാ മോഡൽ നിർമിച്ചത്,” ഉദ്യോഗസ്ഥർ വിശദീകരിച്ചു.
പരീക്ഷണ ഘട്ടത്തിൽ, ഇംഗ്ലീഷ്, ഹിന്ദി, തമിഴ്, തെലുങ്ക്, മറാത്തി, ബംഗാളി, കന്നഡ, ഒഡിയ, അസമീസ് എന്നിവയുൾപ്പെടെ 12 ഭാഷകളെ മോഡൽ നിലവിൽ പിന്തുണയ്ക്കുന്നു. ഇതിനർത്ഥം, ഈ ഭാഷകളിൽ ഏതെങ്കിലും ഒരു ഉപയോക്താവ് ചാറ്റ്ബോട്ടിലേക്ക് ഒരു വോയ്സ് നോട്ട് അയച്ചാൽ, അതിനുള്ള പ്രതികരണം ചാറ്റ്ബോട്ട് വിജയകരമായി നൽകുമെന്നാണ്.
ആഗോള ഇൻറർനെറ്റിലേക്ക് ഗ്രാമീണ കണക്റ്റിവിറ്റി ഉയരുന്നുണ്ടെങ്കിലും, ഡിജിറ്റൽ വിഭജനം നിലനിൽക്കുന്ന ഒരു രാജ്യത്ത്, ഇതിനായി വാട്ട്സ്ആപ്പ് പ്ലാറ്റ്ഫോമം തിരഞ്ഞെടുത്തത് ബോധപൂർവമായിട്ടാണെന്ന് ഉദ്യോഗസ്ഥർ പറഞ്ഞു.
“വാട്സാപ്പിന് 500 ദശലക്ഷത്തിലധികം ഉപയോക്താക്കളുണ്ട്, താരതമ്യേന കുറഞ്ഞ ഡിജിറ്റൽ സാക്ഷരതയുള്ളവർക്ക് പോലും ആപ്പിനെ ചുറ്റിപ്പറ്റിയുള്ള കാര്യങ്ങൾ അറിയാം,” അദ്ദേഹം കൂട്ടിച്ചേർത്തു. എന്നിരുന്നാലും, നിലവിൽ ചില പരിമിതികൾ ഉണ്ട്. അതിന്റെ പരീക്ഷണ ഘട്ടത്തിൽ, മറ്റ് കാര്യങ്ങൾക്കൊപ്പം സർക്കാർ പദ്ധതികളെക്കുറിച്ചുള്ള ലളിതമായ ചോദ്യങ്ങളോട് മാത്രമേ ചാറ്റ്ബോട്ടിന് പ്രതികരിക്കാൻ കഴിയൂ. ഇന്റർനെറ്റിൽനിന്ന് തത്സമയ വിവരങ്ങൾ ആക്സസ് ചെയ്യാൻ ചാറ്റ്ജിപിടിയ്ക്ക് സാധിക്കില്ല, എന്നത് നിലവിലെ പരിമിതിയാണ്. ഇൻപുട്ടിനെ അടിസ്ഥാനമാക്കി ടെക്സ്റ്റ് സൃഷ്ടിക്കാൻ ചാറ്റ്ജിപിടിയുടെ ഭാഷാ മോഡൽ ഒരു വലിയ ഡേറ്റാസെറ്റിൽ പരിശീലിപ്പിച്ചിരിക്കുന്നു. ഡേറ്റാസെറ്റിൽ ഇപ്പോൾ 2021 വരെയുള്ള വിവരങ്ങൾ മാത്രമേ ഉൾപ്പെട്ടിട്ടുള്ളൂ.
എന്നിരുന്നാലും, അത് ഉടൻ മാറിയേക്കാം. ബുധനാഴ്ച, മൈക്രോസോഫ്റ്റ് അതിന്റെ സെർച്ച് എൻജിൻ ബിംഗിന്റെ പുതിയ പതിപ്പ് പ്രഖ്യാപിച്ചിരുന്നു. ചാറ്റ്ജിപിടിയുടെ എഐ സാങ്കേതികവിദ്യയുടെ നവീകരിച്ച പതിപ്പാണ് നൽകുന്നത്. ചാറ്റ്ജിപിടിയുടെ ഭാഷാ മോഡലായ ജിപിടി 3.5ന്റെ അപ്ഡേറ്റ് ചെയ്ത പതിപ്പാണ് നൽകുന്നതെന്ന് മൈക്രോസോഫ്റ്റ് പറഞ്ഞു. ഇതിനെ “പ്രോമിത്യൂസ് മോഡൽ” എന്ന് വിളിക്കുകയും ജിപിടി 3.5നേക്കാൾ ശക്തമാണെന്നും കൂടുതൽ കാലികമായ വിവരങ്ങളും വ്യാഖ്യാനിച്ച ഉത്തരങ്ങളും ഉപയോഗിച്ച് ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ മികച്ചതാണെന്നും പറഞ്ഞു.
ചാറ്റ്ജിപിടിക്ക് ഇന്റർനെറ്റിൽ തിരഞ്ഞ് തത്സമയ ഫലങ്ങളുമായി മടങ്ങിയെത്താൻ കഴിഞ്ഞാൽ, വാട്ട്സ്ആപ്പ് ചാറ്റ്ബോട്ടിന്റെ വ്യാപ്തി നിലവിൽ പരീക്ഷിച്ചുകൊണ്ടിരിക്കുന്നതിനേക്കാൾ വളരെയേറെ മുന്നോട്ട്പോകുമെന്ന് ഉദ്യോഗസ്ഥർ പറഞ്ഞു. “ആളുകൾക്ക് വിവിധ സർക്കാർ പദ്ധതികളെക്കുറിച്ചുള്ള വിവരങ്ങൾ സംക്ഷിപ്തമായി ലഭിക്കുക മാത്രമല്ല, ആ പദ്ധതികളിൽ ചിലതിന് അവർ യോഗ്യരാണോ എന്ന് അന്വേഷിക്കുകയും ചെയ്യാം,” ഉദ്യോഗസ്ഥർ പറഞ്ഞു.
ചാറ്റ്ബോട്ടിന്റെ പൊതു റിലീസ് സംബന്ധിച്ച് വിവരം ലഭിച്ചിട്ടിലെങ്കിലും, അതിന്റെ ഡെമോ നാദെല്ലയെ ആകർഷിച്ചുവെന്ന് അവർ പറഞ്ഞു. എന്നിരുന്നാലും, ചാറ്റ്ജിപിടിയെ വികസിപ്പിച്ച ഓപ്പൺഎഐയിൽ മൈക്രോസോഫ്റ്റ് 10 ബില്യൺ ഡോളർ നിക്ഷേപിച്ചിട്ടുണ്ടെന്നത് ശ്രദ്ധിക്കേണ്ടതാണ്.
“ഞാൻ കണ്ട മോഡലിന്റെ ഡെമോയിൽ ഒരു ഗ്രാമീണ ഇന്ത്യൻ കർഷകൻ ഏതോ സർക്കാർ പരിപാടിയെക്കുറിച്ച് അറിയാൻ ശ്രമിക്കുന്നതാണ്. ഒരു പ്രദേശിക ഭാഷയിൽ സങ്കീർണമായ രീതിയിൽ കർഷകൻ തന്റെ ആവശ്യം പറഞ്ഞു. ബോട്ട് അത് വിവർത്തനം ചെയ്ത് പദ്ധതിയുടെ വിവരങ്ങൾ അറിയാനായി ‘ഈ പോർട്ടലിലേക്ക് പോകൂ, ഇവിടെ നിങ്ങൾ എങ്ങനെ പ്രോഗ്രാം ആക്സസ് ചെയ്യും’ എന്ന് മറുപടി വന്നു. ‘ നിങ്ങൾ എനിക്കായി ഇത് ചെയ്യണമെന്ന് ഞാൻ ആഗ്രഹിക്കുന്നു’എന്ന് കർഷകൻ മറുപടി പറഞ്ഞു. ബോട്ട് അതിന്റെ ജോലി പൂർത്തിയാക്കി. സർക്കാരിന്റെ എല്ലാ രേഖകളെയും കുറിച്ച് പരിശീലിപ്പിച്ച ശേഷം സ്പീച്ച് റെക്കഗ്നിഷൻ സോഫ്റ്റ്വെയർ ഉപയോഗിച്ചാണ് അത് പൂർത്തിയാക്കിയെതെന്ന്,” നാദെല്ല ഈ വർഷം നേരത്തെ പറഞ്ഞിരുന്നു.