ചാറ്റ്ബോട്ടുകളുടെ മഴയാണ് ഇപ്പോൾ ടെക് ലോകത്ത്. ഓപ്പൺ എഐയുടെ ചാറ്റ്ജിപിടി വിപ്ലവം സൃഷ്ടിച്ചശേഷം ഗൂഗിൾ ബാർഡ് അവതരിപ്പിച്ചു. മറ്റു പലരും ഈ മാതൃക പിന്തുടർന്നു. മെറ്റ പ്ലാറ്റ്ഫോംസ്, ഐഎൻസി എതിരാളികളെക്കാൾ മുൻതൂക്കം നേടാനുള്ള ഒരുക്കത്തിലാണ്. കാലിഫോർണിയ ആസ്ഥാനമായുള്ള ഈ ടെക് ഭീമൻ ഒരു പുതിയ ഗവേഷണ ടൂൾ അവതരിപ്പിച്ചിരിക്കുകയാണ്. അത് ഉടൻ എഐ അധിഷ്ഠിത ചാറ്റ്ബോട്ടുകൾ നിർമിക്കാൻ സഹായിക്കും.
കമ്പനി അതിന്റെ ലാർജ് ലാംഗ്വേജ് മോഡൽ മെറ്റ എഐ (എൽഎൽഎഎംഎ)പുറത്തിറക്കി. എഐയുടെ ഉപമേഖലയിൽ ഗവേഷകരെ സഹായിക്കുന്നതിനായി വികസിപ്പിച്ചെടുത്ത അത്യാധുനിക അടിസ്ഥാന ഭാഷാ മാതൃകയാണ് എൽഎഎംഎ. തെറ്റായ ഫലങ്ങളെത്തുടർന്ന് ഉടൻ ഷട്ട്ഡൗൺ ചെയ്ത ഗലാറ്റിക്ക, ബ്ലെൻഡർ ബോട്ട് 3 എന്നിവയ്ക്കു ശേഷമുള്ള മെറ്റയുടെ മൂന്നാമത്തെ എൽഎൽഎമ്മാണിത്.
എന്താണ് എൽഎൽഎഎംഎ?
എൽഎൽഎഎംഎ അടിസ്ഥാനപരമായി ഒരു ചാറ്റ്ബോട്ട് അല്ല. എഐ ഭാഷാ മോഡലുകളെ സംബന്ധിച്ച പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ സാധ്യതയുള്ള ഒരു ഗവേഷണ ടൂളാണിതെന്നു മെറ്റ അഭിപ്രായപ്പെടുന്നു. എൽഎൽഎഎംഎ പോലെയുള്ള ചെറുതും കൂടുതൽ പ്രവർത്തനക്ഷമതയുള്ളതുമായ മോഡലുകൾ, വലിയ അളവിലുള്ള ഇൻഫ്രാസ്ട്രക്ചറുകളിലേക്ക് പ്രവേശനമില്ലാത്ത ഗവേഷണ സമൂഹത്തിലെ ആളുകൾക്ക് ഈ മോഡലുകൾ പഠിക്കാൻ പ്രാപ്തമാക്കുന്നു. “ഈ സുപ്രധാനവും അതിവേഗം മാറിക്കൊണ്ടിരിക്കുന്നതുമായ ഈ മേഖലയിലേക്കുള്ള പ്രവേശനം കൂടുതൽ ജനാധിപത്യവൽക്കരിക്കുന്നു,” മെറ്റ അതിന്റെ ഔദ്യോഗിക ബ്ലോഗിൽ പറഞ്ഞു.
7B മുതൽ 65B പാരാമീറ്ററുകൾ വരെയുള്ള ഭാഷാ മോഡലുകളുടെ ഒരു ശേഖരമാണ് എൽഎൽഎഎംഎ. പബ്ലിക് ഡേറ്റസെറ്റുകൾ ഉപയോഗിച്ച് അത്യാധുനിക മോഡലുകൾ പരിശീലിപ്പിക്കാൻ കഴിയുമെന്നും ഉടമസ്ഥതയിലുള്ളതും ആക്സസ് ചെയ്യാനാകാത്തതുമായ ഡേറ്റാ സെറ്റുകളെ ആശ്രയിക്കാതെ ട്രില്യൺ കണക്കിനു ടോക്കണുകളിൽ തങ്ങളുടെ മോഡലുകളെ പരിശീലിപ്പിക്കുന്നുണ്ടെന്നും കമ്പനി പറഞ്ഞു.
എൽഎൽഎഎംഎ എങ്ങനെയാണ് വ്യത്യസ്തമാകുന്നത്?
പുതിയ ഉപയോഗ കേസുകൾ പരിശോധിക്കുന്നതിനും സാധൂകരിക്കുന്നതിനും പര്യവേഷണം ചെയ്യുന്നതിനും വളരെ കുറഞ്ഞ കമ്പ്യൂട്ടിങ് പവറും വിഭവങ്ങളും ആവശ്യമുള്ളതിനാൽ എൽഎൽഎഎംഎ പോലുള്ള ചെറിയ അടിസ്ഥാന മോഡലുകളെ പരിശീലിപ്പിക്കുന്നത് അനുയോജ്യമാണ്. അടിസ്ഥാന ഭാഷാ മോഡലുകൾ ലേബൽ ചെയ്യാത്ത ഡേറ്റയുടെ വലിയ ഭാഗങ്ങളിൽ പരിശീലിപ്പിക്കുന്നതായി അറിയപ്പെടുന്നു. ഇതു വിവിധ ജോലികൾക്കനുസരിച്ച് അവയെ അനുയോജ്യമാക്കുന്നു. 7ബി, 13ബി, 33ബി, 65ബി പാരാമീറ്ററുകൾ പോലെയുള്ള വലുപ്പങ്ങളിൽ എൽഎഎംഎ വാഗ്ദാനം ചെയ്യുമെന്ന് മെറ്റ അറിയിച്ചു.
മിക്ക ബെഞ്ച്മാർക്കുകളിലും എൽഎൽഎഎംഎ-13ബി, ഓപ്പൺഎഐയുടെ ജിപിടി-3 (175B) യെക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവച്ചതായും എൽഎൽഎഎംഎ-65ബി, മികച്ച മോഡലുകളായ ഡീപ്മെന്റിന്റെ ചിൻചിലാ 70ബി, ഗൂഗിളിന്റെ പാം-540ബി എന്നിവയുമായി മത്സരിക്കുന്നതായും മെറ്റ അതിന്റെ ഗവേഷണ പ്രബന്ധത്തിൽ പറയുന്നു. പൂർണമായി പരിശീലിച്ചുകഴിഞ്ഞാൽ, ഈ സിസ്റ്റങ്ങളിൽ പരീക്ഷണങ്ങൾ നടത്താൻ ആഗ്രഹിക്കുന്ന ചെറുകിട ബിസിനസുകൾക്ക് എൽഎൽഎഎംഎ-13ബി ഒരു അനുഗ്രഹമായിരിക്കും. എന്നിരുന്നാലും, ഇത് ഇപ്പോഴും ഐസോലേറ്റായി പ്രവർത്തിക്കുന്ന ഗവേഷകരിൽനിന്നു വളരെ അകലെയായിരിക്കാം.
മെറ്റയുടെ ഒരു ഉൽപ്പന്നത്തിലും എൽഎൽഎഎംഎ നിലവിൽ ഉപയോഗത്തിലില്ല. എന്നിരുന്നാലും, ഇത് ഗവേഷകർക്കു ലഭ്യമാക്കാൻ കമ്പനിക്കു പദ്ധതിയുണ്ട്. കമ്പനി നേരത്തെ അതിന്റെ എൽഎൽഎം ഒപിടി-175ബി പുറത്തിറക്കിയിരുന്നു. എന്നാൽ എൽഎൽഎഎംഎ അതിന്റെ കൂടുതൽ വിപുലമായ സംവിധാനമാണ്. സിസ്റ്റം എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്നു കാണാൻ പുറത്തുള്ളവർക്ക് എൽഎൽഎംഎ മോഡൽ സോഴ്സ് കോഡും മെറ്റ ലഭ്യമാക്കിയിട്ടുണ്ട്. ഇത് അനുബന്ധ പ്രോജക്ടുകളിൽ സഹകരിക്കാൻ അനുവദിക്കും.
വലിയ ഭാഷാ മോഡലുകൾ ഡീകോഡ് ചെയ്യുന്നു
ലേഖനങ്ങൾ, വാർത്താ റിപ്പോർട്ടുകൾ, സോഷ്യൽ മീഡിയ പോസ്റ്റുകൾ തുടങ്ങിയ ഇന്റർനെറ്റ് ഉറവിടങ്ങളിൽനിന്ന് ഡിജിറ്റൽ ടെക്സ്റ്റിന്റെ വൻതോതിലുള്ള വോള്യങ്ങൾ ഉപയോഗിക്കുന്ന എഐ സംവിധാനങ്ങളാണ് വലിയ ഭാഷാ മോഡലുകൾ അല്ലെങ്കിൽ എൽഎൽഎം. പ്രോംപ്റ്റുകളുടെയും അന്വേഷണങ്ങളുടെയും അടിസ്ഥാനത്തിൽ ആദ്യം മുതൽ ഉള്ളടക്കം പ്രവചിക്കുകയും നിർമ്മിക്കുകയും ചെയ്യുന്ന സോഫ്റ്റ്വെയറിനെ പരിശീലിപ്പിക്കാൻ ഈ ഡിജിറ്റൽ ടെക്സ്റ്റുകൾ ഉപയോഗിക്കുന്നു. ഉപന്യാസങ്ങൾ എഴുതുക, സോഷ്യൽ മീഡിയ പോസ്റ്റുകൾ രചിക്കുക, പ്രോഗ്രാമിങ് കോഡ് നിർദേശിക്കുക, ചാറ്റ്ബോട്ട് സംഭാഷണങ്ങൾ സൃഷ്ടിക്കുക തുടങ്ങിയ ജോലികളിൽ ഈ മോഡലുകൾക്കു സഹായിക്കാനാകും.
വിപ്ലവകരമായ എഐ ചാറ്റ്ബോട്ടുകളെ ചുറ്റിപ്പറ്റിയുള്ള സാഹചര്യങ്ങളിൽനിന്നു കമ്പനി ഏറെക്കുറെ വിട്ടുനിന്ന സമയത്താണ് മെറ്റയിൽനിന്നുള്ള ഏറ്റവും പുതിയ റിലീസ് എത്തുന്നത്. സ്വന്തമായി ചാറ്റ്ബോട്ടുകൾ ആദ്യമായി പുറത്തിറക്കിയവരിൽ ഒന്നായിരുന്നു മെറ്റ. എന്നാൽ, തെറ്റായ ഫലങ്ങളും മങ്ങിയ പ്രതികരണവും കാരണം അതിന്റെ താളംതെറ്റി. എൽഎൽഎംഎയുമായി മെറ്റ കളത്തിലേക്കു തിരികെ വന്നതായാണു തോന്നുന്നത്.