മൈക്രോസോഫ്റ്റ് തങ്ങളുടെ ഏറ്റവും പുതിയ കോംപാക്ട് ‘ചെറിയ ഭാഷാ മോഡൽ’ ‘ഫൈ 2’ പുറത്തിറക്കി. പുതിയ കോംപാക്റ്റ് മോഡൽ 13 ബില്യണിൽ താഴെ പാരാമീറ്ററുകളുള്ള ചില വലിയ ഓപ്പൺ സോഴ്സ് ലാമ 2 മോഡലുകളേക്കാൾ മികച്ചതാണെന്ന് അവകാശപ്പെടുന്നു.
എന്താണ് Phi?
കഴിഞ്ഞ കുറച്ച് മാസങ്ങളായി, മൈക്രോസോഫ്റ്റ് റിസർച്ചിലെ മെഷീൻ ലേണിംഗ് ഫൗണ്ടേഷൻ ടീം “ഫൈ” എന്ന ചെറിയ ഭാഷാ മോഡലുകളുടെ (എസ്എൽഎം) ഒരു സ്യൂട്ട് പുറത്തിറക്കി, ഇത് വിവിധ മാനദണ്ഡങ്ങളിൽ ശ്രദ്ധേയമായ പ്രകടനം കൈവരിച്ചു.
Phi 1 കുറിച്ച്
ആദ്യ മോഡൽ, 1.3 ബില്യൺ പാരാമീറ്റർ ഫൈ 1 നിലവിലുള്ള എസ്എൽഎമ്മുകൾക്കിടയിൽ പൈത്തൺ കോഡിംഗിൽ അത്യാധുനിക പ്രകടനം കൈവരിക്കും (പ്രത്യേകിച്ച് ഹ്യൂമൻ ഇവൽ, എംബിപിപി മാനദണ്ഡങ്ങളിൽ).
13 ബില്യണിൽ താഴെ പാരാമീറ്ററുകളുള്ള അടിസ്ഥാന ഭാഷാ മോഡലുകൾക്കിടയിൽ അത്യാധുനിക പ്രകടനം പ്രദർശിപ്പിക്കുന്ന 2.7 ബില്യൺ പാരാമീറ്റർ ഭാഷാ മോഡലായ ഫൈ -2 ഞങ്ങൾ ഇപ്പോൾ പുറത്തിറക്കുകയാണെന്ന് കമ്പനി അറിയിച്ചു.
Phi 2 കുറിച്ച്
യന്ത്രവൽകൃത വ്യാഖ്യാനം, മികച്ച ട്യൂണിംഗ് പരീക്ഷണം, വിവിധ ജോലികളിൽ സുരക്ഷാ മെച്ചപ്പെടുത്തലുകൾ എന്നിവ ഉൾപ്പെടുന്ന ഗവേഷകർക്ക് അനുയോജ്യമായ കളിസ്ഥലമാണ് ഫൈ -2 എന്ന് പറയപ്പെടുന്നു.
ഭാഷാ മോഡലുകളിൽ ഗവേഷണവും വികസനവും പ്രോത്സാഹിപ്പിക്കുന്നതിനായി അഷ്വർ എഐ സ്റ്റുഡിയോ മോഡൽ കാറ്റലോഗിൽ ഞങ്ങൾ ഫൈ -2 ലഭ്യമാക്കിയിട്ടുണ്ടെന്ന് മൈക്രോസോഫ്റ്റ് പറഞ്ഞു.
ഭാഷാ മോഡലുകളുടെ വലുപ്പം നൂറുകണക്കിന് ബില്യൺ പാരാമീറ്ററുകളായി വർദ്ധിച്ചത് ഉയർന്നുവരുന്ന നിരവധി കഴിവുകൾ തുറന്നിട്ടുണ്ടെന്നും സ്വാഭാവിക ഭാഷാ പ്രോസസിംഗിന്റെ ലാൻഡ്സ്കേപ്പിനെ പുനർനിർവചിച്ചുവെന്നും പറയപ്പെടുന്നു.
എന്നിരുന്നാലും, പരിശീലനത്തിനുള്ള തന്ത്രപരമായ തിരഞ്ഞെടുപ്പുകൾ ഉപയോഗിച്ച് അത്തരം ഉയർന്നുവരുന്ന കഴിവുകൾ ചെറിയ തോതിൽ നേടാൻ കഴിയുമോ എന്ന ചോദ്യം അവശേഷിക്കുന്നു, ഉദാഹരണത്തിന്, ഡാറ്റ തിരഞ്ഞെടുപ്പ്.
എസ്എൽഎമ്മുകളെ പരിശീലിപ്പിച്ചുകൊണ്ട് ഈ ചോദ്യത്തിന് ഉത്തരം നൽകാൻ ഫൈ മോഡലുകൾ ലക്ഷ്യമിടുന്നു
മൈക്രോസോഫ്റ്റ് പറഞ്ഞു: “ഫൈ മോഡലുകളുമായുള്ള ഞങ്ങളുടെ പ്രവർത്തനം വളരെ ഉയർന്ന തോതിലുള്ള മോഡലുകൾക്ക് തുല്യമായ പ്രകടനം കൈവരിക്കുന്ന എസ്എൽഎമ്മുകളെ പരിശീലിപ്പിച്ചുകൊണ്ട് ഈ ചോദ്യത്തിന് ഉത്തരം നൽകാൻ ലക്ഷ്യമിടുന്നു(ഇപ്പോഴും അതിർത്തി മോഡലുകളിൽ നിന്ന് വളരെ അകലെയാണ്).
ഗവേഷണ കമ്മ്യൂണിറ്റിയിൽ നിന്ന് സാധാരണയായി ഉപയോഗിക്കുന്ന പ്രോംപ്റ്റുകളിൽ കമ്പനി വിപുലമായ പരിശോധന നടത്തി.
“ഞങ്ങൾ ബെഞ്ച്മാർക്ക് ഫലങ്ങൾ നൽകിയ പ്രതീക്ഷയ്ക്ക് അനുസൃതമായി ഒരു പെരുമാറ്റം ഞങ്ങൾ നിരീക്ഷിച്ചു,” ടെക് ഭീമൻ പറഞ്ഞു.
