ഗവേഷണ ആപ്ലിക്കേഷനുകൾക്കായി രൂപകൽപ്പന ചെയ്ത ശക്തമായ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ‘കോംപാക്റ്റ് ലാംഗ്വേജ് മോഡൽ’ മൈക്രോസോഫ്റ്റ് പുറത്തിറക്കി

You are currently viewing ഗവേഷണ ആപ്ലിക്കേഷനുകൾക്കായി രൂപകൽപ്പന ചെയ്ത ശക്തമായ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ‘കോംപാക്റ്റ് ലാംഗ്വേജ് മോഡൽ’ മൈക്രോസോഫ്റ്റ് പുറത്തിറക്കി

മൈക്രോസോഫ്റ്റ് തങ്ങളുടെ ഏറ്റവും പുതിയ കോംപാക്ട് ‘ചെറിയ ഭാഷാ മോഡൽ’ ‘ഫൈ 2’ പുറത്തിറക്കി. പുതിയ കോംപാക്റ്റ് മോഡൽ 13 ബില്യണിൽ താഴെ പാരാമീറ്ററുകളുള്ള ചില വലിയ ഓപ്പൺ സോഴ്സ് ലാമ 2 മോഡലുകളേക്കാൾ മികച്ചതാണെന്ന് അവകാശപ്പെടുന്നു.

എന്താണ് Phi?

കഴിഞ്ഞ കുറച്ച് മാസങ്ങളായി, മൈക്രോസോഫ്റ്റ് റിസർച്ചിലെ മെഷീൻ ലേണിംഗ് ഫൗണ്ടേഷൻ ടീം “ഫൈ” എന്ന ചെറിയ ഭാഷാ മോഡലുകളുടെ (എസ്എൽഎം) ഒരു സ്യൂട്ട് പുറത്തിറക്കി, ഇത് വിവിധ മാനദണ്ഡങ്ങളിൽ ശ്രദ്ധേയമായ പ്രകടനം കൈവരിച്ചു.

Phi 1 കുറിച്ച്

ആദ്യ മോഡൽ, 1.3 ബില്യൺ പാരാമീറ്റർ ഫൈ 1 നിലവിലുള്ള എസ്എൽഎമ്മുകൾക്കിടയിൽ പൈത്തൺ കോഡിംഗിൽ അത്യാധുനിക പ്രകടനം കൈവരിക്കും (പ്രത്യേകിച്ച് ഹ്യൂമൻ ഇവൽ, എംബിപിപി മാനദണ്ഡങ്ങളിൽ).

13 ബില്യണിൽ താഴെ പാരാമീറ്ററുകളുള്ള അടിസ്ഥാന ഭാഷാ മോഡലുകൾക്കിടയിൽ അത്യാധുനിക പ്രകടനം പ്രദർശിപ്പിക്കുന്ന 2.7 ബില്യൺ പാരാമീറ്റർ ഭാഷാ മോഡലായ ഫൈ -2 ഞങ്ങൾ ഇപ്പോൾ പുറത്തിറക്കുകയാണെന്ന് കമ്പനി അറിയിച്ചു.

Phi 2 കുറിച്ച്

യന്ത്രവൽകൃത വ്യാഖ്യാനം, മികച്ച ട്യൂണിംഗ് പരീക്ഷണം, വിവിധ ജോലികളിൽ സുരക്ഷാ മെച്ചപ്പെടുത്തലുകൾ എന്നിവ ഉൾപ്പെടുന്ന ഗവേഷകർക്ക് അനുയോജ്യമായ കളിസ്ഥലമാണ് ഫൈ -2 എന്ന് പറയപ്പെടുന്നു.

ഭാഷാ മോഡലുകളിൽ ഗവേഷണവും വികസനവും പ്രോത്സാഹിപ്പിക്കുന്നതിനായി അഷ്വർ എഐ സ്റ്റുഡിയോ മോഡൽ കാറ്റലോഗിൽ ഞങ്ങൾ ഫൈ -2 ലഭ്യമാക്കിയിട്ടുണ്ടെന്ന് മൈക്രോസോഫ്റ്റ് പറഞ്ഞു.

ഭാഷാ മോഡലുകളുടെ വലുപ്പം നൂറുകണക്കിന് ബില്യൺ പാരാമീറ്ററുകളായി വർദ്ധിച്ചത് ഉയർന്നുവരുന്ന നിരവധി കഴിവുകൾ തുറന്നിട്ടുണ്ടെന്നും സ്വാഭാവിക ഭാഷാ പ്രോസസിംഗിന്റെ ലാൻഡ്സ്കേപ്പിനെ പുനർനിർവചിച്ചുവെന്നും പറയപ്പെടുന്നു.

എന്നിരുന്നാലും, പരിശീലനത്തിനുള്ള തന്ത്രപരമായ തിരഞ്ഞെടുപ്പുകൾ ഉപയോഗിച്ച് അത്തരം ഉയർന്നുവരുന്ന കഴിവുകൾ ചെറിയ തോതിൽ നേടാൻ കഴിയുമോ എന്ന ചോദ്യം അവശേഷിക്കുന്നു, ഉദാഹരണത്തിന്, ഡാറ്റ തിരഞ്ഞെടുപ്പ്.

എസ്എൽഎമ്മുകളെ പരിശീലിപ്പിച്ചുകൊണ്ട് ഈ ചോദ്യത്തിന് ഉത്തരം നൽകാൻ ഫൈ മോഡലുകൾ ലക്ഷ്യമിടുന്നു

മൈക്രോസോഫ്റ്റ് പറഞ്ഞു: “ഫൈ മോഡലുകളുമായുള്ള ഞങ്ങളുടെ പ്രവർത്തനം വളരെ ഉയർന്ന തോതിലുള്ള മോഡലുകൾക്ക് തുല്യമായ പ്രകടനം കൈവരിക്കുന്ന എസ്എൽഎമ്മുകളെ പരിശീലിപ്പിച്ചുകൊണ്ട് ഈ ചോദ്യത്തിന് ഉത്തരം നൽകാൻ ലക്ഷ്യമിടുന്നു(ഇപ്പോഴും അതിർത്തി മോഡലുകളിൽ നിന്ന് വളരെ അകലെയാണ്).

ഗവേഷണ കമ്മ്യൂണിറ്റിയിൽ നിന്ന് സാധാരണയായി ഉപയോഗിക്കുന്ന പ്രോംപ്റ്റുകളിൽ കമ്പനി വിപുലമായ പരിശോധന നടത്തി.

“ഞങ്ങൾ ബെഞ്ച്മാർക്ക് ഫലങ്ങൾ നൽകിയ പ്രതീക്ഷയ്ക്ക് അനുസൃതമായി ഒരു പെരുമാറ്റം ഞങ്ങൾ നിരീക്ഷിച്ചു,” ടെക് ഭീമൻ പറഞ്ഞു.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

Leave a Reply