മൈക്രോസോഫ്റ്റ് തങ്ങളുടെ ഏറ്റവും പുതിയ കോംപാക്ട് ‘ചെറിയ ഭാഷാ മോഡൽ’ ‘ഫൈ 2’ പുറത്തിറക്കി. പുതിയ കോംപാക്റ്റ് മോഡൽ 13 ബില്യണിൽ താഴെ പാരാമീറ്ററുകളുള്ള ചില വലിയ ഓപ്പൺ സോഴ്സ് ലാമ 2 മോഡലുകളേക്കാൾ മികച്ചതാണെന്ന് അവകാശപ്പെടുന്നു.

എന്താണ് Phi?

കഴിഞ്ഞ കുറച്ച് മാസങ്ങളായി, മൈക്രോസോഫ്റ്റ് റിസർച്ചിലെ മെഷീൻ ലേണിംഗ് ഫൗണ്ടേഷൻ ടീം “ഫൈ” എന്ന ചെറിയ ഭാഷാ മോഡലുകളുടെ (എസ്എൽഎം) ഒരു സ്യൂട്ട് പുറത്തിറക്കി, ഇത് വിവിധ മാനദണ്ഡങ്ങളിൽ ശ്രദ്ധേയമായ പ്രകടനം കൈവരിച്ചു.

Phi 1 കുറിച്ച്

ആദ്യ മോഡൽ, 1.3 ബില്യൺ പാരാമീറ്റർ ഫൈ 1 നിലവിലുള്ള എസ്എൽഎമ്മുകൾക്കിടയിൽ പൈത്തൺ കോഡിംഗിൽ അത്യാധുനിക പ്രകടനം കൈവരിക്കും (പ്രത്യേകിച്ച് ഹ്യൂമൻ ഇവൽ, എംബിപിപി മാനദണ്ഡങ്ങളിൽ).

13 ബില്യണിൽ താഴെ പാരാമീറ്ററുകളുള്ള അടിസ്ഥാന ഭാഷാ മോഡലുകൾക്കിടയിൽ അത്യാധുനിക പ്രകടനം പ്രദർശിപ്പിക്കുന്ന 2.7 ബില്യൺ പാരാമീറ്റർ ഭാഷാ മോഡലായ ഫൈ -2 ഞങ്ങൾ ഇപ്പോൾ പുറത്തിറക്കുകയാണെന്ന് കമ്പനി അറിയിച്ചു.

Phi 2 കുറിച്ച്

യന്ത്രവൽകൃത വ്യാഖ്യാനം, മികച്ച ട്യൂണിംഗ് പരീക്ഷണം, വിവിധ ജോലികളിൽ സുരക്ഷാ മെച്ചപ്പെടുത്തലുകൾ എന്നിവ ഉൾപ്പെടുന്ന ഗവേഷകർക്ക് അനുയോജ്യമായ കളിസ്ഥലമാണ് ഫൈ -2 എന്ന് പറയപ്പെടുന്നു.

ഭാഷാ മോഡലുകളിൽ ഗവേഷണവും വികസനവും പ്രോത്സാഹിപ്പിക്കുന്നതിനായി അഷ്വർ എഐ സ്റ്റുഡിയോ മോഡൽ കാറ്റലോഗിൽ ഞങ്ങൾ ഫൈ -2 ലഭ്യമാക്കിയിട്ടുണ്ടെന്ന് മൈക്രോസോഫ്റ്റ് പറഞ്ഞു.

ഭാഷാ മോഡലുകളുടെ വലുപ്പം നൂറുകണക്കിന് ബില്യൺ പാരാമീറ്ററുകളായി വർദ്ധിച്ചത് ഉയർന്നുവരുന്ന നിരവധി കഴിവുകൾ തുറന്നിട്ടുണ്ടെന്നും സ്വാഭാവിക ഭാഷാ പ്രോസസിംഗിന്റെ ലാൻഡ്സ്കേപ്പിനെ പുനർനിർവചിച്ചുവെന്നും പറയപ്പെടുന്നു.

എന്നിരുന്നാലും, പരിശീലനത്തിനുള്ള തന്ത്രപരമായ തിരഞ്ഞെടുപ്പുകൾ ഉപയോഗിച്ച് അത്തരം ഉയർന്നുവരുന്ന കഴിവുകൾ ചെറിയ തോതിൽ നേടാൻ കഴിയുമോ എന്ന ചോദ്യം അവശേഷിക്കുന്നു, ഉദാഹരണത്തിന്, ഡാറ്റ തിരഞ്ഞെടുപ്പ്.

എസ്എൽഎമ്മുകളെ പരിശീലിപ്പിച്ചുകൊണ്ട് ഈ ചോദ്യത്തിന് ഉത്തരം നൽകാൻ ഫൈ മോഡലുകൾ ലക്ഷ്യമിടുന്നു

മൈക്രോസോഫ്റ്റ് പറഞ്ഞു: “ഫൈ മോഡലുകളുമായുള്ള ഞങ്ങളുടെ പ്രവർത്തനം വളരെ ഉയർന്ന തോതിലുള്ള മോഡലുകൾക്ക് തുല്യമായ പ്രകടനം കൈവരിക്കുന്ന എസ്എൽഎമ്മുകളെ പരിശീലിപ്പിച്ചുകൊണ്ട് ഈ ചോദ്യത്തിന് ഉത്തരം നൽകാൻ ലക്ഷ്യമിടുന്നു(ഇപ്പോഴും അതിർത്തി മോഡലുകളിൽ നിന്ന് വളരെ അകലെയാണ്).

ഗവേഷണ കമ്മ്യൂണിറ്റിയിൽ നിന്ന് സാധാരണയായി ഉപയോഗിക്കുന്ന പ്രോംപ്റ്റുകളിൽ കമ്പനി വിപുലമായ പരിശോധന നടത്തി.

“ഞങ്ങൾ ബെഞ്ച്മാർക്ക് ഫലങ്ങൾ നൽകിയ പ്രതീക്ഷയ്ക്ക് അനുസൃതമായി ഒരു പെരുമാറ്റം ഞങ്ങൾ നിരീക്ഷിച്ചു,” ടെക് ഭീമൻ പറഞ്ഞു.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

You May Also Like

മികച്ച സാഹിത്യ സമ്മാനം നേടിയ ജാപ്പനീസ് എഴുത്തുകാരൻ നോവൽ എഴുതാൻ ചാറ്റ് ജിപിടി ഉപയോഗിച്ചതായി സമ്മതിക്കുന്നു

ജപ്പാനിലെ സാഹിത്യത്തിനുള്ള അഭിമാനകരമായ അകുതഗാവ സമ്മാനം അടുത്തിടെ നേടിയ റീ കുഡൻ, അവാർഡ് നേടിയ തന്റെ പുസ്തകമായ "ടോക്കിയോ-ടു ഡോജോ-ടു" (ടോക്കിയോ സിംപാറ്റി ടവർ) ന്റെ ഒരു...

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്: വരും ദശകങ്ങളിൽ പരിധിയില്ലാത്ത സാധ്യതകൾ തുറക്കുന്നതിനുള്ള താക്കോൽ

യന്ത്രങ്ങൾ നമ്മുടെ പേഴ്സണൽ അസിസ്റ്റന്റുമാരും അധ്യാപകരും സുഹൃത്തുക്കളും ആയി മാറിയ ഒരു ലോകത്തേക്ക് സ്വാഗതം. വരും ദശകങ്ങളിൽ പരിധിയില്ലാത്ത സാധ്യതകളുടെ ഒരു യുഗത്തിലേക്ക് വാതിൽ തുറക്കുന്ന താക്കോലായി...

വെബ് സൈറ്റുകളിലെ തിരയൽ ഫലങ്ങൾ കൂടുതൽ പ്രവർത്തനപരവും പിശക് രഹിതവുമാക്കാൻ ജനറേറ്റീവ് എഐക്ക് എങ്ങനെ കഴിയും

ഓൺലൈനിൽ ഒരു തൊപ്പി വാങ്ങുമ്പോൾ, സൈറ്റ് തിരയൽ ചോദ്യത്തിൽ നിങ്ങൾ കൗബോയ് തൊപ്പികൾ ചേർക്കുന്നു, പക്ഷേ തിരയൽ ഫലങ്ങൾ ഒരു കൗബോയ് ഉള്ള കുട്ടികളുടെ ടി-ഷർട്ടുകൾ കാണിക്കുന്നു....

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഗവേഷണത്തിലെ മുന്നേറ്റങ്ങൾ

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സാങ്കേതിക മുന്നേറ്റങ്ങളിൽ മുൻപന്തിയിൽ തുടരുന്നു, ഗവേഷകരും ശാസ്ത്രജ്ഞരും സാധ്യമായതിന്റെ അതിരുകൾ നീക്കുന്നു. ശക്തിപ്പെടുത്തൽ പഠനം: അതിമാനുഷിക പ്രകടനം കൈവരിക്കുക ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഗവേഷണത്തിലെ ഏറ്റവും...