മൈക്രോസോഫ്റ്റ് തങ്ങളുടെ ഏറ്റവും പുതിയ കോംപാക്ട് ‘ചെറിയ ഭാഷാ മോഡൽ’ ‘ഫൈ 2’ പുറത്തിറക്കി. പുതിയ കോംപാക്റ്റ് മോഡൽ 13 ബില്യണിൽ താഴെ പാരാമീറ്ററുകളുള്ള ചില വലിയ ഓപ്പൺ സോഴ്സ് ലാമ 2 മോഡലുകളേക്കാൾ മികച്ചതാണെന്ന് അവകാശപ്പെടുന്നു.

എന്താണ് Phi?

കഴിഞ്ഞ കുറച്ച് മാസങ്ങളായി, മൈക്രോസോഫ്റ്റ് റിസർച്ചിലെ മെഷീൻ ലേണിംഗ് ഫൗണ്ടേഷൻ ടീം “ഫൈ” എന്ന ചെറിയ ഭാഷാ മോഡലുകളുടെ (എസ്എൽഎം) ഒരു സ്യൂട്ട് പുറത്തിറക്കി, ഇത് വിവിധ മാനദണ്ഡങ്ങളിൽ ശ്രദ്ധേയമായ പ്രകടനം കൈവരിച്ചു.

Phi 1 കുറിച്ച്

ആദ്യ മോഡൽ, 1.3 ബില്യൺ പാരാമീറ്റർ ഫൈ 1 നിലവിലുള്ള എസ്എൽഎമ്മുകൾക്കിടയിൽ പൈത്തൺ കോഡിംഗിൽ അത്യാധുനിക പ്രകടനം കൈവരിക്കും (പ്രത്യേകിച്ച് ഹ്യൂമൻ ഇവൽ, എംബിപിപി മാനദണ്ഡങ്ങളിൽ).

13 ബില്യണിൽ താഴെ പാരാമീറ്ററുകളുള്ള അടിസ്ഥാന ഭാഷാ മോഡലുകൾക്കിടയിൽ അത്യാധുനിക പ്രകടനം പ്രദർശിപ്പിക്കുന്ന 2.7 ബില്യൺ പാരാമീറ്റർ ഭാഷാ മോഡലായ ഫൈ -2 ഞങ്ങൾ ഇപ്പോൾ പുറത്തിറക്കുകയാണെന്ന് കമ്പനി അറിയിച്ചു.

Phi 2 കുറിച്ച്

യന്ത്രവൽകൃത വ്യാഖ്യാനം, മികച്ച ട്യൂണിംഗ് പരീക്ഷണം, വിവിധ ജോലികളിൽ സുരക്ഷാ മെച്ചപ്പെടുത്തലുകൾ എന്നിവ ഉൾപ്പെടുന്ന ഗവേഷകർക്ക് അനുയോജ്യമായ കളിസ്ഥലമാണ് ഫൈ -2 എന്ന് പറയപ്പെടുന്നു.

ഭാഷാ മോഡലുകളിൽ ഗവേഷണവും വികസനവും പ്രോത്സാഹിപ്പിക്കുന്നതിനായി അഷ്വർ എഐ സ്റ്റുഡിയോ മോഡൽ കാറ്റലോഗിൽ ഞങ്ങൾ ഫൈ -2 ലഭ്യമാക്കിയിട്ടുണ്ടെന്ന് മൈക്രോസോഫ്റ്റ് പറഞ്ഞു.

ഭാഷാ മോഡലുകളുടെ വലുപ്പം നൂറുകണക്കിന് ബില്യൺ പാരാമീറ്ററുകളായി വർദ്ധിച്ചത് ഉയർന്നുവരുന്ന നിരവധി കഴിവുകൾ തുറന്നിട്ടുണ്ടെന്നും സ്വാഭാവിക ഭാഷാ പ്രോസസിംഗിന്റെ ലാൻഡ്സ്കേപ്പിനെ പുനർനിർവചിച്ചുവെന്നും പറയപ്പെടുന്നു.

എന്നിരുന്നാലും, പരിശീലനത്തിനുള്ള തന്ത്രപരമായ തിരഞ്ഞെടുപ്പുകൾ ഉപയോഗിച്ച് അത്തരം ഉയർന്നുവരുന്ന കഴിവുകൾ ചെറിയ തോതിൽ നേടാൻ കഴിയുമോ എന്ന ചോദ്യം അവശേഷിക്കുന്നു, ഉദാഹരണത്തിന്, ഡാറ്റ തിരഞ്ഞെടുപ്പ്.

എസ്എൽഎമ്മുകളെ പരിശീലിപ്പിച്ചുകൊണ്ട് ഈ ചോദ്യത്തിന് ഉത്തരം നൽകാൻ ഫൈ മോഡലുകൾ ലക്ഷ്യമിടുന്നു

മൈക്രോസോഫ്റ്റ് പറഞ്ഞു: “ഫൈ മോഡലുകളുമായുള്ള ഞങ്ങളുടെ പ്രവർത്തനം വളരെ ഉയർന്ന തോതിലുള്ള മോഡലുകൾക്ക് തുല്യമായ പ്രകടനം കൈവരിക്കുന്ന എസ്എൽഎമ്മുകളെ പരിശീലിപ്പിച്ചുകൊണ്ട് ഈ ചോദ്യത്തിന് ഉത്തരം നൽകാൻ ലക്ഷ്യമിടുന്നു(ഇപ്പോഴും അതിർത്തി മോഡലുകളിൽ നിന്ന് വളരെ അകലെയാണ്).

ഗവേഷണ കമ്മ്യൂണിറ്റിയിൽ നിന്ന് സാധാരണയായി ഉപയോഗിക്കുന്ന പ്രോംപ്റ്റുകളിൽ കമ്പനി വിപുലമായ പരിശോധന നടത്തി.

“ഞങ്ങൾ ബെഞ്ച്മാർക്ക് ഫലങ്ങൾ നൽകിയ പ്രതീക്ഷയ്ക്ക് അനുസൃതമായി ഒരു പെരുമാറ്റം ഞങ്ങൾ നിരീക്ഷിച്ചു,” ടെക് ഭീമൻ പറഞ്ഞു.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

You May Also Like

ഗൂഗിൾ ക്രോമിന് പുതിയ ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സവിശേഷതകൾ ലഭിക്കും: ടാബ് ഓർഗനൈസർ, ഇഷ് ടാനുസൃത തീമുകൾ എന്നിവയും അതിലേറെയും

ക്രോമിനായി ഗൂഗിൾ മൂന്ന് പുതിയ പരീക്ഷണാത്മക ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സവിശേഷതകൾ അവതരിപ്പിച്ചു. ക്രോം ബ്രൗസ് ചെയ്യാൻ കൂടുതൽ എളുപ്പവും കാര്യക്ഷമവുമാക്കാൻ പുതിയ സവിശേഷതകൾ ലക്ഷ്യമിടുന്നു. ക്രോമിന്റെ...

'ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഒരു വർഷത്തിനുള്ളിൽ എച്ച്ആർ മാനേജരുടെ ജോലി കൂടുതൽ തന്ത്രപ്രധാനമാക്കി'

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് (ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്) ജോലിയുടെ ഒരു പുതിയ യുഗം കൊണ്ടുവരുമ്പോൾ, ഇന്ത്യയിലെ 92 ശതമാനം റിക്രൂട്ട്മെന്റ് പ്രൊഫഷണലുകളും കഴിഞ്ഞ ഒരു വർഷത്തിനുള്ളിൽ തങ്ങളുടെ പങ്ക് കൂടുതൽ...

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉപകരണങ്ങളിൽ 'വ്യാപകമായ' ലിംഗ വിവേചനം യുനെസ്കോ കണ്ടെത്തി

യുനെസ്കോയുടെ ഇന്റർനാഷണൽ റിസർച്ച് സെന്റർ ഓൺ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിൽ നിന്നുള്ള ഒരു പുതിയ റിപ്പോർട്ട് അനുസരിച്ച്, ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ ഔട്ട്പുട്ടുകൾ ഇപ്പോഴും ഗണ്യമായ അളവിൽ ലിംഗപരവും...

അടുത്തയാഴ്ച ഓപ്പൺ എഐയുടെ ജിപിടി സ്റ്റോർ തുറക്കുന്നു: ഇത് എന്താണ്, എന്താണ് പ്രതീക്ഷിക്കേണ്ടത്? DEETS inside

ചാറ്റ് ജിപിടിയുടെ മാതൃ കമ്പനിയായ ഓപ്പൺഎഐ അടുത്ത ആഴ്ച ഓൺലൈൻ ജിപിടി സ്റ്റോർ ആരംഭിക്കാൻ ഒരുങ്ങുകയാണ്. ഈ സ്റ്റോറിൽ, ഉപയോക്താക്കൾക്ക് കമ്പനിയുടെ ശക്തമായ ഭാഷാ മോഡലുകളെ അടിസ്ഥാനമാക്കി...