തങ്ങളുടെ പുതിയ മോഡലുകൾ ജിപിടി -4 നെ മറികടന്നുവെന്ന് ആന്ത്രോപിക് അവകാശപ്പെടുന്നു

ഗൂഗിളിന്റെ പിന്തുണയുള്ള ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സ്റ്റാർട്ടപ്പായ ആന്ത്രോപിക്, നൂറുകണക്കിന് ദശലക്ഷക്കണക്കിന് വെഞ്ച്വർ ക്യാപിറ്റലും (ഒരുപക്ഷേ ഉടൻ തന്നെ നൂറുകണക്കിന് ദശലക്ഷങ്ങൾ കൂടി) തങ്ങളുടെ ജെൻഎഐ സാങ്കേതികവിദ്യയുടെ ഏറ്റവും പുതിയ പതിപ്പായ ക്ലോഡ് പ്രഖ്യാപിച്ചു. പ്രകടനത്തിന്റെ കാര്യത്തിൽ എഐ ചാറ്റ്ബോട്ട് ഓപ്പൺ എഐയുടെ ജിപിടി -4 ആണെന്ന് കമ്പനി അവകാശപ്പെടുന്നു.

ക്ലോഡ് 3, ആന്ത്രോപിക്കിന്റെ പുതിയ ജെനായ് എന്നറിയപ്പെടുന്ന ക്ലോഡ് 3, മോഡലുകളുടെ ഒരു കുടുംബമാണ് – ക്ലോഡ് 3 ഹൈക്കു, ക്ലോഡ് 3 സോണറ്റ്, ക്ലോഡ് 3 ഓപ്പസ്, ഓപ്പസ് ഏറ്റവും ശക്തമാണ്. വിശകലനത്തിലും പ്രവചനത്തിലും “വർദ്ധിച്ച കഴിവുകൾ” കാണിക്കുന്നു, ആന്ത്രോപിക് ക്ലെയിമുകൾ, ചാറ്റ് ജിപിടി, ജിപിടി -4 (എന്നാൽ ജിപിടി -4 ടർബോ അല്ല), ഗൂഗിളിന്റെ ജെമിനി 1.0 അൾട്രാ (എന്നാൽ ജെമിനി 1.5 പ്രോ അല്ല) തുടങ്ങിയ മോഡലുകൾക്കെതിരെ നിർദ്ദിഷ്ട മാനദണ്ഡങ്ങളിൽ മെച്ചപ്പെട്ട പ്രകടനം കാണിക്കുന്നു.

ക്ലോഡ് 3 ആന്ത്രോപിക്കിന്റെ ആദ്യത്തെ മൾട്ടിമോഡൽ ജെൻഎഐ ആണ്, അതായത് ഇതിന് ടെക്സ്റ്റും ചിത്രങ്ങളും വിശകലനം ചെയ്യാൻ കഴിയും – ജിപിടി -4, ജെമിനി എന്നിവയുടെ ചില രുചികൾക്ക് സമാനമായി. ഫോട്ടോകൾ, ചാർട്ടുകൾ, ഗ്രാഫുകൾ, സാങ്കേതിക രേഖാചിത്രങ്ങൾ, പിഡിഎഫുകൾ, സ്ലൈഡ് ഷോകൾ, മറ്റ് ഡോക്യുമെന്റ് തരങ്ങൾ എന്നിവയിൽ നിന്ന് ഡ്രോയിംഗ് ചെയ്യാൻ ക്ലോഡ് 3 ന് കഴിയും.

ചില ജെൻഎഐ എതിരാളികളേക്കാൾ മികച്ച ഒരു ഘട്ടത്തിൽ, ക്ലോഡ് 3 ന് ഒരൊറ്റ അഭ്യർത്ഥനയിൽ ഒന്നിലധികം ചിത്രങ്ങൾ വിശകലനം ചെയ്യാൻ കഴിയും (പരമാവധി 20 വരെ). ചിത്രങ്ങൾ താരതമ്യം ചെയ്യാനും താരതമ്യം ചെയ്യാനും ഇത് അനുവദിക്കുന്നു, ആന്ത്രോപിക് കുറിക്കുന്നു.

എന്നാൽ ക്ലോഡ് 3 യുടെ ഇമേജ് പ്രോസസ്സിംഗിന് പരിമിതികളുണ്ട്.

ആളുകളെ തിരിച്ചറിയുന്നതിൽ നിന്ന് ആന്ത്രോപിക് മോഡലുകളെ പ്രവർത്തനരഹിതമാക്കിയിട്ടുണ്ട് – ധാർമ്മികവും നിയമപരവുമായ പ്രത്യാഘാതങ്ങളെക്കുറിച്ച് ജാഗ്രത പുലർത്തുന്നു എന്നതിൽ സംശയമില്ല. ക്ലോഡ് 3 “താഴ്ന്ന നിലവാരമുള്ള” ചിത്രങ്ങളിൽ (200 പിക്സലുകളിൽ താഴെ) തെറ്റുകൾ വരുത്താൻ സാധ്യതയുണ്ടെന്നും സ്പേഷ്യൽ റീസണിംഗ് (ഉദാ. അനലോഗ് ക്ലോക്ക് മുഖം വായിക്കുക), ഒബ്ജക്റ്റ് കൗണ്ടിംഗ് (ചിത്രങ്ങളിലെ വസ്തുക്കളുടെ കൃത്യമായ എണ്ണം നൽകാൻ ക്ലോഡ് 3 ന് കഴിയില്ല) എന്നിവ ഉൾപ്പെടുന്ന ജോലികളുമായി പോരാടുന്നുവെന്നും കമ്പനി സമ്മതിക്കുന്നു.

ക്ലോഡ് 3 കലാസൃഷ്ടികളും സൃഷ്ടിക്കില്ല. മോഡലുകൾ കർശനമായി ഇമേജ് വിശകലനം ചെയ്യുന്നു – കുറഞ്ഞത് ഇപ്പോൾ.

ഫീൽഡിംഗ് ടെക്സ്റ്റോ ഇമേജുകളോ ആകട്ടെ, ക്ലോഡ് 3 മൾട്ടി-സ്റ്റെപ്പ് നിർദ്ദേശങ്ങൾ മികച്ച രീതിയിൽ പിന്തുടരുമെന്നും ജെഎസ്എൻ പോലുള്ള ഫോർമാറ്റുകളിൽ ഘടനാപരമായ ഔട്ട്പുട്ട് നിർമ്മിക്കുമെന്നും മുൻഗാമികളുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ ഇംഗ്ലീഷ് ഒഴികെയുള്ള ഭാഷകളിൽ സംവദിക്കുമെന്നും ഉപഭോക്താക്കൾക്ക് പൊതുവെ പ്രതീക്ഷിക്കാമെന്ന് ആന്ത്രോപിക് പറയുന്നു. “അഭ്യർത്ഥനകളെക്കുറിച്ച് കൂടുതൽ സൂക്ഷ്മമായ ധാരണ” ഉള്ളതിനാൽ ക്ലോഡ് 3 പലപ്പോഴും ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ വിസമ്മതിക്കണമെന്ന് ആന്ത്രോപിക് പറയുന്നു. താമസിയാതെ, മോഡലുകൾ ചോദ്യങ്ങൾക്കുള്ള ഉത്തരങ്ങളുടെ ഉറവിടം ഉദ്ധരിക്കും, അതിനാൽ ഉപയോക്താക്കൾക്ക് അവ പരിശോധിക്കാൻ കഴിയും.

“ക്ലോഡ് 3 കൂടുതൽ വ്യക്തവും ആകർഷകവുമായ പ്രതികരണങ്ങൾ സൃഷ്ടിക്കുന്നു,” ആന്ത്രോപിക് ഒരു പിന്തുണാ ലേഖനത്തിൽ എഴുതുന്നു. “ഞങ്ങളുടെ പാരമ്പര്യ മോഡലുകളുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ പ്രേരിപ്പിക്കാനും നയിക്കാനും എളുപ്പമാണ്. ഹ്രസ്വവും കൂടുതൽ സംക്ഷിപ്തവുമായ പ്രോംപ്റ്റുകൾ ഉപയോഗിച്ച് ആഗ്രഹിക്കുന്ന ഫലങ്ങൾ നേടാൻ കഴിയുമെന്ന് ഉപയോക്താക്കൾ കണ്ടെത്തണം.

ആ മെച്ചപ്പെടുത്തലുകളിൽ ചിലത് ക്ലോഡ് 3 ന്റെ വിപുലീകരിച്ച സന്ദർഭത്തിൽ നിന്നാണ് ഉത്ഭവിക്കുന്നത്.

ഒരു മോഡലിന്റെ സന്ദർഭം അല്ലെങ്കിൽ സന്ദർഭ ജാലകം, ഔട്ട്പുട്ട് സൃഷ്ടിക്കുന്നതിന് മുമ്പ് മോഡൽ പരിഗണിക്കുന്ന ഇൻപുട്ട് ഡാറ്റയെ (ഉദാ. ടെക്സ്റ്റ്) സൂചിപ്പിക്കുന്നു. ചെറിയ സന്ദർഭ ജാലകങ്ങളുള്ള മോഡലുകൾ വളരെ സമീപകാല സംഭാഷണങ്ങളുടെ ഉള്ളടക്കം പോലും “മറക്കുന്നു”, ഇത് അവരെ വിഷയം ഒഴിവാക്കുന്നതിലേക്ക് നയിക്കുന്നു – പലപ്പോഴും പ്രശ്നകരമായ രീതിയിൽ. ഒരു കൂട്ടിച്ചേർക്കൽ എന്ന നിലയിൽ, വലിയ സന്ദർഭ മോഡലുകൾക്ക് അവർ എടുക്കുന്ന ഡാറ്റയുടെ ആഖ്യാന ഒഴുക്ക് നന്നായി ഗ്രഹിക്കാനും കൂടുതൽ സന്ദർഭോചിതമായി സമ്പന്നമായ പ്രതികരണങ്ങൾ സൃഷ്ടിക്കാനും കഴിയും (സാങ്കൽപ്പികമായി, കുറഞ്ഞത്).

ക്ലോഡ് 3 തുടക്കത്തിൽ 150,000 വാക്കുകൾക്ക് തുല്യമായ 200,000 ടോക്കൺ സന്ദർഭ ജാലകത്തെ പിന്തുണയ്ക്കുമെന്ന് ആന്ത്രോപിക് പറയുന്നു, തിരഞ്ഞെടുത്ത ഉപഭോക്താക്കൾക്ക് 1 ദശലക്ഷം ടോക്കൺ സന്ദർഭ ജാലകം (~ 700,000 വാക്കുകൾ) ലഭിക്കും. ഇത് ഗൂഗിളിന്റെ ഏറ്റവും പുതിയ ജെൻഎഐ മോഡലായ മുകളിൽ സൂചിപ്പിച്ച ജെമിനി 1.5 പ്രോയ്ക്ക് തുല്യമാണ്, ഇത് ഒരു ദശലക്ഷം ടോക്കൺ സന്ദർഭ ജാലകം വരെ വാഗ്ദാനം ചെയ്യുന്നു.

ഇപ്പോൾ, ക്ലോഡ് 3 അതിന് മുമ്പുള്ളതിനേക്കാൾ ഒരു അപ്ഗ്രേഡ് ആയതിനാൽ അത് മികച്ചതാണെന്ന് അർത്ഥമാക്കുന്നില്ല.

ഒരു സാങ്കേതിക വൈറ്റ് പേപ്പറിൽ, ക്ലോഡ് 3 മറ്റ് ജെൻഎഐ മോഡലുകളെ ബാധിക്കുന്ന പ്രശ്നങ്ങളിൽ നിന്ന് മുക്തമല്ലെന്ന് ആന്ത്രോപിക് സമ്മതിക്കുന്നു, അതായത് പക്ഷപാതം, മതിഭ്രമം (അതായത് കാര്യങ്ങൾ നിർമ്മിക്കൽ). ചില ജെൻഎഐ മോഡലുകളിൽ നിന്ന് വ്യത്യസ്തമായി, ക്ലോഡ് 3 ന് വെബിൽ തിരയാൻ കഴിയില്ല; മോഡലുകൾക്ക് 2023 ഓഗസ്റ്റിന് മുമ്പുള്ള ഡാറ്റ ഉപയോഗിച്ച് മാത്രമേ ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ കഴിയൂ. ക്ലോഡ് ബഹുഭാഷക്കാരനാണെങ്കിലും, ചില “ലോ-റിസോഴ്സ്” ഭാഷകളിൽ ഇംഗ്ലീഷുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ ഇത് അത്ര പ്രാവീണ്യമുള്ളതല്ല.

എന്നാൽ വരും മാസങ്ങളിൽ ക്ലോഡ് 3 യിലേക്ക് ആന്ത്രോപിക് പതിവായി അപ്ഡേറ്റുകൾ നൽകുന്നു.

“മോഡൽ ഇന്റലിജൻസ് അതിന്റെ പരിധിക്കടുത്താണെന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്നില്ല, അടുത്ത കുറച്ച് മാസങ്ങളിൽ ക്ലോഡ് 3 മോഡൽ കുടുംബത്തിന് [മെച്ചപ്പെടുത്തലുകൾ] പുറത്തിറക്കാൻ ഞങ്ങൾ പദ്ധതിയിടുന്നു,” കമ്പനി ഒരു ബ്ലോഗ് പോസ്റ്റിൽ എഴുതുന്നു.

ഓപസും സോണറ്റും ഇപ്പോൾ വെബിലും ആന്ത്രോപിക്കിന്റെ ദേവ് കൺസോൾ, എപിഐ, ആമസോണിന്റെ ബെഡ്റോക്ക് പ്ലാറ്റ്ഫോം, ഗൂഗിളിന്റെ വെർടെക്സ് എഐ എന്നിവയിലൂടെയും ലഭ്യമാണ്. ഹൈക്കു ഈ വർഷം അവസാനം വരും.

വിലനിർണ്ണയ തകർച്ച ഇതാ:

ഓപുസ്: ഒരു ദശലക്ഷം ഇൻപുട്ട് ടോക്കണുകൾക്ക് $ 15, $ ഔട്ട്പുട്ട് ടോക്കണുകൾക്ക് $ 75

സോണറ്റ്: ദശലക്ഷം ഇൻപുട്ട് ടോക്കണുകൾക്ക് $ 3, $ ഔട്ട്പുട്ട് ടോക്കണുകൾക്ക് $ 15

ഹൈകു: ഒരു ദശലക്ഷം ഇൻപുട്ട് ടോക്കണുകൾക്ക് 0.25 ഡോളർ, ദശലക്ഷം ഔട്ട്പുട്ട് ടോക്കണുകൾക്ക് 1.25 ഡോളർ

അതാണ് ക്ലോഡ് 3. എന്നാൽ ഇതിന്റെയെല്ലാം 30,000 അടി കാഴ്ച എന്താണ്?

ശരി, ഞങ്ങൾ മുമ്പ് റിപ്പോർട്ട് ചെയ്തതുപോലെ, “ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സ്വയം പഠിപ്പിക്കലിനായി” ഒരു അടുത്ത തലമുറ അൽഗോരിതം സൃഷ്ടിക്കുക എന്നതാണ് ആന്ത്രോപിക്കിന്റെ അഭിലാഷം. ഇമെയിലുകൾക്ക് ഉത്തരം നൽകാനും ഗവേഷണം നടത്താനും കല, പുസ്തകങ്ങൾ എന്നിവയും അതിലേറെയും സൃഷ്ടിക്കാനും കഴിയുന്ന വെർച്വൽ അസിസ്റ്റന്റുകൾ നിർമ്മിക്കാൻ അത്തരമൊരു അൽഗോരിതം ഉപയോഗിക്കാം – അവയിൽ ചിലത് ഇതിനകം ജിപിടി -4, മറ്റ് വലിയ ഭാഷാ മോഡലുകൾ എന്നിവയുമായി ഞങ്ങൾക്ക് രുചി ലഭിച്ചിട്ടുണ്ട്.

മറ്റ് സിസ്റ്റങ്ങളുമായി സംവദിക്കാനും “സംവേദനാത്മകമായി” കോഡ് ചെയ്യാനും “നൂതന ഏജന്റിക് കഴിവുകൾ” നൽകാനും ക്ലോഡിനെ അനുവദിക്കുന്നതിലൂടെ അതിന്റെ ഗേറ്റിന് പുറത്തുള്ള കഴിവുകൾ വർദ്ധിപ്പിക്കുന്ന സവിശേഷതകൾ ക്ലോഡ് 3 ൽ ചേർക്കാൻ പദ്ധതിയിട്ടിട്ടുണ്ടെന്ന് ആന്ത്രോപിക് മേൽപ്പറഞ്ഞ ബ്ലോഗ് പോസ്റ്റിൽ ഇത് സൂചിപ്പിക്കുന്നു.

ഒരു ഡോക്യുമെന്റിൽ നിന്ന് ഒരു സ്പ്രെഡ്ഷീറ്റിലേക്ക് ഡാറ്റ കൈമാറുക അല്ലെങ്കിൽ ചെലവ് റിപ്പോർട്ടുകൾ യാന്ത്രികമായി പൂരിപ്പിച്ച് അക്കൗണ്ടിംഗ് സോഫ്റ്റ്വെയറിൽ നൽകുക തുടങ്ങിയ സങ്കീർണ്ണമായ ജോലികൾ യാന്ത്രികമാക്കുന്നതിന് ഒരു സോഫ്റ്റ്വെയർ ഏജന്റ് നിർമ്മിക്കാനുള്ള ഓപ്പൺഎഐയുടെ അഭിലാഷങ്ങൾ ഈ അവസാന ബിറ്റ് ഓർമ്മിപ്പിക്കുന്നു. ഡവലപ്പർമാരെ അവരുടെ അപ്ലിക്കേഷനുകളിൽ “ഏജന്റ് പോലുള്ള അനുഭവങ്ങൾ” നിർമ്മിക്കാൻ അനുവദിക്കുന്ന ഒരു എപിഐ ഓപ്പൺഎഐ ഇതിനകം വാഗ്ദാനം ചെയ്യുന്നു, കൂടാതെ താരതമ്യപ്പെടുത്താവുന്ന പ്രവർത്തനം നൽകാൻ ആന്ത്രോപിക് ഉദ്ദേശിക്കുന്നതായി തോന്നുന്നു.

അടുത്തതായി ആന്ത്രോപിക്കിൽ നിന്നുള്ള ഒരു ഇമേജ് ജനറേറ്റർ നമുക്ക് കാണാൻ കഴിയുമോ? സത്യം പറഞ്ഞാൽ അത് എന്നെ അത്ഭുതപ്പെടുത്തും. പകർപ്പവകാശവും പക്ഷപാതപരവുമായ കാരണങ്ങളാൽ ഇമേജ് ജനറേറ്ററുകൾ ഈ ദിവസങ്ങളിൽ വളരെയധികം വിവാദങ്ങൾക്ക് വിഷയമാണ്. ചരിത്രപരമായ സന്ദർഭത്തെ അവഗണിച്ചുകൊണ്ട് ചിത്രങ്ങളിൽ വൈവിധ്യം കുത്തിവച്ചതിനെത്തുടർന്ന് ഗൂഗിൾ അടുത്തിടെ ഇമേജ് ജനറേറ്റർ പ്രവർത്തനരഹിതമാക്കാൻ നിർബന്ധിതരായി. നഷ്ടപരിഹാരമോ ക്രെഡിറ്റോ പോലും നൽകാതെ ജെൻഎഐയെ ആ ജോലിയിൽ പരിശീലിപ്പിച്ച് തങ്ങളുടെ ജോലിയിൽ നിന്ന് ലാഭമുണ്ടാക്കിയെന്ന് ആരോപിക്കുന്ന കലാകാരന്മാരുമായി നിരവധി ഇമേജ് ജനറേറ്റർ വെണ്ടർമാർ നിയമ പോരാട്ടത്തിലാണ്.

ജെൻഎഐയെ പരിശീലിപ്പിക്കുന്നതിനുള്ള ആന്ത്രോപിക്കിന്റെ സാങ്കേതികതയായ “കോൺസ്റ്റിറ്റ്യൂഷണൽ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്” ന്റെ പരിണാമം കാണാൻ എനിക്ക് ജിജ്ഞാസയുണ്ട്, ഇത് അതിന്റെ ജെൻഎഐയുടെ പെരുമാറ്റം മനസിലാക്കാൻ എളുപ്പവും കൂടുതൽ പ്രവചനാതീതവും ആവശ്യാനുസരണം ക്രമീകരിക്കാൻ ലളിതവുമാക്കുന്നു. ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മാനുഷിക ഉദ്ദേശ്യങ്ങളുമായി യോജിപ്പിക്കുന്നതിനുള്ള ഒരു മാർഗം നൽകാനാണ് കോൺസ്റ്റിറ്റ്യൂഷണൽ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ലക്ഷ്യമിടുന്നത്, മോഡലുകൾ ചോദ്യങ്ങളോട് പ്രതികരിക്കുകയും ലളിതമായ മാർഗ്ഗനിർദ്ദേശ തത്വങ്ങൾ ഉപയോഗിച്ച് ജോലികൾ നിർവഹിക്കുകയും ചെയ്യുന്നു. ഉദാഹരണത്തിന്, ക്ലോഡ് 3-നായി, വൈകല്യമുള്ള ആളുകൾക്ക് മനസിലാക്കാനും ആക്സസ് ചെയ്യാനും മോഡലുകൾ നിർദ്ദേശിക്കുന്ന ഒരു തത്വം – ക്രൗഡ് സോഴ്സ് ഫീഡ്ബാക്ക് വഴി അറിയിക്കുന്നു – ഇത് ചേർത്തതായി ആന്ത്രോപിക് പറഞ്ഞു.

ആന്ത്രോപിക്കിന്റെ എൻഡ് ഗെയിം എന്തുതന്നെയായാലും, അത് ദീർഘകാലത്തേക്ക് അതിൽ ഉണ്ട്. കഴിഞ്ഞ വർഷം മെയ് മാസത്തിൽ ചോർന്ന ഒരു പിച്ച് ഡെക്ക് അനുസരിച്ച്, അടുത്ത 12 മാസത്തിനുള്ളിൽ 5 ബില്യൺ ഡോളർ സമാഹരിക്കാനാണ് കമ്പനി ലക്ഷ്യമിടുന്നത് . (പരിശീലന മോഡലുകൾ വിലകുറഞ്ഞതല്ല, എല്ലാത്തിനുമുപരി.) ഗൂഗിളിൽ നിന്നും ആമസോണിൽ നിന്നും യഥാക്രമം 2 ബില്യൺ ഡോളർ, 4 ബില്യൺ ഡോളർ പ്രതിബദ്ധതയുള്ള മൂലധനവും പ്രതിജ്ഞകളും മറ്റ് പിന്തുണക്കാരിൽ നിന്ന് ഒരു ബില്ല്യണിലധികം.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

You May Also Like

ടെക് ദാതാക്കളെ ബാധിക്കുന്ന ട്രെൻഡുകൾക്ക് GenAI നേതൃത്വം നൽകുന്നു

പ്രൊഫഷണൽ ഫോട്ടോഗ്രാഫിക്ക് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഭീഷണിയാണോ?