എന്തുകൊണ്ടാണ് ഓപ്പൺഎഐ കണക്കിൽ മികച്ച ഒരു ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് വികസിപ്പിക്കുന്നത് ഇത്ര വലിയ കാര്യം

സാം ആൾട്ട്മാനെ ഓപ്പൺഎഐ അടുത്തിടെ പുറത്താക്കുകയും വേഗത്തിൽ പുനർനിയമിക്കുകയും ചെയ്തതോടെ, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് (എഐ) വികസിപ്പിക്കുന്നതും ഉപയോഗിക്കുന്നതും സംബന്ധിച്ച ചർച്ചകൾ വീണ്ടും ശ്രദ്ധാകേന്ദ്രമായി. ഏറ്റവും അസാധാരണമായ കാര്യം, മാധ്യമ റിപ്പോർട്ടിംഗിലെ ഒരു പ്രധാന വിഷയം കണക്ക് ചെയ്യാനുള്ള ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റങ്ങളുടെ കഴിവാണ് എന്നതാണ്.

പ്രത്യക്ഷത്തിൽ, ഓപ്പൺ എഐയിലെ ചില നാടകങ്ങൾ ക്യൂ * എന്ന പുതിയ എഐ അൽഗോരിതം കമ്പനിയുടെ വികസനവുമായി ബന്ധപ്പെട്ടതാണ്. ഈ സിസ്റ്റം ഒരു സുപ്രധാന മുന്നേറ്റമായി സംസാരിക്കപ്പെടുന്നു, അതിന്റെ പ്രധാന സവിശേഷതകളിലൊന്ന് ഗണിതശാസ്ത്രപരമായി യുക്തിസഹമായി ചിന്തിക്കാനുള്ള കഴിവാണ്.

എന്നാൽ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ അടിസ്ഥാനം ഗണിതശാസ്ത്രമല്ലേ? കമ്പ്യൂട്ടറുകൾക്കും കാൽക്കുലേറ്ററുകൾക്കും ഗണിതപരമായ ജോലികൾ നിർവഹിക്കാൻ കഴിയുമെന്നിരിക്കെ, ഒരു ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റത്തിന് ഗണിതശാസ്ത്ര യുക്തിയിൽ എങ്ങനെ പ്രശ്നമുണ്ടാകും?

AI എന്നത് ഒരൊറ്റ entity അല്ല. മനുഷ്യരിൽ നിന്ന് നേരിട്ടുള്ള നിർദ്ദേശമില്ലാതെ കണക്കുകൂട്ടൽ നടത്തുന്നതിനുള്ള തന്ത്രങ്ങളുടെ ഒരു കൂട്ടമാണിത്. ഞങ്ങൾ കാണും പോലെ, ചില ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റങ്ങൾ ഗണിതത്തിൽ കഴിവുള്ളവയാണ്.

എന്നിരുന്നാലും, നിലവിലെ ഏറ്റവും പ്രധാനപ്പെട്ട സാങ്കേതികവിദ്യകളിലൊന്നായ ചാറ്റ്ജിപിടി പോലുള്ള ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ചാറ്റ്ബോട്ടുകൾക്ക് പിന്നിലുള്ള വലിയ ഭാഷാ മോഡലുകൾ (എൽഎൽഎം) ഗണിതശാസ്ത്ര യുക്തി അനുകരിക്കാൻ ഇതുവരെ പാടുപെട്ടു. ഭാഷയിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നതിനാണ് അവ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത് എന്നതാണ് ഇതിന് കാരണം.

കമ്പനിയുടെ പുതിയ Q* അൽഗോരിതത്തിന് അദൃശ്യമായ ഗണിത പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ കഴിയുമെങ്കിൽ, അത് ഒരു പ്രധാന മുന്നേറ്റമായിരിക്കാം. വലിയ ഭാഷാ മോഡലുകൾ (എൽഎൽഎം) ഇതുവരെ അനുകരിക്കാൻ പാടുപെട്ട മനുഷ്യ യുക്തിയുടെ ഒരു പുരാതന രൂപമാണ് ഗണിതശാസ്ത്രം. OpenAI-യുടെ ChatGPT പോലുള്ള സംവിധാനങ്ങൾക്ക് അടിത്തറയിടുന്ന സാങ്കേതികവിദ്യയാണ് എൽഎൽഎമ്മുകൾ.

എഴുതുന്ന സമയത്ത്, Q* അൽഗോരിതത്തിന്റെ വിശദാംശങ്ങളും അതിന്റെ കഴിവുകളും പരിമിതമാണ്, പക്ഷേ വളരെ കൗതുകകരമാണ്. അതിനാൽ Q* ഒരു വിജയമായി കണക്കാക്കുന്നതിന് മുമ്പ് പരിഗണിക്കേണ്ട വിവിധ സൂക്ഷ്മതകളുണ്ട്.

ഉദാഹരണത്തിന്, കണക്ക് എല്ലാവരും വ്യത്യസ്ത പരിധികളിൽ ഇടപെടുന്ന ഒരു വിഷയമാണ്, കൂടാതെ Q* കഴിവുള്ള ഗണിതശാസ്ത്രത്തിന്റെ നില അവ്യക്തമായി തുടരുന്നു. എന്നിരുന്നാലും, ഗവേഷണ തലത്തിലുള്ള ഗണിതശാസ്ത്രം മുന്നോട്ട് കൊണ്ടുപോകുന്നതിന് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ ഇതര രൂപങ്ങൾ ഉപയോഗിക്കുന്ന പ്രസിദ്ധീകരിച്ച അക്കാദമിക് കൃതികൾ ഉണ്ട് (ചിലത് ഞാൻ എഴുതിയതും ഗൂഗിൾ ഡീപ്മൈൻഡിലെ ഗവേഷകരുമായി സഹകരിച്ച് ഒരു കൂട്ടം ഗണിതശാസ്ത്രജ്ഞർ എഴുതിയതും ഉൾപ്പെടെ).

ഈ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റങ്ങളെ ഗണിതത്തിൽ കഴിവുള്ളവ എന്ന് വിശേഷിപ്പിക്കാം. എന്നിരുന്നാലും, Q* അവരുടെ ജോലിയിൽ അക്കാദമിക് വിദഗ്ധരെ സഹായിക്കാൻ ഉപയോഗിക്കുന്നില്ല, മറിച്ച് മറ്റൊരു ഉദ്ദേശ്യത്തിനായി ഉദ്ദേശിച്ചുള്ളതാണ്.

എന്നിരുന്നാലും, അത്യാധുനിക ഗവേഷണത്തിന്റെ അതിരുകൾ മറികടക്കാൻ ക്യു* പ്രാപ്തനല്ലെങ്കിലും, ഭാവി വികസനത്തിന് മികച്ച അവസരങ്ങൾ ഉയർത്താൻ കഴിയുന്ന തരത്തിൽ ഇത് നിർമ്മിച്ച രീതിയിൽ ചില പ്രാധാന്യം കണ്ടെത്താൻ സാധ്യതയുണ്ട്.

ഒരു സമൂഹമെന്ന നിലയിൽ, മുൻകൂട്ടി നിശ്ചയിച്ച തരത്തിലുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ സ്പെഷ്യലിസ്റ്റ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉപയോഗിക്കുന്നതിൽ ഞങ്ങൾക്ക് കൂടുതൽ സൗകര്യമുണ്ട്. ഉദാഹരണത്തിന്, ഡിജിറ്റൽ അസിസ്റ്റന്റുകൾ, ഫേഷ്യൽ റെക്കഗ്നിഷൻ, ഓൺലൈൻ ശുപാർശ സംവിധാനങ്ങൾ എന്നിവ മിക്ക ആളുകൾക്കും പരിചിതമായിരിക്കും. ഒരു മനുഷ്യനുമായി താരതമ്യപ്പെടുത്താവുന്ന വിശാലമായ യുക്തിസഹമായ കഴിവുകളുള്ള “ആർട്ടിഫിഷ്യൽ ജനറൽ ഇന്റലിജൻസ്” (എജിഐ) എന്ന് വിളിക്കപ്പെടുന്നതാണ് അവ്യക്തമായി അവശേഷിക്കുന്നത്.

ഓരോ സ്കൂൾ കുട്ടിക്കും പഠിപ്പിക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്ന ഒരു അടിസ്ഥാന നൈപുണ്യമാണ് ഗണിതശാസ്ത്രം, ഇത് തീർച്ചയായും എജിഐക്കായുള്ള അന്വേഷണത്തിലെ ഒരു അടിസ്ഥാന നാഴികക്കല്ലായി യോഗ്യത നേടും. അപ്പോൾ ഗണിതശാസ്ത്രപരമായി കഴിവുള്ള ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സംവിധാനങ്ങൾ സമൂഹത്തിന് എങ്ങനെ സഹായകമാകും?

ഗണിതശാസ്ത്ര മനോഭാവം നിരവധി ആപ്ലിക്കേഷനുകൾക്ക് പ്രസക്തമാണ്, ഉദാഹരണത്തിന് കോഡിംഗ്, എഞ്ചിനീയറിംഗ്, അതിനാൽ ഗണിതശാസ്ത്ര യുക്തി മനുഷ്യന്റെയും കൃത്രിമ ബുദ്ധിയുടെയും ഒരു സുപ്രധാന കൈമാറ്റ കഴിവാണ്. ഒരു വിരോധാഭാസം എന്തെന്നാൽ, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഒരു അടിസ്ഥാന തലത്തിൽ ഗണിതശാസ്ത്രത്തെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്.

ഉദാഹരണത്തിന്, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അൽഗോരിതങ്ങൾ നടപ്പിലാക്കുന്ന പല സാങ്കേതികവിദ്യകളും ആത്യന്തികമായി മാട്രിക്സ് ബീജഗണിതം എന്നറിയപ്പെടുന്ന ഒരു ഗണിത മേഖലയിലേക്ക് ചുരുങ്ങുന്നു. ഒരു മാട്രിക്സ് കേവലം സംഖ്യകളുടെ ഒരു ഗ്രിഡ് മാത്രമാണ്, അതിൽ ഒരു ഡിജിറ്റൽ ഇമേജ് പരിചിതമായ ഉദാഹരണമാണ്. ഓരോ പിക്സലും സംഖ്യാ ഡാറ്റയല്ലാതെ മറ്റൊന്നുമല്ല.

വലിയ ഭാഷാ മാതൃകകളും അന്തർലീനമായി ഗണിതശാസ്ത്രപരമാണ്. ടെക്സ്റ്റിന്റെ ഒരു വലിയ സാമ്പിളിനെ അടിസ്ഥാനമാക്കി, ഉപയോക്താവിൽ നിന്ന് ചാറ്റ്ബോട്ടിലേക്ക് ഒരു പ്രോംപ്റ്റ് (അല്ലെങ്കിൽ ചോദ്യം) പിന്തുടരാൻ സാധ്യതയുള്ള വാക്കുകളുടെ സാധ്യതകൾ ഒരു യന്ത്രത്തിന് പഠിക്കാൻ കഴിയും. ഒരു പ്രത്യേക വിഷയത്തിൽ സ്പെഷ്യലൈസ് ചെയ്യാൻ മുൻകൂട്ടി പരിശീലനം ലഭിച്ച എൽഎൽഎം നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, അത് ഗണിതശാസ്ത്ര സാഹിത്യത്തിലോ മറ്റേതെങ്കിലും പഠന മേഖലയിലോ നന്നായി ക്രമീകരിക്കാൻ കഴിയും. ഗണിതശാസ്ത്രം മനസ്സിലാക്കുന്നതുപോലെ വായിക്കുന്ന ടെക്സ്റ്റ് സൃഷ്ടിക്കാൻ ഒരു എൽഎൽഎമ്മിന് കഴിയും.

നിർഭാഗ്യവശാൽ, അങ്ങനെ ചെയ്യുന്നത് ഒരു എൽഎൽഎം സൃഷ്ടിക്കുന്നു, അത് കബളിപ്പിക്കുന്നതിൽ നല്ലതാണ്, പക്ഷേ വിശദാംശങ്ങളിൽ മോശമാണ്. ഒരു ഗണിത പ്രസ്താവന, നിർവചനപ്രകാരം, വ്യക്തമായ ബൂലിയൻ മൂല്യം (അതായത്, ശരിയോ തെറ്റോ) നൽകാവുന്ന ഒന്നാണ് എന്നതാണ് പ്രശ്നം. ഗണിതശാസ്ത്ര യുക്തി മുമ്പ് സ്ഥാപിതമായവയിൽ നിന്ന് പുതിയ ഗണിത പ്രസ്താവനകളുടെ യുക്തിസഹമായ കിഴിവിന് തുല്യമാണ്.

സ്വാഭാവികമായും, ഭാഷാപരമായ സാധ്യതകളെ ആശ്രയിക്കുന്ന ഗണിതശാസ്ത്ര യുക്തിചിന്തയിലേക്കുള്ള ഏതൊരു സമീപനവും അതിന്റെ പാതയ്ക്ക് പുറത്തേക്ക് നയിക്കാൻ പോകുന്നു. ആർക്കിടെക്ചറിൽ (എൽഎൽഎം കൃത്യമായി എങ്ങനെ നിർമ്മിക്കുന്നു) ഔപചാരിക പരിശോധനയുടെ ചില സംവിധാനം ഉൾപ്പെടുത്തുക എന്നതാണ് ഇതിനുള്ള ഒരു മാർഗം, ഇത് വലിയ ഭാഷാ മോഡൽ നടത്തിയ കുതിച്ചുചാട്ടത്തിന് പിന്നിലെ യുക്തി തുടർച്ചയായി പരിശോധിക്കുന്നു.

ഇത് ചെയ്തതിന്റെ ഒരു സൂചന ക്യു * എന്ന പേരിലായിരിക്കാം, ഇത് 1970 കളിൽ വികസിപ്പിച്ചെടുത്ത ഒരു അൽഗോരിതത്തെ സൂചിപ്പിക്കാം. പകരമായി, Q* എന്നത് Q-ലേണിംഗ് സൂചിപ്പിക്കുന്നു, അതിൽ ശരിയായ നിഗമനങ്ങൾ പരീക്ഷിക്കുകയും പ്രതിഫലം നൽകുകയും ചെയ്യുന്നതിലൂടെ ഒരു മോഡലിന് കാലക്രമേണ മെച്ചപ്പെടാൻ കഴിയും.

എന്നാൽ ഗണിതശാസ്ത്രപരമായി കഴിവുള്ള എഐകൾ കെട്ടിപ്പടുക്കുന്നതിന് നിരവധി വെല്ലുവിളികൾ നിലനിൽക്കുന്നു. ഉദാഹരണത്തിന്, ഏറ്റവും രസകരമായ ചില ഗണിതശാസ്ത്രത്തിൽ വളരെ സാധ്യതയില്ലാത്ത സംഭവങ്ങൾ അടങ്ങിയിരിക്കുന്നു. ചെറിയ സംഖ്യകളെ അടിസ്ഥാനമാക്കി ഒരു പാറ്റേൺ നിലവിലുണ്ടെന്ന് ഒരാൾ കരുതുന്ന നിരവധി സാഹചര്യങ്ങളുണ്ട്, പക്ഷേ വേണ്ടത്ര കേസുകൾ പരിശോധിക്കുമ്പോൾ അത് അപ്രതീക്ഷിതമായി തകരുന്നു. ഈ കഴിവ് ഒരു യന്ത്രത്തിൽ ഉൾപ്പെടുത്താൻ പ്രയാസമാണ്.

മറ്റൊരു വെല്ലുവിളി ആശ്ചര്യകരമായി വന്നേക്കാം: ഗണിതശാസ്ത്ര ഗവേഷണം വളരെ സർഗ്ഗാത്മകമാണ്. പ്രാക്ടീഷണർമാർ പുതിയ ആശയങ്ങൾ കണ്ടുപിടിക്കുകയും എന്നിട്ടും ഒരു പുരാതന വിഷയത്തിന്റെ ഔപചാരിക നിയമങ്ങളിൽ ഉറച്ചുനിൽക്കുകയും വേണം.

നിലവിലുള്ള ഗണിതശാസ്ത്രത്തിലെ പാറ്റേണുകൾ കണ്ടെത്താൻ മാത്രം പരിശീലിപ്പിച്ച ഏതൊരു ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് രീതിശാസ്ത്രത്തിനും ഒരിക്കലും യഥാർത്ഥത്തിൽ പുതിയ ഗണിതശാസ്ത്രം സൃഷ്ടിക്കാൻ കഴിയില്ല. ഗണിതശാസ്ത്രവും സാങ്കേതികവിദ്യയും തമ്മിലുള്ള പൈപ്പ് ലൈൻ കണക്കിലെടുക്കുമ്പോൾ, ഇത് പുതിയ സാങ്കേതിക വിപ്ലവങ്ങളുടെ ആശയത്തെ ഒഴിവാക്കുന്നതായി തോന്നുന്നു.

എന്നാൽ നമുക്ക് ഒരു നിമിഷത്തേക്ക് പിശാചിന്റെ വക്താവായി അഭിനയിക്കാം, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന് യഥാർത്ഥത്തിൽ പുതിയ ഗണിതശാസ്ത്രം സൃഷ്ടിക്കാൻ കഴിയുമോ എന്ന് സങ്കൽപ്പിക്കാം. ഇതിനെതിരായ മുൻ വാദത്തിന് ഒരു പോരായ്മയുണ്ട്, അതിൽ മികച്ച മനുഷ്യ ഗണിതശാസ്ത്രജ്ഞരും നേരത്തെയുള്ള ഗണിതശാസ്ത്രത്തിൽ മാത്രം പരിശീലനം നേടിയിരുന്നുവെന്നും പറയാം. വലിയ ഭാഷാ മോഡലുകൾ മുമ്പ് നമ്മെ അത്ഭുതപ്പെടുത്തിയിട്ടുണ്ട്, വീണ്ടും അങ്ങനെ ചെയ്യും.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

You May Also Like

ആപ്പിളിന്റെ ചാറ്റ്ജിപിടി പോലുള്ള ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സവിശേഷതകൾ 'ഈ വർഷം അവസാനം' വരുമെന്ന് ടിം കുക്ക്

എന്താണ് Galaxy AI? ഗാലക്സി എസ് 24 സീരീസിൽ സാംസങ്ങിന്റെ ജനറേറ്റീവ് എഐ പുഷ് തകർക്കുന്നു

എൽഎൽഎം ഇമേജ് എഡിറ്റിംഗ് ടൂൾ ഉപയോഗിച്ച് ആപ്പിൾ അതിന്റെ ജെൻഎഐ ശ്രമങ്ങൾ ത്വരിതപ്പെടുത്തുന്നു