ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ‘ബ്രേക്ക് ത്രൂ’: ഭാഷയെ സാമാന്യവൽക്കരിക്കാൻ ന്യൂറൽ നെറ്റ് മനുഷ്യനെപ്പോലെയുള്ള കഴിവുണ്ട്

You are currently viewing ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ‘ബ്രേക്ക് ത്രൂ’: ഭാഷയെ സാമാന്യവൽക്കരിക്കാൻ ന്യൂറൽ നെറ്റ് മനുഷ്യനെപ്പോലെയുള്ള കഴിവുണ്ട്

ഭാഷയെക്കുറിച്ച് സാമാന്യവൽക്കരണങ്ങൾ നടത്താനുള്ള മനുഷ്യനെപ്പോലെയുള്ള കഴിവുള്ള ഒരു ന്യൂറൽ നെറ്റ് വർക്ക് ശാസ്ത്രജ്ഞർ സൃഷ്ടിച്ചു1. ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റം പുതുതായി പഠിച്ച വാക്കുകൾ നിലവിലുള്ള പദാവലിയിലേക്ക് മടക്കി പുതിയ സന്ദർഭങ്ങളിൽ ഉപയോഗിക്കുന്നതിൽ മനുഷ്യരെപ്പോലെ പ്രവർത്തിക്കുന്നു, ഇത് സിസ്റ്റമാറ്റിക് സാമാന്യവൽക്കരണം എന്നറിയപ്പെടുന്ന മനുഷ്യ വിജ്ഞാനത്തിന്റെ ഒരു പ്രധാന വശമാണ്.

ചാറ്റ്ബോട്ട് ചാറ്റ്ജിപിടിക്ക് അടിത്തറയിടുന്ന ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലിന് ഗവേഷകർ അതേ ചുമതല നൽകി, കൂടാതെ ചാറ്റ്ബോട്ടിന് മനുഷ്യനെപ്പോലെ സംവദിക്കാനുള്ള വിചിത്രമായ കഴിവുണ്ടെങ്കിലും, പുതിയ ന്യൂറൽ നെറ്റ് അല്ലെങ്കിൽ ആളുകളേക്കാൾ അത്തരമൊരു പരിശോധനയിൽ ഇത് വളരെ മോശമാണെന്ന് കണ്ടെത്തി.

നേച്ചറിൽ ഒക്ടോബർ 25 ന് പ്രസിദ്ധീകരിച്ച ഈ കൃതി, ഇന്നത്തെ മികച്ച ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റങ്ങളേക്കാൾ സ്വാഭാവികമായി ആളുകളുമായി ഇടപഴകുന്ന യന്ത്രങ്ങളിലേക്ക് നയിച്ചേക്കാം. ചാറ്റ്ജിപിടി പോലുള്ള വലിയ ഭാഷാ മോഡലുകളെ അടിസ്ഥാനമാക്കിയുള്ള സംവിധാനങ്ങൾ പല സന്ദർഭങ്ങളിലും സംഭാഷണത്തിൽ വൈദഗ്ധ്യം നേടിയിട്ടുണ്ടെങ്കിലും, അവ മറ്റുള്ളവരിൽ പ്രകടമായ വിടവുകളും പൊരുത്തക്കേടുകളും കാണിക്കുന്നു.

ന്യൂറൽ നെറ്റ് വർക്കിന്റെ മനുഷ്യസമാനമായ പ്രകടനം സൂചിപ്പിക്കുന്നത് “നെറ്റ് വർക്കുകളെ വ്യവസ്ഥാപിതമാക്കാൻ പരിശീലിപ്പിക്കാനുള്ള കഴിവിൽ ഒരു മുന്നേറ്റം” ഉണ്ടായിട്ടുണ്ടെന്ന് മേരിലാൻഡിലെ ബാൾട്ടിമോറിലെ ജോൺസ് ഹോപ്കിൻസ് സർവകലാശാലയിലെ ഭാഷയിൽ വിദഗ്ധനായ കോഗ്നിറ്റീവ് സയന്റിസ്റ്റ് പോൾ സ്മോലെൻസ്കി പറയുന്നു.

ഭാഷാ പാഠങ്ങൾ

പുതിയ ക്രമീകരണങ്ങളിൽ പുതുതായി നേടിയ വാക്കുകൾ അനായാസമായി ഉപയോഗിക്കാനുള്ള ആളുകളുടെ കഴിവാണ് സിസ്റ്റമാറ്റിക് സാമാന്യവൽക്കരണം പ്രകടമാക്കുന്നത്. ഉദാഹരണത്തിന്, ‘ഫോട്ടോബോംബ്’ എന്ന വാക്കിന്റെ അർത്ഥം ആരെങ്കിലും ഗ്രഹിച്ചുകഴിഞ്ഞാൽ, ‘ഫോട്ടോബോംബ് രണ്ട് തവണ’ അല്ലെങ്കിൽ ‘സൂം കോളിനിടെ ഫോട്ടോബോംബ്’ പോലുള്ള വിവിധ സാഹചര്യങ്ങളിൽ അവർക്ക് ഇത് ഉപയോഗിക്കാൻ കഴിയും. അതുപോലെ, ‘പൂച്ച നായയെ പിന്തുടരുന്നു’ എന്ന വാചകം മനസ്സിലാക്കുന്ന ഒരാൾക്ക് കൂടുതൽ ചിന്തിക്കാതെ ‘നായ പൂച്ചയെ പിന്തുടരുന്നു’ എന്നും മനസ്സിലാകും.

എന്നാൽ ഈ കഴിവ് ന്യൂറൽ നെറ്റ് വർക്കുകളിലേക്ക് സ്വതസിദ്ധമായി വരുന്നില്ല, ഇത് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഗവേഷണത്തിൽ ആധിപത്യം പുലർത്തുന്ന മനുഷ്യ വിജ്ഞാനത്തെ അനുകരിക്കുന്നതിനുള്ള ഒരു രീതിയാണെന്ന് ന്യൂയോർക്ക് സർവകലാശാലയിലെ കോഗ്നിറ്റീവ് കമ്പ്യൂട്ടേഷണൽ സയന്റിസ്റ്റും പഠനത്തിന്റെ സഹ-രചയിതാവുമായ ബ്രെൻഡൻ ലേക്ക് പറയുന്നു. ആളുകളിൽ നിന്ന് വ്യത്യസ്തമായി, ആ വാക്ക് ഉപയോഗിക്കുന്ന നിരവധി സാമ്പിൾ ടെക്സ്റ്റുകളിൽ പരിശീലനം നേടുന്നതുവരെ ന്യൂറൽ നെറ്റ്സ് ഒരു പുതിയ വാക്ക് ഉപയോഗിക്കാൻ പാടുപെടുന്നു. ഇത്തരത്തിലുള്ള വ്യവസ്ഥാപിതത പ്രകടമാക്കാൻ കഴിയുന്നില്ലെങ്കിൽ ന്യൂറൽ നെറ്റ് വർക്കുകൾ എപ്പോഴെങ്കിലും മനുഷ്യന്റെ അറിവിന്റെ വിശ്വസനീയമായ മാതൃകയാകുമോ എന്നതിനെക്കുറിച്ച് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഗവേഷകർ ഏകദേശം 40 വർഷമായി തർക്കത്തിലാണ്.

ശീർഷകം വ്യക്തമാക്കിയിട്ടില്ല

ഈ സംവാദം പരിഹരിക്കാൻ, രചയിതാക്കൾ ആദ്യം 25 പേരെ പരീക്ഷിച്ചു, പുതുതായി പഠിച്ച വാക്കുകൾ വ്യത്യസ്ത സാഹചര്യങ്ങളിലേക്ക് എത്ര നന്നായി വിന്യസിക്കുന്നു. രണ്ട് തരം അസംബന്ധ വാക്കുകൾ ഉൾക്കൊള്ളുന്ന ഒരു കപട ഭാഷയിൽ പരീക്ഷിച്ചുകൊണ്ട് പങ്കെടുക്കുന്നവർ ആദ്യമായി വാക്കുകൾ പഠിക്കുമെന്ന് ഗവേഷകർ ഉറപ്പാക്കി. ‘ഡാക്സ്’, ‘വൈഫ്’, ‘ലുഗ്’ തുടങ്ങിയ ‘പ്രാകൃത’ വാക്കുകൾ ‘സ്കിപ്പ്’, ‘ജമ്പ്’ തുടങ്ങിയ അടിസ്ഥാന, മൂർത്തമായ പ്രവർത്തനങ്ങളെ പ്രതിനിധീകരിക്കുന്നു. ‘ബ്ലിക്കറ്റ്’, ‘കിക്കി’, ‘ഫെപ്’ തുടങ്ങിയ കൂടുതൽ അമൂർത്തമായ ‘ഫംഗ്ഷൻ’ വാക്കുകൾ പ്രാകൃത വസ്തുക്കൾ ഉപയോഗിക്കുന്നതിനും സംയോജിപ്പിക്കുന്നതിനുമുള്ള നിയമങ്ങൾ വ്യക്തമാക്കിയിട്ടുണ്ട്, ഇതിന്റെ ഫലമായി ‘മൂന്ന് തവണ ചാടുക’ അല്ലെങ്കിൽ ‘പിന്നോട്ട് പോകുക’ തുടങ്ങിയ സീക്വൻസുകൾ ഉണ്ടാകുന്നു.

ഓരോ പ്രാകൃത പദത്തെയും ഒരു പ്രത്യേക നിറത്തിലുള്ള വൃത്തവുമായി ബന്ധിപ്പിക്കാൻ പങ്കെടുക്കുന്നവർക്ക് പരിശീലനം നൽകി, അതിനാൽ ഒരു ചുവന്ന വൃത്തം ‘ഡാക്സിനെ’ പ്രതിനിധീകരിക്കുന്നു, നീല വൃത്തം ‘ലഗിനെ’ പ്രതിനിധീകരിക്കുന്നു. പ്രാകൃതവും പ്രവർത്തനപരവുമായ പദങ്ങളുടെ സംയോജനങ്ങളും വൃത്തങ്ങളുടെ പാറ്റേണുകളും ഗവേഷകർ പങ്കാളികൾക്ക് കാണിച്ചുകൊടുത്തു, പ്രാകൃതർക്ക് ഫംഗ്ഷനുകൾ പ്രയോഗിക്കുമ്പോൾ ഉണ്ടാകുന്ന വൃത്തങ്ങൾ. ഉദാഹരണത്തിന്, ‘ഡാക്സ് ഫെപ്പ്’ എന്ന പദം മൂന്ന് ചുവന്ന വൃത്തങ്ങളും മൂന്ന് നീല വൃത്തങ്ങളുള്ള ‘ലുഗ് ഫെപ്പ്’ എന്ന പ്രയോഗവും കാണിച്ചു, ഇത് ഒരു പ്രാകൃത വൃത്തം മൂന്ന് തവണ ആവർത്തിക്കുന്നതിനുള്ള അമൂർത്ത നിയമത്തെ സൂചിപ്പിക്കുന്നു.

അവസാനമായി, പ്രാകൃതതകളുടെയും പ്രവർത്തനങ്ങളുടെയും സങ്കീർണ്ണമായ സംയോജനങ്ങൾ നൽകിക്കൊണ്ട് ഈ അമൂർത്ത നിയമങ്ങൾ പ്രയോഗിക്കാനുള്ള പങ്കാളികളുടെ കഴിവ് ഗവേഷകർ പരീക്ഷിച്ചു. തുടർന്ന് അവർ ശരിയായ നിറവും വൃത്തങ്ങളുടെ എണ്ണവും തിരഞ്ഞെടുത്ത് ഉചിതമായ ക്രമത്തിൽ സ്ഥാപിക്കേണ്ടതുണ്ട്.

കോഗ്നിറ്റീവ് ബെഞ്ച്മാർക്ക്

പ്രവചിച്ചതുപോലെ, ആളുകൾ ഈ ദൗത്യത്തിൽ മികവ് പുലർത്തി; അവർ ശരാശരി 80% സമയവും വർണ്ണ വൃത്തങ്ങളുടെ ശരിയായ സംയോജനം തിരഞ്ഞെടുത്തു. അവർ തെറ്റുകൾ വരുത്തിയപ്പോൾ, അറിയപ്പെടുന്ന മാനുഷിക പക്ഷപാതങ്ങളെ പ്രതിഫലിപ്പിക്കുന്ന ഒരു മാതൃക ഇവ പിന്തുടർന്നതായി ഗവേഷകർ ശ്രദ്ധിച്ചു.

അടുത്തതായി, ഗവേഷകർ ഒരു ന്യൂറൽ നെറ്റ് വർക്കിനെ പങ്കാളികൾക്ക് അവതരിപ്പിച്ചതിന് സമാനമായ ഒരു ജോലി ചെയ്യാൻ പരിശീലിപ്പിച്ചു, അതിന്റെ തെറ്റുകളിൽ നിന്ന് പഠിക്കാൻ പ്രോഗ്രാമിംഗ് നടത്തി. ന്യൂറൽ നെറ്റ്സ് പരിശീലിപ്പിക്കുന്നതിനുള്ള സ്റ്റാൻഡേർഡ് സമീപനമായ സ്റ്റാറ്റിക് ഡാറ്റാ സെറ്റ് ഉപയോഗിക്കുന്നതിനുപകരം ഓരോ ജോലിയും പൂർത്തിയാക്കുമ്പോൾ പഠിക്കാൻ ഈ സമീപനം ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനെ അനുവദിച്ചു. ന്യൂറൽ നെറ്റ് മനുഷ്യനെപ്പോലെയാക്കുന്നതിന്, മനുഷ്യരുടെ പരിശോധനാ ഫലങ്ങളിൽ അവർ നിരീക്ഷിച്ച പിശകുകളുടെ പാറ്റേണുകൾ പുനർനിർമ്മിക്കാൻ രചയിതാക്കൾ അതിനെ പരിശീലിപ്പിച്ചു. ന്യൂറൽ നെറ്റ് പിന്നീട് പുതിയ പസിലുകളിൽ പരീക്ഷിച്ചപ്പോൾ, അതിന്റെ ഉത്തരങ്ങൾ മിക്കവാറും മനുഷ്യ സന്നദ്ധപ്രവർത്തകരുടെ ഉത്തരങ്ങളുമായി പൊരുത്തപ്പെട്ടു, ചില സന്ദർഭങ്ങളിൽ അവരുടെ പ്രകടനത്തെക്കാൾ കൂടുതലായിരുന്നു.

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ ഒരു പരീക്ഷണം

ഇതിനു വിപരീതമായി, ജിപിടി -4 അതേ ദൗത്യവുമായി പൊരുതി, ഗവേഷകർ ഈ ദൗത്യം എങ്ങനെ അവതരിപ്പിച്ചു എന്നതിനെ ആശ്രയിച്ച് ശരാശരി 42 മുതൽ 86% വരെ പരാജയപ്പെട്ടു. “ഇത് മായാജാലമല്ല, പരിശീലനമാണ്,” ലേക്ക് പറയുന്നു. “മാതൃഭാഷ പഠിക്കുമ്പോൾ ഒരു കുട്ടിക്കും പരിശീലനം ലഭിക്കുന്നതുപോലെ, മോഡലുകൾ അവരുടെ ഘടനാപരമായ പഠന ജോലികളിലൂടെ അവരുടെ ഘടനാപരമായ കഴിവുകൾ മെച്ചപ്പെടുത്തുന്നു.”

ന്യൂ മെക്സിക്കോയിലെ സാന്താ ഫെ ഇൻസ്റ്റിറ്റ്യൂട്ടിലെ കമ്പ്യൂട്ടർ, കോഗ്നിറ്റീവ് സയന്റിസ്റ്റ് മെലാനി മിച്ചൽ പറയുന്നത് ഈ പഠനം തത്വത്തിന്റെ രസകരമായ തെളിവാണ്, പക്ഷേ ഈ പരിശീലന രീതിക്ക് വളരെ വലിയ ഡാറ്റാ സെറ്റിലോ ചിത്രങ്ങളിലോ സാമാന്യവൽക്കരിക്കാൻ കഴിയുമോ എന്ന് കണ്ടറിയണം. ചെറുപ്പം മുതലേ ആളുകൾ വ്യവസ്ഥാപിത സാമാന്യവൽക്കരണത്തിനുള്ള ഒരു വൈദഗ്ദ്ധ്യം എങ്ങനെ വികസിപ്പിക്കുന്നുവെന്ന് പഠിക്കുന്നതിലൂടെയും കൂടുതൽ ശക്തമായ ന്യൂറൽ നെറ്റ് നിർമ്മിക്കുന്നതിന് ആ കണ്ടെത്തലുകൾ ഉൾപ്പെടുത്തുന്നതിലൂടെയും ഈ പ്രശ്നം പരിഹരിക്കാൻ കഴിയുമെന്ന് ലേക്ക് പ്രതീക്ഷിക്കുന്നു.

ഈ ഗവേഷണം ന്യൂറൽ നെറ്റ് വർക്കുകളെ കൂടുതൽ കാര്യക്ഷമമായ പഠിതാക്കളാക്കുമെന്ന് ജർമ്മനിയിലെ ഓസ്നാബ്രൂക്ക് സർവകലാശാലയിലെ നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസിംഗിലെ സ്പെഷ്യലിസ്റ്റ് എലിയ ബ്രൂണി പറയുന്നു. ഇത് ചാറ്റ്ജിപിടി പോലുള്ള സിസ്റ്റങ്ങളെ പരിശീലിപ്പിക്കുന്നതിന് ആവശ്യമായ ഡാറ്റയുടെ അളവ് കുറയ്ക്കുകയും ‘മതിഭ്രമം’ കുറയ്ക്കുകയും ചെയ്യും, ഇത് നിലവിലില്ലാത്ത പാറ്റേണുകൾ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് തിരിച്ചറിയുകയും കൃത്യതയില്ലാത്ത ഔട്ട്പുട്ടുകൾ സൃഷ്ടിക്കുകയും ചെയ്യുമ്പോൾ സംഭവിക്കുന്നു. “ന്യൂറൽ നെറ്റ് വർക്കുകളിലേക്ക് വ്യവസ്ഥാപിതത ഉൾപ്പെടുത്തുന്നത് ഒരു വലിയ കാര്യമാണ്,” ബ്രൂണി പറയുന്നു. “ഈ രണ്ട് പ്രശ്നങ്ങളും ഒരേ സമയം പരിഹരിക്കാൻ കഴിയും.”

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

Leave a Reply