ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ നിരന്തരം വികസിച്ചുകൊണ്ടിരിക്കുന്ന ലോകത്ത്, ഗവേഷകർ പ്രചോദനത്തിന്റെ അപ്രതീക്ഷിത ഉറവിടത്തിലേക്ക് തിരിയുന്നു: ഹാരി പോട്ടറിന്റെ മാന്ത്രിക പ്രപഞ്ചം. വർദ്ധിച്ചുവരുന്ന ഗവേഷകർ ഹാരി, ഹെർമിയോണി, റോൺ എന്നിവരുടെ ലോകത്തേക്ക് ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സാങ്കേതികവിദ്യയുടെ കഴിവുകൾ പര്യവേക്ഷണം ചെയ്യുന്നു.
ജനപ്രിയ സംസ്കാരത്തിൽ നിലനിൽക്കുന്ന സ്വാധീനവും അവയുടെ പേജുകളിൽ കാണപ്പെടുന്ന സങ്കീർണ്ണമായ പദപ്രയോഗവും കാരണം ഹാരി പോട്ടർ പുസ്തകങ്ങൾ ഭാഷാ മോഡലുകളിൽ പരീക്ഷണം നടത്തുന്നതിനുള്ള സമ്പന്നമായ ഉറവിടമാണെന്ന് തെളിയിക്കുന്നു.
“ആരാണ് ഹാരി പോട്ടർ?” എന്ന തലക്കെട്ടിലുള്ള ശ്രദ്ധേയമായ ഒരു പഠനം, വലിയ ഭാഷാ മോഡലുകളെ വിവരങ്ങൾ തിരഞ്ഞെടുക്കാൻ അനുവദിക്കുന്ന ഒരു അത്ഭുതകരമായ സാങ്കേതികത പര്യവേക്ഷണം ചെയ്യുന്നു. മൈക്രോസോഫ്റ്റ് ഗവേഷകരായ മാർക്ക് റസ്സിനോവിച്ച്, റോണൻ എൽഡൻ എന്നിവർ ഹാരി പോട്ടർ പുസ്തകങ്ങളെക്കുറിച്ചുള്ള അറിവ് മായ്ച്ചുകളയാൻ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകൾ പരിഷ്കരിക്കാമെന്ന് തെളിയിച്ചു. ഹാരി പോട്ടറിന്റെ തിരഞ്ഞെടുപ്പ് മനഃപൂർവമായിരുന്നു, കാരണം സീരീസ് സാർവത്രികമായി പരിചിതമാണ്, ഇത് ഗവേഷകർക്ക് സാങ്കേതികതയുടെ ഫലപ്രാപ്തി വിലയിരുത്തുന്നത് എളുപ്പമാക്കി.
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ചാറ്റ്ബോട്ടുകളെ ശക്തിപ്പെടുത്തുന്ന വലിയ ഭാഷാ മോഡലുകളെ പരിശീലിപ്പിക്കാൻ ഉപയോഗിക്കുന്ന വിശാലമായ ഡാറ്റാസെറ്റുകളിലെ പകർപ്പവകാശമുള്ള മെറ്റീരിയലും പ്രശ്നകരമായ ഉള്ളടക്കവും സംബന്ധിച്ച് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് വ്യവസായം വെല്ലുവിളികൾ നേരിടുന്നു. ഇത് ചില ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് കമ്പനികൾക്ക് നിയമപ്രശ്നങ്ങൾക്കും പൊതു പരിശോധനയ്ക്കും കാരണമായി. റസ്സിനോവിച്ച്, എൽഡൻ എന്നിവരുടെ ഗവേഷണം ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകൾക്ക് അവയുടെ പ്രവർത്തനത്തിൽ വിട്ടുവീഴ്ച ചെയ്യാതെ നിർദ്ദിഷ്ട ഉള്ളടക്കം പഠിക്കാൻ കഴിയുമെന്ന് കാണിച്ചുകൊണ്ട് ഒരു സാധ്യതയുള്ള പരിഹാരം നിർദ്ദേശിക്കുന്നു.
വാഷിംഗ്ടൺ സർവകലാശാല, ബെർക്ക്ലിയിലെ കാലിഫോർണിയ സർവകലാശാല, അലൻ ഇൻസ്റ്റിറ്റ്യൂട്ട് ഫോർ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് എന്നിവയിലെ ഗവേഷകർ നടത്തിയ മറ്റൊരു പഠനത്തിൽ സിലോ എന്ന ഭാഷാ മോഡൽ അവതരിപ്പിക്കുന്നു. വിവരങ്ങൾ തിരഞ്ഞെടുത്ത് നീക്കം ചെയ്യുന്നതിലൂടെ ഡാറ്റയുമായി ബന്ധപ്പെട്ട നിയമപരമായ അപകടസാധ്യതകൾ കുറയ്ക്കാൻ ഈ മോഡൽ ലക്ഷ്യമിടുന്നു. എന്നിരുന്നാലും, കുറഞ്ഞ അപകടസാധ്യതയുള്ള ടെക്സ്റ്റിൽ മാത്രം പരിശീലനം ലഭിച്ചപ്പോൾ സിലോയുടെ പ്രകടനം മോശമായതായി ഗവേഷകർ കണ്ടെത്തി. കൂടുതൽ അന്വേഷിക്കാൻ, ഒരു ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റത്തിന്റെ പ്രകടനത്തെ വ്യക്തിഗത ടെക്സ്റ്റ് കഷണങ്ങൾ എങ്ങനെ ബാധിക്കുന്നുവെന്ന് വിശകലനം ചെയ്യാൻ അവർ ഹാരി പോട്ടർ പുസ്തകങ്ങളിലേക്ക് തിരിഞ്ഞു.
ഗവേഷകർ രണ്ട് ഡാറ്റാ സ്റ്റോറുകൾ സൃഷ്ടിച്ചു – ഒന്ന് ആദ്യത്തെ ഹാരി പോട്ടർ പുസ്തകം ഒഴികെ പ്രസിദ്ധീകരിച്ച എല്ലാ പുസ്തകങ്ങളും, രണ്ടാമത്തേത് ഒഴികെയുള്ള സീരീസിലെ എല്ലാ പുസ്തകങ്ങളും ഉൾക്കൊള്ളുന്നു. ഡാറ്റാ സ്റ്റോറിൽ നിന്ന് ഹാരി പോട്ടർ പുസ്തകങ്ങൾ നീക്കം ചെയ്യുന്നത് മോഡലിന്റെ കൃത്യതയിൽ ഇടിവുണ്ടാക്കി, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകൾ വിലയിരുത്താൻ ഉപയോഗിക്കുന്ന ഒരു മെട്രിക്കായ ആശയക്കുഴപ്പം അളന്നു.
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് പഠനങ്ങളിൽ ഹാരി പോട്ടറിന്റെ ഉപയോഗം കുറഞ്ഞത് ഒരു ദശകമായി നിലവിലുണ്ട്, പക്ഷേ സ്വാഭാവിക ഭാഷയെ ഫലപ്രദമായി മനസിലാക്കാനും പ്രതികരിക്കാനും കഴിയുന്ന ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉപകരണങ്ങൾ വികസിപ്പിക്കുന്നതിൽ ഗവേഷകർ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നതിനാൽ ഇത് കൂടുതൽ സാധാരണമായി. ഹാരി പോട്ടർ സീരീസിലെ രംഗങ്ങൾ, ഡയലോഗുകൾ, വൈകാരിക നിമിഷങ്ങൾ എന്നിവയുടെ സമൃദ്ധി സ്വാഭാവിക ഭാഷാ പ്രോസസ്സിംഗ് മേഖലയ്ക്ക് പ്രത്യേകിച്ചും പ്രസക്തമാക്കുന്നു.
ശാസ്ത്രീയ ഗവേഷണത്തിന്റെ ഓപ്പൺ-ആക്സസ് ശേഖരമായ arXiv-നെക്കുറിച്ചുള്ള സമീപകാല പ്രബന്ധങ്ങളിൽ “ഹോഗ് വാർട്ട്സിലെ മരുന്ന് വികസനത്തിനായുള്ള മെഷീൻ ലേണിംഗ്”, “ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ ഹാരി പോട്ടറിനെ കണ്ടുമുട്ടുന്നു”, “ട്രാൻസ്ഫോർമർ അധിഷ്ഠിത ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉപയോഗിച്ച് ഫാന്റസി സാഹിത്യത്തിലെ സ്പെല്ലുകൾ കണ്ടെത്തൽ” തുടങ്ങിയ കൗതുകകരമായ ശീർഷകങ്ങൾ ഉൾപ്പെടുന്നു.
ഗവേഷണത്തിന്റെ കേന്ദ്രത്തിലല്ലെങ്കിലും, ഹാരി പോട്ടർ ഗവേഷകരുടെ പ്രിയപ്പെട്ട സാഹിത്യ റഫറൻസായി തുടരുന്നു. ഒരു പഠനത്തിൽ, സജീവമായ സംവാദങ്ങൾക്ക് കാരണമായ ചാറ്റ്ജിപിടിയുടെ സൃഷ്ടിയ്ക്ക് പിന്നിലുള്ളവ ഉൾപ്പെടെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റങ്ങളുടെ ബുദ്ധി പരിശോധിക്കാൻ റൗളിംഗിന്റെ കൃതികൾ ഉപയോഗിച്ചു. സാൽക്ക് ഇൻസ്റ്റിറ്റ്യൂട്ട് ഫോർ ബയോളജിക്കൽ സ്റ്റഡീസിലെ ടെറൻസ് സെജ്നോവ്സ്കി ചാറ്റ്ബോട്ടുകളെ ആദ്യത്തെ ഹാരി പോട്ടർ പുസ്തകത്തിലെ മിറർ ഓഫ് എറിസഡിനോട് ഉപമിച്ചു, അവ അവരുടെ ഉപയോക്താക്കളുടെ ബുദ്ധിയും പക്ഷപാതവും പ്രതിഫലിപ്പിക്കുന്നുവെന്ന് നിർദ്ദേശിച്ചു.
