സയൻസ് എക്സിന്റെ എഡിറ്റോറിയൽ പ്രക്രിയയും നയങ്ങളും അനുസരിച്ച് ഈ ലേഖനം അവലോകനം ചെയ്തിട്ടുണ്ട്. ഉള്ളടക്കത്തിന്റെ വിശ്വാസ്യത ഉറപ്പാക്കുമ്പോൾ എഡിറ്റർമാർ ഇനിപ്പറയുന്ന ആട്രിബ്യൂട്ടുകൾ ഉയർത്തിക്കാട്ടിയിട്ടുണ്ട്:
ഭാഷാശാസ്ത്രം, കമ്പ്യൂട്ടർ സയൻസ്, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് എന്നിവയുടെ ഇന്റർ ഡിസിപ്ലിനറി ഉപമേഖലയായ നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസിംഗുമായി (എൻഎൽപി) ബന്ധപ്പെട്ട ആപ്ലിക്കേഷനുകളിൽ അറബി ഭാഷയും അതിന്റെ വൈവിധ്യങ്ങളും ഉപയോഗിക്കുന്നതിന് ഷാർജ സർവകലാശാലയിലെ ഒരു കൂട്ടം ഗവേഷകരും എഞ്ചിനീയർമാരും ആഴത്തിലുള്ള പഠന സംവിധാനം വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്.
പ്രോഗ്രാമിംഗ് കമ്പ്യൂട്ടറുകൾ വലിയ അളവിൽ സ്വാഭാവിക ഭാഷാ ഡാറ്റ പ്രോസസ്സ് ചെയ്യാനും വിശകലനം ചെയ്യാനും വിവിധ ഭാഷാ പഠന കഴിവുകൾ വർദ്ധിപ്പിക്കുന്നതിനും വിവർത്തന കൃത്യത വർദ്ധിപ്പിക്കുന്നതിനുമുള്ള പ്രോഗ്രാമുകൾ വികസിപ്പിക്കാൻ സഹായിക്കുമ്പോൾ അറബി ഭാഷയെയും അതിന്റെ ഭാഷാഭേദങ്ങളെയും ഉൾക്കൊള്ളുന്നതിനായി എൻഎൽപി സിസ്റ്റങ്ങളിൽ വലിയ മെച്ചപ്പെടുത്തലുകൾ അവതരിപ്പിക്കുമെന്ന് ശാസ്ത്രജ്ഞർ പറയുന്നു.
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സാങ്കേതികവിദ്യകളിലെ നിലവിലെ പ്രവണതകളിൽ നിന്ന് പ്രയോജനം നേടാൻ ലോകത്തെ അര ബില്യൺ അറബി സംസാരിക്കുന്നവരെ സഹായിക്കുന്നതിന് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് പവർ ആപ്ലിക്കേഷനുകൾക്കായി അറബി ഭാഷയുടെ ഉപയോഗക്ഷമതയും ഉപയോഗവും വിലയിരുത്തുന്നതിനാണ് അക്കാദമിക് വിദഗ്ധരും എഞ്ചിനീയർമാരും ഉൾപ്പെടുന്ന സംഘം പദ്ധതി ആരംഭിച്ചത്. അവരുടെ പ്രവർത്തനത്തിന്റെ ഫലങ്ങൾ അന്താരാഷ്ട്ര ജേണലുകളിൽ പ്രത്യക്ഷപ്പെട്ടു.
ശാസ്ത്രജ്ഞർ സൃഷ്ടിക്കുന്ന പുതിയ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അധിഷ്ഠിത സംവിധാനം ഇംഗ്ലീഷ് ഒഴികെയുള്ള ഭാഷകൾ പ്രോസസ്സ് ചെയ്യുമ്പോൾ എൻഎൽപികൾ നേരിടുന്ന പരിമിതികളെ അഭിസംബോധന ചെയ്യുന്നു. കമ്പ്യൂട്ടറുകൾ സാധാരണയായി തിരിച്ചറിയുന്നതിൽ പരാജയപ്പെടുന്ന വലത്-ഇടത് ലിപിയും ഡയക്രിറ്റിക്സും ലാറ്റിൻ അക്ഷരമാലയെ അടിസ്ഥാനമാക്കിയുള്ള ഭാഷകളിൽ നിന്ന് വളരെയധികം വ്യതിചലിക്കുന്ന അറബി പോലുള്ള ഭാഷകളിൽ പ്രശ്നം രൂക്ഷമാകുന്നു.
ഈ പ്രശ്നം പരിഹരിക്കുന്നതിന്, യുണൈറ്റഡ് അറബ് എമിറേറ്റിലെ ഷാർജ സർവകലാശാലയിലെ കമ്പ്യൂട്ടർ സയൻസസ് പ്രൊഫസർ ഡോ. അഷ്റഫ് എൽനഗർ ഔപചാരിക അറബിക് മാത്രമല്ല, അതിന്റെ വിവിധ വൈരുദ്ധ്യാത്മക ഗ്രന്ഥങ്ങളും തിരിച്ചറിയാൻ പ്രോഗ്രാമർമാരെ സഹായിക്കുന്ന കമ്പ്യൂട്ടേഷണൽ ഉപകരണങ്ങളുടെ ഒരു പരമ്പര വികസിപ്പിക്കുന്നതിനായി അക്കാദമിക് വിദഗ്ധരുടെ ഒരു സംഘത്തെ നയിക്കുന്നു.
“പദ്ധതിയുടെ വിജയകരമായ പൂർത്തീകരണം പൊതുജനങ്ങൾ വ്യാപകമായി സ്വീകരിക്കാനുള്ള സാധ്യതയുണ്ട്, കാരണം ഇത് വിവിധ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അധിഷ്ഠിത ഭാഷാ ആപ്ലിക്കേഷനുകൾക്കും സേവനങ്ങൾക്കും നിരവധി ആനുകൂല്യങ്ങളും മെച്ചപ്പെടുത്തലുകളും വാഗ്ദാനം ചെയ്യുന്നു,” ഡോ എൽനഗർ പറയുന്നു. “വൈവിധ്യമാർന്ന ഉപയോക്താക്കളെയും വ്യവസായങ്ങളെയും നിറവേറ്റുന്നതിനും കൂടുതൽ ഫലപ്രദമായ ആശയവിനിമയം, പ്രവേശനക്ഷമത, പ്രാദേശികവൽക്കരണം എന്നിവ പ്രോത്സാഹിപ്പിക്കുന്നതിനും ഇതിന് കഴിവുണ്ട്.”
സ്റ്റാൻഡേർഡ് അറബിക് മാത്രമല്ല, അതിന്റെ നിരവധി ഭാഷാഭേദങ്ങളും കൃത്യമായി തിരിച്ചറിയുന്നതിന് മെഷീൻ വിവർത്തനം, വികാര വിശകലനം, സ്പീച്ച് റെക്കഗ്നിഷൻ തുടങ്ങിയ ആപ്ലിക്കേഷനുകളുടെ പ്രകടനവും ഉപയോക്തൃ അനുഭവവും മെച്ചപ്പെടുത്താനും അതുവഴി സാംസ്കാരിക സംരക്ഷണം, പ്രവേശനക്ഷമത, കൂടുതൽ ഫലപ്രദമായ ക്രോസ്-കൾച്ചറൽ ആശയവിനിമയം എന്നിവയ്ക്ക് സംഭാവന നൽകാനും ഇത് സഹായിക്കുമെന്ന് ഡോ എൽനഗർ പറയുന്നു.
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സഹായത്തോടെ അറബി ഭാഷയുടെ നില മെച്ചപ്പെടുത്തുന്നത് മിഡിൽ ഈസ്റ്റിലെ അറബി സംസാരിക്കുന്ന രാജ്യങ്ങളിൽ അടിയന്തിര കാര്യമായി മാറിയിരിക്കുന്നു, അവിടെ കമ്പ്യൂട്ടർ വിദഗ്ദ്ധരായ ഉപയോക്താക്കൾ വിവരങ്ങൾ വേഗത്തിൽ സൃഷ്ടിക്കുന്നതിനും എഴുത്ത് അസൈൻമെന്റുകൾ നടപ്പിലാക്കുന്നതിനും മറ്റ് ഭാഷാ കഴിവുകൾ മെച്ചപ്പെടുത്തുന്നതിനും ചാറ്റ്ജിപിടിയെയും മറ്റ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അധിഷ്ഠിത ആപ്ലിക്കേഷനുകളെയും ആശ്രയിക്കാൻ തുടങ്ങി.
ബിരുദ, ബിരുദ തലങ്ങളിലെ വിദ്യാർത്ഥി ഗവേഷണത്തെ അടിസ്ഥാനമാക്കിയാണ് പദ്ധതി നടപ്പാക്കുന്നതെന്ന് ഡോ എൽനഗർ പറയുന്നു. ഷാർജ സർവകലാശാലയിലെ കമ്പ്യൂട്ടർ സയൻസ് വിഭാഗത്തിൽ വേരൂന്നിയ ഈ പ്രോജക്റ്റ് ഞങ്ങളുടെ വിദ്യാർത്ഥികളുടെ ശ്രദ്ധേയമായ കഴിവുകളും അർപ്പണബോധവും പ്രദർശിപ്പിക്കുന്നു. ബിരുദ വിദ്യാർത്ഥികളുടെ ഒരു സീനിയർ പ്രോജക്റ്റ് എന്ന നിലയിലാണ് അതിന്റെ ആരംഭം,” ഡോ എൽനഗർ പറയുന്നു.
“പിന്നീട്, മറ്റൊരു വിദ്യാർത്ഥി വാചക ഡാറ്റ വിശകലനത്തിൽ ശ്രദ്ധ കേന്ദ്രീകരിച്ച് തന്റെ പ്രബന്ധത്തിന്റെ അടിസ്ഥാനമായി ഉപയോഗിച്ച് കൃതി വിപുലീകരിച്ചു. ഓഡിയോ ഫയൽ വിശകലനത്തിന്റെ മേഖലയിലേക്ക് കടക്കാൻ പ്രോജക്റ്റ് തയ്യാറാണ്. ഈ സുപ്രധാനവും ഫലപ്രദവുമായ പ്രോജക്റ്റ് പൂർണ്ണമായും വികസിപ്പിച്ചെടുത്ത ഞങ്ങളുടെ ആഭ്യന്തര പരിശീലനം ലഭിച്ച വിദ്യാർത്ഥികളിൽ ഞങ്ങൾ വളരെയധികം അഭിമാനിക്കുന്നു.
വിവിധ ഭാഷകളിലെ ഡവലപ്പർമാർ ഈ താൽപ്പര്യ തരംഗത്തിൽ വേഗത്തിൽ ചാടുന്നു, നിലവിൽ അവ സംസാരിക്കുന്നവർക്കായി ഇഷ്ടാനുസൃതമാക്കുന്ന നിരവധി അപ്ലിക്കേഷനുകൾ ഉണ്ട്. പ്രൊഫസർ എൽനഗറിന്റെ സിസ്റ്റം ലോകത്തിലെ ഏറ്റവും കൂടുതൽ ആളുകൾ സംസാരിക്കുന്ന ആറാമത്തെ ഭാഷയായ അറബിയെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഐ ചാറ്റ്ബോട്ട് ആപ്ലിക്കേഷനുകളിലേക്ക് ഒരു ഓപ്പറേറ്റിംഗ് സിസ്റ്റമായി ചേർക്കും.
അറബി ഭാഷയും അതിന്റെ ഭാഷാഭേദങ്ങളും പ്രോസസ്സ് ചെയ്യുന്നതിന് എൻഎൽപിയുമായി ബന്ധപ്പെട്ട ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉപകരണങ്ങൾ ഉപയോഗപ്രദമാക്കുന്നതിൽ ഡവലപ്പർമാരുടെ താൽപ്പര്യം തീവ്രമാണ്. എന്നിരുന്നാലും, തന്റെ ടീമിന്റെ സിസ്റ്റം വ്യത്യസ്തമാണെന്ന് ഡോ.
“മറ്റ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അറബി ഭാഷാ മോഡലുകളിൽ നിന്ന് ഞങ്ങളുടെ സിസ്റ്റത്തെ വ്യത്യസ്തമാക്കുന്നത് അറബി ഭാഷാഭേദങ്ങൾ കണ്ടെത്തുന്നതിനും പ്രോസസ്സ് ചെയ്യുന്നതിനും ഉള്ള പ്രത്യേക ശ്രദ്ധയാണ്. പല മോഡലുകളും മോഡേൺ സ്റ്റാൻഡേർഡ് അറബിക് അല്ലെങ്കിൽ സാധാരണയായി സംസാരിക്കുന്ന ഭാഷാഭേദങ്ങൾക്ക് മുൻഗണന നൽകുമെങ്കിലും, നമ്മുടെ സിസ്റ്റം വിശാലമായ വൈരുദ്ധ്യാത്മക വ്യതിയാനങ്ങൾ ഉൾക്കൊള്ളുന്നു.
“ഞങ്ങളുടെ ആഭ്യന്തര പരിശീലനം ലഭിച്ച വിദ്യാർത്ഥികൾ വികസിപ്പിച്ചെടുത്ത ഞങ്ങളുടെ സിസ്റ്റത്തിന് പിന്നിലെ സാങ്കേതികവിദ്യ അത്യാധുനിക രീതികളും ആഴത്തിലുള്ള പഠന സാങ്കേതികതകളും സമന്വയിപ്പിക്കുന്നു. കൂടാതെ, ടെക്സ്റ്റിൽ നിന്ന് ഓഡിയോ സിഗ്നലുകളിലേക്ക് അതിന്റെ പ്രവർത്തനം വികസിപ്പിക്കാനുള്ള സംരംഭം അറബി ഭാഷ മനസിലാക്കുന്നതിനും പ്രോസസ്സ് ചെയ്യുന്നതിനും ഒരു മൾട്ടി-മോഡൽ സമീപനം വാഗ്ദാനം ചെയ്യുന്നു.
നിരവധി വ്യത്യസ്ത ഡാറ്റാസെറ്റുകൾ ലയിപ്പിച്ചുകൊണ്ട് ടീം ഒരു വലിയ, വൈവിധ്യമാർന്ന, പക്ഷപാതരഹിത വൈരുദ്ധ്യാത്മക ഡാറ്റാസെറ്റ് ഉപയോഗിച്ചു. തുടർന്ന് അവർ അത്യാധുനിക ട്രാൻസ്ഫോർമറുകൾ ഉൾപ്പെടെ വിവിധ ക്ലാസിക്കൽ, ആഴത്തിലുള്ള പഠന മോഡലുകൾ പരിശീലിപ്പിച്ചു, ബെർട്ട് പോലുള്ള സന്ദർഭോചിത മാതൃകകൾ മേഖല തിരിച്ചും രാജ്യം തിരിച്ചുമുള്ള വർഗ്ഗീകരണത്തിനായി.
ഈ ഉപകരണങ്ങൾക്ക് “ചാറ്റ്ബോട്ട് പ്രകടനം മെച്ചപ്പെടുത്താൻ കഴിയും, ഇത് കൂടുതൽ വ്യക്തിഗതവും പ്രസക്തവുമായ പ്രതികരണങ്ങൾ നൽകാൻ ചാറ്റ്ബോട്ടുകളെ പ്രാപ്തമാക്കുന്നതിന് വിവിധ അറബി ഭാഷാഭേദങ്ങൾ കൃത്യമായി തിരിച്ചറിയുകയും മനസ്സിലാക്കുകയും ചെയ്യുന്നതിലൂടെ നേടാൻ കഴിയും,” പ്രൊഫസർ എൽനഗർ പറയുന്നു.
അറബി ഭാഷ സംസാരിക്കുന്ന ലോകത്തിലെ നിർദ്ദിഷ്ട പ്രദേശങ്ങൾക്കും സംസ്കാരങ്ങൾക്കും അനുസൃതമായി ഉപകരണങ്ങൾ രൂപകൽപ്പന ചെയ്യാൻ കഴിയും. “ഇത് ബിസിനസുകളെയും പൊതു സേവനങ്ങളെയും അവരുടെ ടാർഗെറ്റ് പ്രേക്ഷകരെ മികച്ച രീതിയിൽ നിറവേറ്റാൻ അനുവദിക്കുന്നു, നൽകുന്ന വിവരങ്ങളും സേവനങ്ങളും പ്രാദേശികമായി പ്രസക്തവും എളുപ്പത്തിൽ മനസ്സിലാകുന്നതുമാണെന്ന് ഉറപ്പാക്കുന്നു,” പ്രൊഫസർ എൽനഗർ കൂട്ടിച്ചേർക്കുന്നു.
കൂടുതൽ കൃത്യവും ഫലപ്രദവുമായ വിവർത്തനം പദ്ധതിയുടെ ഭാവി ഫലങ്ങളിൽ ഒന്നാണ്, കാരണം ഈ സിസ്റ്റം “അറബി ഭാഷാഭേദങ്ങളെക്കുറിച്ച് മികച്ച ധാരണ നൽകുന്നതിനും കൂടുതൽ കൃത്യമായ വിവർത്തനങ്ങൾ നൽകുന്നതിനും യന്ത്ര വിവർത്തന സംവിധാനങ്ങളെ സഹായിക്കുന്നതിനും വിവിധ ഭാഷാഭേദങ്ങളോ ഭാഷകളോ സംസാരിക്കുന്നവർക്കിടയിൽ സുഗമമായ ആശയവിനിമയം സുഗമമാക്കുന്നതിനും” ബാധ്യസ്ഥമാണ്.
പുതിയ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് പവർ സിസ്റ്റം അവരുടെ ടാർഗെറ്റ് പ്രേക്ഷകരുടെ അഭിപ്രായങ്ങളും വികാരങ്ങളും നന്നായി മനസിലാക്കാൻ ഭാഷാ-അവബോധ വികാര വിശകലന ഉപകരണങ്ങൾ ഉപയോഗിക്കാൻ സഹായിക്കുമെന്നതിനാൽ ബിസിനസുകളും ഓർഗനൈസേഷനുകളും ഗുണഭോക്താക്കളിൽ ഉൾപ്പെടുന്നു. “വിവിധ പ്രദേശങ്ങളുടെയോ രാജ്യങ്ങളുടെയോ നിർദ്ദിഷ്ട ആവശ്യങ്ങളും മുൻഗണനകളും നിറവേറ്റുന്നതിനായി അവരുടെ മാർക്കറ്റിംഗ് തന്ത്രങ്ങൾ, ഉൽപ്പന്നങ്ങൾ, സേവനങ്ങൾ എന്നിവ ക്രമീകരിക്കാൻ ഇത് അവരെ സഹായിക്കും,” പ്രൊഫസർ എൽനഗർ പറഞ്ഞു.
താനും സംഘവും നടത്തുന്ന ഗവേഷണത്തിൽ ബാഹ്യ പങ്കാളികൾക്ക് താൽപ്പര്യമുണ്ടോ എന്ന ചോദ്യത്തിന് പ്രൊഫസർ എൽനഗർ പറഞ്ഞു, “ഈ പ്രോജക്റ്റ് കാര്യമായ പാഠ്യേതര താൽപ്പര്യം നേടിയിട്ടുണ്ട്, പ്രത്യേകിച്ച് ഐബിഎം, മൈക്രോസോഫ്റ്റ് തുടങ്ങിയ പ്രധാന ടെക് കോർപ്പറേഷനുകളിൽ നിന്ന്. കൂടാതെ, ഷാർജയിലെ പുതിയ സംരംഭകരെ ശാക്തീകരിക്കുന്നതിനും പിന്തുണയ്ക്കുന്നതിനുമായി സമർപ്പിച്ചിരിക്കുന്ന സംഘടനയായ ഷെറ ഈ പദ്ധതിയിൽ അതീവ താൽപ്പര്യം പ്രകടിപ്പിച്ചിട്ടുണ്ട്.
പദ്ധതിയുടെ കണ്ടെത്തലുകളെ അടിസ്ഥാനമാക്കി ഒരു വാണിജ്യ ഉൽപ്പന്നം വികസിപ്പിക്കുന്നതിന് ധനസഹായം നൽകുന്നതിനുള്ള സാധ്യതകളെക്കുറിച്ച് ഷെറയിൽ നിന്നുള്ള പ്രതിനിധികൾ ചർച്ചകളിൽ ഏർപ്പെട്ടിട്ടുണ്ട്. ടെക് ഭീമന്മാരിൽ നിന്നും സംരംഭക പിന്തുണാ സ്ഥാപനങ്ങളിൽ നിന്നുമുള്ള ഈ തലത്തിലുള്ള ശ്രദ്ധ ഒരു ഗവേഷണ സംരംഭമെന്ന നിലയിൽ മാത്രമല്ല, വിശാലമായ മാർക്കറ്റ് ആപ്ലിക്കേഷനുകൾ ഉള്ള ഒരു പ്രായോഗിക വാണിജ്യ പരിഹാരമെന്ന നിലയിലും പദ്ധതിയുടെ സാധ്യതകളെ സൂചിപ്പിക്കുന്നു.
ശാസ്ത്രജ്ഞർ പ്രവർത്തിക്കുന്ന ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉപകരണങ്ങൾക്ക് വൈകല്യമുള്ള ആളുകൾക്ക് കൂടുതൽ പ്രവേശനക്ഷമത ഉറപ്പാക്കാൻ കഴിയും. “നിർദ്ദിഷ്ട ഭാഷാഭേദങ്ങൾക്ക് അനുയോജ്യമായ സ്പീച്ച് റെക്കഗ്നിഷൻ സംവിധാനങ്ങൾ വൈകല്യമുള്ള ആളുകൾക്കോ ശബ്ദ അധിഷ്ഠിത ആശയവിനിമയം ഇഷ്ടപ്പെടുന്നവർക്കോ കൂടുതൽ കൃത്യമായ വോയ്സ് കമാൻഡ് തിരിച്ചറിയൽ, ട്രാൻസ്ക്രിപ്ഷൻ സേവനങ്ങൾ പ്രാപ്തമാക്കും,” പ്രൊഫസർ എൽനഗർ പറഞ്ഞു.
പ്രോജക്റ്റ് വെല്ലുവിളികളില്ലാതെയായിരുന്നില്ല, പക്ഷേ അവ വിജയകരമായി അഭിസംബോധന ചെയ്യപ്പെട്ടു, പ്രൊഫസർ പറയുന്നു. സ്റ്റാൻഡേർഡൈസ്ഡ് ഓർത്തോഗ്രാഫി, പരിമിതമായ വിഭവങ്ങൾ, ലേബൽ ചെയ്ത ഡാറ്റ എന്നിവയുടെ അഭാവം, അറബി സംസാരിക്കുന്ന പ്രദേശങ്ങളിലും സംസ്കാരങ്ങളിലും ഉടനീളം വൈവിധ്യമാർന്ന വൈരുദ്ധ്യാത്മക വ്യതിയാനങ്ങൾ എന്നിവയെക്കുറിച്ച് അദ്ദേഹം പരാമർശിച്ചു.
