ഡാറ്റാ ഗുണനിലവാരം മെച്ചപ്പെടുത്തുന്നതിന് ആംപ്ലിറ്റ്യൂഡ് GenAI എങ്ങനെ ഉപയോഗിക്കുന്നു

You are currently viewing ഡാറ്റാ ഗുണനിലവാരം മെച്ചപ്പെടുത്തുന്നതിന് ആംപ്ലിറ്റ്യൂഡ് GenAI എങ്ങനെ ഉപയോഗിക്കുന്നു

ബിഗ് ഡാറ്റ അനലിറ്റിക്സിനും ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനും ഡാറ്റാ ഗുണനിലവാരം നിർബന്ധമായും ഉണ്ടായിരിക്കേണ്ടതാണ്. നിങ്ങൾക്കത് ഉണ്ടെങ്കിൽ, നിങ്ങളുടെ ഡാറ്റ ഉപയോഗിച്ച് നിങ്ങൾക്ക് അത്ഭുതകരമായ കാര്യങ്ങൾ ചെയ്യാൻ കഴിയും. ഇല്ലെങ്കിൽ, നിങ്ങൾ വെള്ളത്തിൽ മരിച്ചുപോകും. ബിഹേവിയറൽ അനലിറ്റിക്സ് പ്ലാറ്റ്ഫോം ദാതാവ് ആംപ്ലിറ്റ്യൂഡ് ഡാറ്റാ ഗുണനിലവാരത്തിന്റെ പ്രാധാന്യം മനസ്സിലാക്കുന്നു, അടുത്തിടെ ഇത് അങ്ങനെ തന്നെ തുടരുന്നുവെന്ന് ഉറപ്പാക്കാൻ ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉപയോഗിക്കാൻ തുടങ്ങി.

2014 ൽ സ്ഥാപിതമായ ആംപ്ലിറ്റ്യൂഡ് ഒരു സിലിക്കൺ വാലി സോഫ്റ്റ്വെയർ കമ്പനിയാണ്, ഇത് പെരുമാറ്റ ഡാറ്റ സ്കെയിലിൽ വിശകലനം ചെയ്യുന്നതിന് ക്ലൗഡ് അധിഷ്ഠിത പ്ലാറ്റ്ഫോം നൽകുന്നു. PayPal, ഡോർ ഡാഷ്, ക്യാപിറ്റൽ വൺ, വാൾമാർട്ട് തുടങ്ങിയ കമ്പനികൾ അവരുടെ ഉപഭോക്താക്കൾ എന്താണ് ചെയ്യുന്നതെന്ന് നന്നായി മനസിലാക്കാൻ ആംപ്ലിറ്റ്യൂഡും അതിന്റെ ഉൽപ്പന്ന അനലിറ്റിക്സ്, എ / ബി ടെസ്റ്റിംഗ് ടൂളുകളുടെ ശേഖരവും ഉപയോഗിക്കുന്നു.

ഉപഭോക്തൃ ഡാറ്റാ പശ്ചാത്തലത്തിൽ ഡാറ്റയുടെ ഗുണനിലവാരം ഉറപ്പാക്കുന്നത് എല്ലായ്പ്പോഴും വെല്ലുവിളിയാണെന്ന് ആംപ്ലിറ്റ്യൂഡിന്റെ സഹസ്ഥാപകനും ചീഫ് ആർക്കിടെക്റ്റുമായ ജെഫ്രി വാങ് പറയുന്നു.

“ഡാറ്റ വൃത്തിയാക്കുക, അത് ഉയർന്ന നിലവാരമുള്ളതാക്കുക എന്നത് വളരെ ബുദ്ധിമുട്ടാണ്,” വാങ് ഡാറ്റനാമിയോട് പറഞ്ഞു. “കഴിഞ്ഞ 10 വർഷത്തിനിടയിൽ ഞങ്ങൾ എന്തെങ്കിലും പഠിച്ചിട്ടുണ്ടെങ്കിൽ, ഇത് പലപ്പോഴും ഡാറ്റ നന്നായി ഉപയോഗിക്കുന്നതിനുള്ള ഏറ്റവും വലിയ ബ്ലോക്കറാണ്. ഗുണനിലവാരം വളരെ മോശമാണ്. നിനക്കത് വിശ്വസിക്കാൻ പറ്റില്ല. അത് ഉപയോഗിക്കാൻ നിങ്ങൾക്ക് അത് നന്നായി മനസ്സിലാക്കാൻ കഴിയില്ല.”

ഡാറ്റാ ഗുണനിലവാര പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നതിനുള്ള ഏറ്റവും മികച്ച മാർഗം ഏറ്റവും നൂതനമായ മെഷീൻ ലേണിംഗ് അൽഗോരിതം അതിലേക്ക് എറിയുക എന്നതാണ് എന്ന ധാരണയുണ്ട്. എന്നാൽ അത് പ്രശ്നം കൂടുതൽ വഷളാക്കുന്നു, വാങ് പറയുന്നു. “നിങ്ങളുടെ ഡാറ്റ മോശമാണെങ്കിൽ, അത് യഥാർത്ഥത്തിൽ പ്രശ്നമല്ല,” അദ്ദേഹം പറയുന്നു.

ഡാറ്റ ഗുണനിലവാര പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ കഴിയും, പക്ഷേ ഇതിന് പലപ്പോഴും ബഹുമുഖ പരിഹാരവും ധാരാളം കഠിനാധ്വാനവും ആവശ്യമാണ്. ഉദാഹരണത്തിന്, സിഡിപിയിലേക്ക് ഒഴുകുമ്പോൾ ഡാറ്റ തകരാറിലാണെങ്കിൽ, ഒരുപക്ഷേ ഡാറ്റാ പൈപ്പുകളോ അതിന് ചുറ്റുമുള്ള ഉപകരണങ്ങളോ തകർന്നിരിക്കാം, വാങ് പറയുന്നു.

അവസാനം, മനുഷ്യർ ഡാറ്റയുമായി ഇടപഴകുകയും അതിനെ സജീവമായി നിയന്ത്രിക്കുകയും ചെയ്യുന്നതിന് പകരക്കാരില്ല. ആംപ്ലിറ്റ്യൂഡിൽ, ഉപയോക്താക്കളുടെ വലിയ ഗ്രൂപ്പുകൾക്കിടയിൽ ഡാറ്റാ ഗവേണൻസ് ത്വരിതപ്പെടുത്താൻ സഹായിക്കുന്ന ഡാറ്റാ ഗവേണൻസ് ടൂളുകൾ വഴിയാണ് ആ ഇടപെടൽ നൽകുന്നത്.

“അത് ഉപയോഗയോഗ്യമാക്കുന്നതിന് ആംപ്ലിറ്റ്യൂഡ് ഉപയോഗിച്ച് ഞങ്ങൾക്ക് ഒരു കൂട്ടം ഡാറ്റാ ഗവേണൻസ് ടൂളുകൾ ഉണ്ട്, കാരണം ആ ഡാറ്റയിൽ നിന്ന് മൂല്യം നേടാൻ സാങ്കേതികേതര ആളുകളെ പ്രാപ്തരാക്കുക എന്നതാണ് ഞങ്ങളുടെ ലക്ഷ്യം,” വാങ് പറയുന്നു. “അന്തിമ ഉപയോക്താവ് സാങ്കേതികമായി കുറവാണെങ്കിൽ, സദ്ഭരണവും ഡാറ്റാ ഗുണനിലവാരവും കൂടുതൽ പ്രധാനമാണ്.”

ഓഗസ്റ്റിൽ, ആംപ്ലിറ്റ്യൂഡ് അതിന്റെ ഡാറ്റ ഗുണനിലവാരത്തിലും ഡാറ്റാ ഗവേണൻസ് തന്ത്രത്തിലും മറ്റൊരു പാളി ചേർത്തു. ഡാറ്റാ അസിസ്റ്റന്റ് എന്ന് വിളിക്കപ്പെടുന്ന ഈ ഉപകരണം ഡാറ്റയുടെ ഗുണനിലവാരവും ഭരണ ചുമതലകളും യാന്ത്രികമാക്കാൻ സഹായിക്കുന്നതിന് ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉപയോഗിക്കുന്നു. വാങ് പറയുന്നതനുസരിച്ച്, ഡാറ്റ അസിസ്റ്റന്റ് വലിയ ഭാഷാ മോഡലുകളുടെ (എൽഎൽഎം) സ്വാഭാവിക ഭാഷാ ശക്തികൾ ഉപയോഗിക്കുന്നു, ഉപയോക്താക്കൾ ഡാറ്റയെക്കുറിച്ച് എങ്ങനെ ചിന്തിക്കുകയും സംസാരിക്കുകയും ചെയ്യുന്നു എന്നതും യഥാർത്ഥത്തിൽ നിയന്ത്രിക്കുകയും സംഭരിക്കുകയും ചെയ്യുന്ന രീതിയുമായി മികച്ച പൊരുത്തപ്പെടൽ നൽകുന്നു.

“ഞങ്ങൾ അടിസ്ഥാനപരമായി ഒരു കൂട്ടം ഓട്ടോമേറ്റഡ് നിർദ്ദേശങ്ങൾ അവതരിപ്പിക്കുന്നു, ‘നിങ്ങളുടെ നിലവിലെ ഡാറ്റാ കാറ്റലോഗ് ട്രാക്കുചെയ്യുന്നത് ഇങ്ങനെയാണ്… ഡാറ്റ എങ്ങനെ തരംതിരിക്കുന്നു അല്ലെങ്കിൽ അത് എങ്ങനെ വിവരിക്കുന്നു അല്ലെങ്കിൽ അന്തിമ ഉപയോക്താക്കൾക്ക് ഇത് എങ്ങനെ കാണിക്കുന്നു എന്നതിന്റെ അടിസ്ഥാനത്തിൽ. അത് നന്നല്ല. കാര്യങ്ങള് മനസ്സിലാക്കുന്നതില് നിന്ന് അത് അവരെ തടയുന്നു.”

ഡാറ്റ ആംപ്ലിറ്റ്യൂഡിലേക്ക് ഒഴുകുമ്പോൾ, ഇതിന് മുൻഗണനാ റേറ്റിംഗ് നൽകുകയും ആംപ്ലിറ്റ്യൂഡ് ഡാറ്റ കാറ്റലോഗിനുള്ളിൽ ഒരു പ്രത്യേക ഇവന്റ് തരമായി തരംതിരിക്കുകയും ചെയ്യുന്നു. ഓരോ ഇവന്റ് തരത്തിനും ഉടമസ്ഥനായി നിയോഗിക്കപ്പെട്ട ഒന്നോ അതിലധികമോ ഉപയോക്താക്കളുണ്ട്. പൊതുവായ പാറ്റേണുകൾ തിരിച്ചറിയാൻ ഡാറ്റാ അസിസ്റ്റന്റ് GenAI-യുടെ സാമ്യത തിരയൽ കഴിവുകൾ ഉപയോഗിക്കുന്നു, ഇത് കൃത്യമായ വിഭാഗം ശുപാർശ സൃഷ്ടിക്കാൻ സഹായിക്കുന്നു. ഇത് ഡാറ്റയുടെ ഗുണനിലവാരം മെച്ചപ്പെടുത്താൻ സഹായിക്കുന്നു, ഇത് ഡൗൺസ്ട്രീം അനലിറ്റിക്സ്, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉപയോഗ കേസുകൾ എന്നിവയെ ബാധിക്കുന്നു.

“ജെൻഎഐ സ്വാഭാവിക ഭാഷ മനസ്സിലാക്കുന്നതിനാൽ, അത്തരം പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ഇത് കൂടുതൽ അനുയോജ്യമാണ്,” വാങ് പറയുന്നു. “അതിനാൽ, നിങ്ങളുടെ അന്തിമ ഉപയോക്താക്കൾക്ക് ഉപയോഗിക്കാൻ വ്യാഖ്യാനിക്കാവുന്നതും നന്നായി വിവരിക്കുന്നതുമായ സ്ഥിരമായ നാമകരണമുള്ള ഒരു ഡാറ്റാ കാറ്റലോഗ് നിർമ്മിക്കാൻ നിങ്ങൾക്ക് കഴിയുമെങ്കിൽ, അത് തന്നെ ആ ഡാറ്റയ്ക്ക് മുകളിൽ ഒരു ടൺ കൂടുതൽ പ്രവർത്തനം സൃഷ്ടിക്കും.”

ഡാറ്റാ അസിസ്റ്റന്റിനപ്പുറം മറ്റൊരു വിധത്തിൽ ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്, എൽഎൽഎം എന്നിവ ആംപ്ലിറ്റ്യൂഡ് ഉപയോഗിക്കുന്നു: പവർ ചോദ്യങ്ങൾക്ക് കോഡ് സൃഷ്ടിക്കുന്നു. ഡാറ്റ ഉപയോഗിച്ച് മികച്ച കാര്യങ്ങൾ ചെയ്യുന്നതിനുള്ള തടസ്സം കുറയ്ക്കുന്നതിന് ഡാറ്റാ അനലിറ്റിക്സും ഡാറ്റാ സയൻസും ജനാധിപത്യവത്കരിക്കാൻ കമ്പനി വളരെക്കാലമായി ശ്രമിക്കുന്നു, ജെൻഎഐ ആ ലക്ഷ്യത്തിന് യോജിക്കുന്നു.

“നിങ്ങൾ ഒരു സാങ്കേതികേതര ഉപയോക്താവിന് SQL നൽകുമ്പോൾ, എന്താണ് ചെയ്യേണ്ടതെന്ന് അവർക്ക് അറിയില്ല,” വാങ് പറയുന്നു. “നിങ്ങൾ അവർക്ക് ആംപ്ലിറ്റ്യൂഡ് നൽകുമ്പോൾ, ഇത് ചാർട്ട് ബിൽഡിംഗിനും ബിസിനസ്സ് പദങ്ങളിൽ വിശകലനം വിവരിക്കുന്നതിനുമുള്ള ഒരു യുഎക്സ് ആണ്, അവർ വളരെ നല്ലതാണ്. എന്നാൽ അടുത്ത തലമുണ്ട്, ഇപ്പോൾ അവർ വ്യാപ്തി പോലും പഠിക്കേണ്ടതില്ലെന്ന് അനുമാനിക്കുന്നു.”

പുതിയ ആസ്ക് ആംപ്ലിറ്റ്യൂഡ് സവിശേഷത ഉപയോഗിച്ച്, ഉപയോക്താക്കൾക്ക് സാധാരണ ഇംഗ്ലീഷ് വാചകങ്ങൾ ഉപയോഗിച്ച് സിഡിപി പരിശോധിക്കാൻ കഴിയും. ഉദാഹരണത്തിന്, നെറ്റ് വർക്ക് ടിവി കമ്പനിയിൽ നിന്നുള്ള ഒരു ഉപയോക്താവ് ഇന്റർനെറ്റിൽ ജനപ്രിയമായ ഷോകൾ ഏതൊക്കെയാണെന്ന് അറിയാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, അവൾക്ക് അത് വളരെ അടിസ്ഥാനപരമായി ചോദിക്കാൻ കഴിയും, കൂടാതെ നിർദ്ദിഷ്ട ഫിൽട്ടറുകൾ നൽകുന്നതിനും ആത്യന്തികമായി അന്വേഷണം പൂർത്തിയാക്കുന്നതിന് ആവശ്യമായ കോഡ് സൃഷ്ടിക്കുന്നതിനും ആസ്ക് ആംപ്ലിറ്റ്യൂഡ് കവറുകൾക്ക് കീഴിൽ ഓപ്പൺഎഐയുടെ ജിപിടി മോഡലുകൾ ഉപയോഗിക്കും.

“ഇത് വളരെ ഓപ്പൺഎഐ പവർ ആണ്, അവിടെ നിങ്ങൾ ആ ചോദ്യം എടുക്കുന്നു, ഞങ്ങൾ അടിസ്ഥാനപരമായി ഇത് ഒരു കൂട്ടം ഉപ ചോദ്യങ്ങളായി വിഭജിക്കുന്നു, ഏത് തരത്തിലുള്ള വിശകലനമാണ് നിങ്ങൾ സൃഷ്ടിക്കാൻ ശ്രമിക്കുന്നത്? ഏതൊക്കെ സംഭവങ്ങളാണ് നിങ്ങൾ വിശകലനം ചെയ്യുന്നത്? അതിന് ഏത് ഫിൽട്ടറുകളാണ് നിങ്ങൾ പ്രയോഗിക്കാൻ ആഗ്രഹിക്കുന്നത്?” വാങ് പറയുന്നു. “നിങ്ങളുടെ ഡാറ്റ എങ്ങനെ കാണപ്പെടുന്നു, ആളുകൾ എന്താണ് വിശകലനം ചെയ്യുന്നത്, ഒരു വിശകലനം നിർമ്മിക്കുന്നതിന് ഓപ്പൺ എഐയുടെ സ്വാഭാവിക ഭാഷാ പ്രോസസ്സിംഗ് കഴിവുകൾ എന്നിവയെക്കുറിച്ച് ആംപ്ലിറ്റ്യൂഡിൽ ഉള്ള എല്ലാ ഡാറ്റയും ഒരുമിച്ച് ചേർക്കുന്ന തരത്തിലുള്ള ഓപ്പൺ എപിഐ കോളുകളായി ഞങ്ങൾ അവയെല്ലാം മാറ്റുന്നു.”

ചില ബിഐ, അനലിറ്റിക് വെണ്ടർമാർ അവരുടെ ഉൽപ്പന്നങ്ങൾക്കായി സമാനമായ സ്വാഭാവിക ഭാഷാ ഇന്റർഫേസുകൾ സ്വീകരിക്കുന്നു, അടിസ്ഥാനപരമായി സ്വാഭാവിക ഭാഷയെ എസ്ക്യുഎല്ലിലേക്ക് പരിവർത്തനം ചെയ്യുന്നു. എന്നാൽ പൊതു-ഉദ്ദേശ്യമുള്ള എസ്ക്യുഎൽ-ജനറേറ്റിംഗ് ബിഐ ടൂളുകളേക്കാൾ ആംപ്ലിറ്റ്യൂഡിന് ഒരു നേട്ടമുണ്ടെന്ന് വാങ് വാദിക്കുന്നു, കാരണം അതിന്റെ പരിസ്ഥിതിക്ക് അത് പ്രവർത്തിക്കുന്ന അനലിറ്റിക്സ് ഡൊമെയ്നുമായി ആഴത്തിലുള്ള സന്ദർഭമുണ്ട്, കൂടാതെ ഇതിന് അതിന്റേതായ ഡൊമെയ്ൻ നിർദ്ദിഷ്ട ചോദ്യ ഭാഷയുണ്ട്.

“എസ്ക്യുഎൽ വളരെ ഫ്ലെക്സിബിൾ ആയതിനാലും അതിന് സെമാന്റിക്സ് ഇല്ലാത്തതിനാലും, ഇത് ഏകപക്ഷീയമായ കണക്കുകൂട്ടൽ മാത്രമാണ്. സ്വാഭാവിക ഭാഷ അതിലേക്ക് പോകുന്നത് വളരെ ബുദ്ധിമുട്ടാണ്,” അദ്ദേഹം പറഞ്ഞു. “ഞാൻ ചോദിക്കുന്ന ഓരോ ചോദ്യത്തിലും, എസ്ക്യുഎൽ എന്തായിരിക്കുമെന്നതിൽ അന്തർലീനമായ അവ്യക്തതയുണ്ട്. അതിനാൽ ആംപ്ലിറ്റ്യൂഡ് കൂടുതൽ സെമാന്റിക് ആണ്, ബിസിനസ്സ് ഡൊമെയ്ൻ വളരെ നന്നായി മനസ്സിലാക്കുന്നു, ഇത് സ്വാഭാവിക ഭാഷാ പ്രക്രിയയെ കൂടുതൽ പ്രായോഗികമാക്കുന്നു.”

ആ അവ്യക്തത എസ്ക്യുഎല്ലിനെ പല സാഹചര്യങ്ങളിലും സാധാരണ ഉപയോക്താക്കളുടെ കൈകളിൽ എത്തിക്കാൻ കഴിയാത്തത്ര ശക്തമാക്കുന്നു, വാങ് പറയുന്നു. “സാധ്യതയുള്ള ചോദ്യങ്ങളുടെ വ്യാപ്തി വളരെ വലുതാണ്, ആദ്യം സ്വാഭാവിക ഭാഷയിലേക്ക് വിവർത്തനം ചെയ്യാൻ നിങ്ങൾ അതിന് മുകളിൽ ചില പാളികൾ ഇടാൻ ആഗ്രഹിക്കുന്നു,” അദ്ദേഹം പറയുന്നു.

കഴിഞ്ഞ ഒരു വർഷമായി സ്വാഭാവിക ഭാഷ ഒരു മികച്ച ഉപയോക്തൃ ഇന്റർഫേസായി മാറിയതിനാൽ, വാങ് ഗ്രാഫിക്കൽ യൂസർ ഇന്റർഫേസുകൾ (ജിയുഐ) എങ്ങനെ കാണുന്നുവെന്ന് ഇത് മാറ്റുന്നു. ആംപ്ലിറ്റ്യൂഡ് ആരംഭിച്ചപ്പോൾ, അതിന് കഴിയുന്ന ഏറ്റവും അവബോധജനകമായ GUI നിർമ്മിക്കാൻ ഇത് ശ്രമിച്ചു, കാരണം SQL, SQL പോലുള്ള ഭാഷകളുടെ അടിസ്ഥാന സങ്കീർണ്ണതയും ഉപയോക്താവിന് മനസ്സിലാകുന്ന കാര്യങ്ങളും തമ്മിലുള്ള വിടവ് നികത്തുന്നതിനുള്ള ഏറ്റവും നല്ല മാർഗമായിരുന്നു അത്.

“എന്നാൽ ഇപ്പോൾ സ്വാഭാവിക ഭാഷ വളരെ പ്രധാനപ്പെട്ട ഒരു അതിർത്തി കടന്നിരിക്കുന്നു, അത് സാധ്യമാണ്… സ്വാഭാവിക ഭാഷ ഒരു സാധാരണ ചാർട്ട്-ബിൽഡിംഗ് കഴിവിനേക്കാൾ നിങ്ങളുടെ സെമാന്റിക് പാളിക്ക് മികച്ച യുഎക്സ് ആണ്, “അദ്ദേഹം പറയുന്നു.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

Leave a Reply