വളരെയധികം സാധ്യതകളും വ്യാപകമായ ഹൈപ്പും ഉണ്ടായിരുന്നിട്ടും, മെഷീൻ ലേണിംഗ്, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അനലിറ്റിക്സ് എന്നിവ എല്ലായ്പ്പോഴും ബിസിനസ്സിൽ വിന്യസിക്കുമ്പോൾ പ്രതീക്ഷകൾക്ക് അനുസൃതമായി പ്രവർത്തിക്കുന്നില്ല. നോളജ് ഇന്റഗ്രേഷൻ ഡൈനാമിക്സ് (കെഐഡി) ഡാറ്റാ സയൻസ് വിദഗ്ധരുടെ അഭിപ്രായത്തിൽ, അപ്രസക്തമായ അല്ലെങ്കിൽ തെറ്റായി ക്രമീകരിച്ച ഉപയോഗ കേസുകൾ, മോശം ഡാറ്റാ ഗവേണൻസ്, ബിസിനസ്സ്, ഡാറ്റാ സയൻസ് ടീമുകൾ തമ്മിലുള്ള സമന്വയത്തിന്റെ അഭാവം തുടങ്ങിയ ഘടകങ്ങളാണ് ഇതിന് കാരണം.
കെഐഡി ഡാറ്റാ സയന്റിസ്റ്റ് ജാൻകോ വാൻ നീക്കെർക്ക് പറഞ്ഞു: “എം എൽ ഉപകരണങ്ങളുള്ള ഒരു ഡാറ്റാ സയന്റിസ്റ്റിനെ നിങ്ങൾക്ക് നിയമിക്കാമെന്നും യഥാർത്ഥ ലക്ഷ്യങ്ങളോ അധിക മാർഗ്ഗനിർദ്ദേശങ്ങളോ ഇല്ലാതെ മൂല്യം നൽകുമെന്ന് പ്രതീക്ഷിക്കാമെന്നും ഒരു സാധാരണ തെറ്റിദ്ധാരണയാണ്. പക്വത കുറഞ്ഞ ഡാറ്റാ ഓർഗനൈസേഷനുകളിൽ ഇത് പലപ്പോഴും സംഭവിക്കുന്നു.
മെഷീൻ ലേണിംഗിനായി ഒരു സോളിഡ് ഉപയോഗ കേസ്
“ഒരു എം എൽ പ്രോജക്റ്റിന് പ്രതീക്ഷിച്ച മൂല്യം നൽകുന്നതിന്, തുടക്കം മുതൽ ബിസിനസ്സിൽ നിന്ന് ഇൻപുട്ട് ഉണ്ടായിരിക്കേണ്ടത് നിർണായകമാണ്. എം എൽ ഉപയോഗ കേസ് ഐഡിയേഷൻ പ്രക്രിയയിൽ, പ്രാരംഭ ഘട്ടങ്ങളിൽ ഒരു പരിഹാരം നിർദ്ദേശിക്കുന്നതിനുപകരം പരിഹരിക്കേണ്ട പ്രശ്നം തിരിച്ചറിയുന്നതാണ് അഭികാമ്യം. ഇത് ഡാറ്റാ സയന്റിസ്റ്റിനെ ബദലുകൾ പരിഗണിക്കാനും ലക്ഷ്യത്തിലെത്താൻ വ്യത്യസ്ത അൽഗോരിതങ്ങൾ, സമീപനങ്ങൾ, വസ്തുനിഷ്ഠ പ്രവർത്തനങ്ങൾ എന്നിവ പ്രയോജനപ്പെടുത്താനും അനുവദിക്കുന്നു, “വാൻ നീക്കെർക്ക് പറയുന്നു.
ഡാറ്റാറോബോട്ട് കിഡ് പാർട്ണർഷിപ്പ് മാനേജർ മാർക്കസ് ടോപ്പ് ഒരു നല്ല എം എൽ ഉപയോഗ കേസ് ഉണ്ടാക്കുന്നത് എന്താണെന്ന് വിലയിരുത്തുമ്പോൾ ഓർഗനൈസേഷനുകൾ പരിഗണിക്കേണ്ട ചോദ്യങ്ങൾ വിശദീകരിച്ചു. “സംഘടനകൾ അവർ എന്താണ് പ്രവചിക്കാൻ ആഗ്രഹിക്കുന്നതെന്നും അവർക്ക് പ്രവർത്തിക്കാൻ എന്തെങ്കിലും ചരിത്രപരമായ ഡാറ്റ ഉണ്ടോയെന്നും പരിഗണിക്കേണ്ടതുണ്ട്. ഒരു പ്രവചനം നടത്തുന്നതിലൂടെ എന്ത് മാറ്റങ്ങൾ വരുത്തും, പ്രവചനത്തിന്റെ അടിസ്ഥാനത്തിൽ എന്തെങ്കിലും നടപടിയെടുക്കാൻ കഴിയുമോ, ഇത് എന്ത് സ്വാധീനം ചെലുത്തുമെന്ന് അവർ മനസിലാക്കേണ്ടതുണ്ട്.
കിഡ് ഡാറ്റാ സയന്റിസ്റ്റ് ഡാനിയൽ ചാർട്ടേഴ്സ് പറഞ്ഞു: “പലപ്പോഴും അവഗണിക്കപ്പെടുന്നുണ്ടെങ്കിലും, നല്ല ഡാറ്റാ ഗവേണൻസ് ഒരു എം എൽ പ്രോജക്റ്റിന്റെ അടിത്തറയാണ്, അതിനാൽ എം എൽ പ്രോജക്റ്റുകളുടെ സമഗ്രതയ്ക്ക് സ്ഥിരമായ ഡാറ്റാ ഭരണം ഉറപ്പാക്കേണ്ടത് അത്യാവശ്യമാണ്. സ്ഥിരതയില്ലാത്തതോ ഗുണനിലവാരമില്ലാത്തതോ ആയ ഡാറ്റ ആവശ്യമുള്ള മൂല്യം സൃഷ്ടിക്കില്ല.
ബിസിനസ്സ് – ഡാറ്റാ സയൻസ് വിടവ് നികത്തൽ
പ്രശ്നം തിരിച്ചറിയുന്നത് ആദ്യപടി മാത്രമാണെന്ന് വാൻ നീക്കെർക്ക് പറഞ്ഞു. “എംഎൽ ഉപയോഗിച്ച് ഏത് തരത്തിലുള്ള പ്രശ്നം പരിഹരിക്കാൻ കഴിയുമെന്ന് ബന്ധപ്പെട്ടവർ അറിയുകയും മനസിലാക്കുകയും ചെയ്യേണ്ടത് പ്രധാനമാണ്. ഡാറ്റാ എക്സ്ട്രാക്റ്റ്, ട്രാൻസ്ഫോം, ലോഡ് (ഇടിഎൽ) പൈപ്പ്ലൈൻ പോലുള്ള ലളിതമായ / സ്റ്റാൻഡേർഡ് സോഫ്റ്റ്വെയർ പ്രക്രിയ മാത്രം ആവശ്യമുള്ള ഒരു പ്രശ്നവുമായി മെഷീൻ ലേണിംഗ് സ്പെഷ്യലിസ്റ്റുകളെ സമീപിക്കുന്നത് ഫലപ്രദമാകില്ല.
എം എൽ ആപ്ലിക്കേഷന് പൈപ്പ്ലൈനിംഗിൽ നിന്ന് വ്യത്യസ്തമായ ലക്ഷ്യമുണ്ട്, കൂടാതെ അനലിറ്റിക്സിനെ പിന്തുണയ്ക്കാൻ മാത്രമല്ല, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് പിന്തുണയ്ക്കാനും സങ്കീർണ്ണമായ പഠന ലോജിക് മോഡലുകൾ നടപ്പിലാക്കുന്നു.
“അതിനാൽ, മേൽനോട്ടത്തിലുള്ളതും മേൽനോട്ടമില്ലാത്തതുമായ പഠനം, റിഗ്രഷൻ, വർഗ്ഗീകരണം, മോഡൽ പരിശീലനം, മോഡൽ വിലയിരുത്തൽ, ടാർഗെറ്റ്, പ്രിഡിക്റ്റർ വേരിയബിളുകൾ തമ്മിലുള്ള വ്യത്യാസം എന്നിവ പോലുള്ള അടിസ്ഥാന എം എൽ ആശയങ്ങളെക്കുറിച്ചുള്ള അറിവ് ബിസിനസ്സിന് പ്രധാനമാണ്.”
മെഷീൻ ലേണിംഗ് പ്രോജക്റ്റുകൾ എല്ലാ സംരംഭങ്ങൾക്കും അനുയോജ്യമായ ഒരു വലുപ്പമല്ല, കൂടാതെ വ്യത്യസ്ത വൈദഗ്ധ്യ സെറ്റുകൾ ആവശ്യമാണ്
ബിസിനസ്സ് ഡൊമെയ്നെക്കുറിച്ചും ഡാറ്റാ സയൻസിനെക്കുറിച്ചും ഇരുപക്ഷവും മനസ്സിലാക്കേണ്ടതുണ്ടെന്ന് വാൻ നീക്കെർക്ക് പറഞ്ഞു. “എം എൽ പ്രോജക്റ്റുകൾ എല്ലാ സംരംഭങ്ങൾക്കും അനുയോജ്യമായ ഒരു വലുപ്പമല്ല, കൂടാതെ നിരവധി വ്യത്യസ്ത വൈദഗ്ധ്യ സെറ്റുകൾ ആവശ്യമാണ്.”
ടോപ്പ് പറഞ്ഞു: “ഫലപ്രദമായ ആശയവിനിമയം അത്യന്താപേക്ഷിതമാണ്. ഇരു ടീമുകളും പരസ്പരം ലക്ഷ്യങ്ങൾ, പ്രക്രിയകൾ, പദാവലികൾ എന്നിവ മനസ്സിലാക്കുന്നുവെന്ന് ഓർഗനൈസേഷനുകൾ ഉറപ്പാക്കണം. ഈ ധാരണ സുഗമമാക്കുന്നതിന് അവർ പതിവ് മീറ്റിംഗുകൾ, വർക്ക് ഷോപ്പുകൾ, ഡോക്യുമെന്റേഷൻ എന്നിവ ഉപയോഗിക്കണം. പ്രധാന പ്രകടന സൂചകങ്ങൾ (കെപിഐ) നിർവചിക്കുന്നത് സഹകരണ പ്രോജക്റ്റുകളുടെ വിജയം അളക്കാൻ സഹായിക്കുകയും ബിസിനസ്സ് ഫലങ്ങളിൽ ഡാറ്റാ സയൻസിന്റെ സ്വാധീനം വിലയിരുത്തുന്നതിനുള്ള വ്യക്തമായ മാർഗം നൽകുകയും ചെയ്യുന്നു.
“ബിസിനസ്സ് വിദഗ്ധർ ഡൊമെയ്ൻ നിർദ്ദിഷ്ട അറിവിനെക്കുറിച്ച് ഉൾക്കാഴ്ച നൽകുകയും ഡാറ്റാ ശാസ്ത്രജ്ഞർ സാങ്കേതിക വശങ്ങൾ വിശദീകരിക്കുകയും ചെയ്യുന്ന സംയുക്ത പരിശീലന സെഷനുകൾ സംഘടിപ്പിക്കാൻ കഴിയും,” ചാർട്ടേഴ്സ് പറഞ്ഞു.
DataRobot
ഓർഗനൈസേഷനിൽ ഡാറ്റ അധിഷ്ഠിതവും ഡാറ്റാ-ഒഴുക്കുള്ളതുമായ സംസ്കാരം വളർത്തുന്നതിലൂടെ എം എൽ പ്രോജക്റ്റുകളെ പിന്തുണയ്ക്കുന്നുവെന്ന് ടോപ്പ് കൂട്ടിച്ചേർത്തു.
ഒരു പ്രമുഖ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് പ്ലാറ്റ്ഫോമായ ഡാറ്റാറോബോട്ട് അതിന്റെ ചില കഴിവുകളിലൂടെ ഈ വിടവ് നികത്താൻ സഹായിക്കുന്നു.
“ഉപയോഗത്തിന്റെ എളുപ്പം അർത്ഥമാക്കുന്നത് നിർമ്മിച്ച വ്യത്യസ്ത മോഡലുകളെക്കുറിച്ച് നിങ്ങൾക്ക് ആഴത്തിലുള്ള സാങ്കേതിക പരിജ്ഞാനം ആവശ്യമില്ല എന്നാണ്. ലഭിച്ച മോഡലുകളും ഫലങ്ങളും എളുപ്പത്തിൽ വിശദീകരിക്കുകയും ഡാറ്റാറോബോട്ടിൽ ഒന്നിനും പിന്നിലല്ലാതിരിക്കുകയും ചെയ്യുന്നു, എല്ലാ വശങ്ങൾക്കും പൂർണ്ണ ഡോക്യുമെന്റേഷൻ ഉണ്ട്, അതിനാൽ ഒരു സാങ്കേതികേതര വ്യക്തിക്ക് മനസ്സമാധാനവും മോഡലുകളെയും മുഴുവൻ പ്രക്രിയയെയും കുറിച്ച് പൂർണ്ണമായ ധാരണയും ഉണ്ടായിരിക്കാൻ കഴിയും.
“അവസാനമായി, പ്ലാറ്റ്ഫോമിന്റെ പുതിയ ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് കഴിവുകൾ മോഡൽ വ്യാഖ്യാനത്തിനും കൂടുതൽ മോഡൽ കസ്റ്റമൈസേഷനായി കോഡ് ജനറേഷനും ഒരു പുതിയ മാനം നൽകുന്നു,” ചാർട്ടേഴ്സ് പറഞ്ഞു.
മാത്രമല്ല, ഡാറ്റാറോബോട്ടിന്റെ വേഗതയേറിയതും സ്ഥിരവുമായ പ്ലാറ്റ്ഫോം മെച്ചപ്പെടുത്തലുകൾ ഒരു വ്യവസായ നേതാവെന്ന നിലയിൽ അവരുടെ പദവി ഉറപ്പിക്കുന്നുവെന്ന് കെഐഡി ടീം നിരീക്ഷിക്കുന്നു.
വിശ്വാസം വളർത്തിയെടുക്കുകയും മൂല്യം നേടുകയും ചെയ്യുക
സങ്കീർണ്ണമായ മോഡലുകൾ മികച്ച കൃത്യത വാഗ്ദാനം ചെയ്യുമെങ്കിലും, അവ ബിസിനസ്സ് വശത്തിന് മനസിലാക്കാനും വിശ്വസിക്കാനും കൂടുതൽ ബുദ്ധിമുട്ടാണെന്ന് ചാർട്ടേഴ്സ് പറയുന്നു.
“ലളിതവും കൂടുതൽ വ്യാഖ്യാനിക്കാവുന്നതുമായ മോഡലുകൾ തിരഞ്ഞെടുക്കുന്നത് ചിലപ്പോൾ പ്രവർത്തനക്ഷമമായ ഉൾക്കാഴ്ചകളെ നയിക്കുന്നതിൽ കൂടുതൽ ഫലപ്രദമാകും. ഒരു സങ്കീർണ്ണമായ മോഡൽ എന്താണ് ചെയ്യുന്നതെന്നതിനെക്കുറിച്ചുള്ള ഉൾക്കാഴ്ച നൽകാൻ വ്യാഖ്യാന ഉപകരണങ്ങൾ ഉപയോഗിക്കാം, അങ്ങനെ കൃത്യതയും വ്യാഖ്യാനവും തമ്മിലുള്ള വിടവ് നികത്തുന്നു.
ഉത്തരവാദിത്തങ്ങൾ നിർവചിക്കുന്നതും പങ്കിടുന്നതും പരമാവധി ROI ഉറപ്പാക്കാൻ സഹായിക്കുമെന്ന് KID ടീം സമ്മതിച്ചു. ടോപ്പ് പറഞ്ഞു: “ടീമുകൾ അവരുടെ ലക്ഷ്യങ്ങൾ മൊത്തത്തിലുള്ള ബിസിനസ്സ് ലക്ഷ്യങ്ങളുമായി ക്രമീകരിക്കണം. ബിസിനസ്സ് പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നതിനും തന്ത്രപരമായ ഫലങ്ങൾ കൈവരിക്കുന്നതിനും ഡാറ്റാ സയൻസ് പ്രോജക്ടുകൾ നേരിട്ട് സംഭാവന നൽകണം.
ഡാറ്റാ ശേഖരണം, ശുചീകരണം, മോഡൽ വികസനം, നടപ്പാക്കൽ, ഫീഡ്ബാക്ക് ശേഖരണം എന്നിവയ്ക്കായി ആരാണ് എന്താണ് ചെയ്യുന്നതെന്ന് ഇരു ടീമുകളും അറിഞ്ഞിരിക്കണം. എല്ലാവരും ഒരേ പേജിലാണെന്ന് ഉറപ്പാക്കാൻ സാങ്കേതിക, ബിസിനസ്സ് ടീമുകൾക്കിടയിൽ നിരന്തരമായ വിന്യാസം ആവശ്യമാണ്.
ബിസിനസ്സ് പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നതിനും തന്ത്രപരമായ ഫലങ്ങൾ കൈവരിക്കുന്നതിനും ഡാറ്റാ സയൻസ് പ്രോജക്റ്റുകൾ നേരിട്ട് സംഭാവന നൽകണം
അന്തിമ ഉപയോക്താക്കൾക്ക് മോഡലുകളിൽ വിശ്വാസമുണ്ടെന്ന് ഉറപ്പാക്കാൻ, തുടർച്ചയായ ഫീഡ്ബാക്കിനായി ഓർഗനൈസേഷനുകൾ സംവിധാനങ്ങൾ സൃഷ്ടിക്കണമെന്ന് ടോപ്പ് ശുപാർശ ചെയ്യുന്നു. “ബിസിനസ്സ് ടീമുകൾ ഡാറ്റാ സയൻസ് ഉൾക്കാഴ്ചകളുടെ ഉപയോഗത്തെക്കുറിച്ച് ഫീഡ്ബാക്ക് നൽകണം, ഡാറ്റാ ശാസ്ത്രജ്ഞർ ഈ ഫീഡ്ബാക്കിനെ അടിസ്ഥാനമാക്കി അവരുടെ മോഡലുകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കണം,” അദ്ദേഹം പറഞ്ഞു. സഹകരണം സുഗമമാക്കുന്നതിന് സംഘടനകൾ ശരിയായ ഉപകരണങ്ങളും സാങ്കേതികവിദ്യയും തിരഞ്ഞെടുത്ത് നടപ്പാക്കണം. ജനറേറ്റീവ്, പ്രിഡിക്റ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകൾ നിർമ്മിക്കാനും വിന്യസിക്കാനും നിയന്ത്രിക്കാനും നിയന്ത്രിക്കാനും ആവശ്യമായതെല്ലാം ചെയ്യുന്ന പ്ലാറ്റ്ഫോമുകൾ പരിഗണിക്കുക.
ഡാറ്റ തയ്യാറാക്കുകയും ക്യൂറേറ്റുചെയ്യുകയും ചെയ്യുമ്പോൾ ഡാറ്റാ ഡ്രിഫ്റ്റ് സജീവമായി കൈകാര്യം ചെയ്യുന്നതിലൂടെയും ട്രൂത്ത് വെരിഫിക്കേഷൻ ടെക്നിക്കുകൾ ഉപയോഗിക്കുന്നതിലൂടെയും ഉൾക്കാഴ്ചയും പ്രവചന കൃത്യതയും ഉറപ്പാക്കുന്നതിനുള്ള കിഡിന്റെ മാനദണ്ഡങ്ങൾ വിശ്വാസം പ്രാപ്തമാക്കുന്നതിന് നിർണായകമാണ്.
ചാർട്ടേഴ്സ് അനുസരിച്ച്: “മോഡലുകൾ ശക്തവും വൈവിധ്യമാർന്ന സാഹചര്യങ്ങളിൽ പരീക്ഷിക്കുന്നതുമാണെന്ന് ഉറപ്പാക്കുന്നതിലൂടെയും പുതിയ ഡാറ്റയെയും ഫീഡ്ബാക്കിനെയും അടിസ്ഥാനമാക്കി മോഡലുകൾ പതിവായി അപ്ഡേറ്റ് ചെയ്യുന്നതിലൂടെയും അന്തിമ ഉപയോക്തൃ ആത്മവിശ്വാസം കെട്ടിപ്പടുക്കാൻ കഴിയും. ഇവിടെയും, പ്രക്രിയയുടെ ഓരോ ഘട്ടത്തിനും പൂർണ്ണ ഡോക്യുമെന്റേഷൻ വാഗ്ദാനം ചെയ്യുന്നതിനാൽ ഡാറ്റാറോബോട്ടിന് പരമ്പരാഗത എംഎല്ലിനേക്കാൾ മുൻതൂക്കം ഉണ്ട്; ഈ പ്രക്രിയയിൽ ‘ബ്ലാക്ക് ബോക്സുകൾ’ ഇല്ല.”
