ഇത് സങ്കല്പിച്ചു നോക്കൂ. വർക്ക് അവതരണത്തിനായി നിങ്ങൾക്ക് ഒരു ബലൂണിന്റെ ചിത്രം ആവശ്യമാണ്, അനുയോജ്യമായ ഒരു ഇമേജ് സൃഷ്ടിക്കുന്നതിന് മിഡ്ജൗർണി അല്ലെങ്കിൽ ഡാൽ-ഇ പോലുള്ള ടെക്സ്റ്റ്-ടു-ഇമേജ് ജനറേറ്ററിലേക്ക് തിരിയുക.

“നീലാകാശത്തിനെതിരെ ചുവന്ന ബലൂൺ” എന്ന് നിങ്ങൾ പ്രോംപ്റ്റ് നൽകുക, പക്ഷേ ജനറേറ്റർ പകരം ഒരു മുട്ടയുടെ ചിത്രം നൽകുന്നു. നിങ്ങൾ വീണ്ടും ശ്രമിക്കുക, പക്ഷേ ഇത്തവണ, ജനറേറ്റർ ഒരു തണ്ണിമത്തന്റെ ചിത്രം കാണിക്കുന്നു.

എന്താണ് നടക്കുന്നത്?

നിങ്ങൾ ഉപയോഗിക്കുന്ന ജനറേറ്ററിന് “വിഷം” ഉണ്ടായിരിക്കാം.

എന്താണ് ‘ഡാറ്റാ വിഷബാധ’?

ദശലക്ഷക്കണക്കിന് അല്ലെങ്കിൽ കോടിക്കണക്കിന് ചിത്രങ്ങൾ ഉൾപ്പെടുന്ന വലിയ ഡാറ്റാസെറ്റുകളിൽ പരിശീലനം നേടിയാണ് ടെക്സ്റ്റ്-ടു-ഇമേജ് ജനറേറ്ററുകൾ പ്രവർത്തിക്കുന്നത്. അഡോബി അല്ലെങ്കിൽ ഗെറ്റി വാഗ്ദാനം ചെയ്യുന്നതുപോലുള്ള ചില ജനറേറ്ററുകൾ ജനറേറ്ററിന്റെ നിർമ്മാതാവിന്റെ ഉടമസ്ഥതയിലുള്ളതോ ഉപയോഗിക്കാൻ ലൈസൻസുള്ളതോ ആയ ഇമേജുകൾ ഉപയോഗിച്ച് മാത്രമേ പരിശീലനം നൽകുകയുള്ളൂ.

എന്നാൽ മറ്റ് ജനറേറ്ററുകൾ വിവേചനരഹിതമായി ഓൺലൈൻ ഇമേജുകൾ സ്ക്രാപ്പ് ചെയ്തുകൊണ്ട് പരിശീലനം നേടിയിട്ടുണ്ട്, അവയിൽ പലതും പകർപ്പവകാശത്തിന് കീഴിലായിരിക്കാം. വൻകിട ടെക് കമ്പനികൾ അവരുടെ സൃഷ്ടികൾ മോഷ്ടിക്കുകയും ലാഭം നേടുകയും ചെയ്യുന്നുവെന്ന് കലാകാരന്മാർ ആരോപിച്ച പകർപ്പവകാശ ലംഘന കേസുകളിലേക്ക് ഇത് നയിച്ചു.

ഇവിടെയാണ് “വിഷം” എന്ന ആശയം വരുന്നത്. വ്യക്തിഗത കലാകാരന്മാരെ ശാക്തീകരിക്കാൻ ആഗ്രഹിക്കുന്ന ഗവേഷകർ അടുത്തിടെ അനധികൃത ഇമേജ് സ്ക്രാപ്പിംഗിനെതിരെ പോരാടാൻ “നൈറ്റ്ഷെയ്ഡ്” എന്ന ഉപകരണം സൃഷ്ടിച്ചു.

കമ്പ്യൂട്ടർ കാഴ്ചയ്ക്ക് നാശമുണ്ടാക്കുന്ന രീതിയിൽ ഒരു ചിത്രത്തിന്റെ പിക്സലുകൾ സൂക്ഷ്മമായി മാറ്റിക്കൊണ്ട് ഉപകരണം പ്രവർത്തിക്കുന്നു, പക്ഷേ ചിത്രം ഒരു മനുഷ്യന്റെ കണ്ണുകൾക്ക് മാറ്റമില്ലാതെ വിടുന്നു.

ഭാവിയിലെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡൽ പരിശീലിപ്പിക്കുന്നതിനായി ഒരു ഓർഗനൈസേഷൻ ഈ ചിത്രങ്ങളിൽ ഒന്ന് സ്ക്രാപ്പ് ചെയ്യുകയാണെങ്കിൽ, അതിന്റെ ഡാറ്റാ പൂൾ “വിഷലിപ്തമായി” മാറുന്നു. ഒരു ഇമേജിനെ അസത്യമാണെന്ന് ഒരു മനുഷ്യൻ കാഴ്ചയിൽ അറിയുന്ന ഒന്നായി തരംതിരിക്കാൻ അൽഗോരിതം തെറ്റായി പഠിക്കുന്നതിന് ഇത് കാരണമാകും. തൽഫലമായി, ജനറേറ്ററിന് പ്രവചനാതീതവും അപ്രതീക്ഷിതവുമായ ഫലങ്ങൾ നൽകാൻ കഴിയും.

വിഷബാധയുടെ ലക്ഷണങ്ങൾ

ഞങ്ങളുടെ മുൻ ഉദാഹരണത്തിലെന്നപോലെ, ഒരു ബലൂൺ ഒരു മുട്ടയായി മാറിയേക്കാം. മോനെയുടെ ശൈലിയിൽ ഒരു ചിത്രത്തിനായുള്ള അഭ്യർത്ഥന പകരം പിക്കാസോയുടെ ശൈലിയിൽ ഒരു ചിത്രം തിരികെ നൽകിയേക്കാം.

മുമ്പത്തെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകളിലെ ചില പ്രശ്നങ്ങൾ, ഉദാഹരണത്തിന്, കൈകൾ കൃത്യമായി കൈമാറുന്നതിലെ ബുദ്ധിമുട്ട് പോലുള്ളവ തിരികെ വന്നേക്കാം. ചിത്രങ്ങൾക്ക് വിചിത്രവും യുക്തിരഹിതവുമായ മറ്റ് സവിശേഷതകളും മോഡലുകൾ അവതരിപ്പിക്കാൻ കഴിയും – ആറ് കാലുള്ള നായ്ക്കൾ അല്ലെങ്കിൽ വികൃതമായ കിടക്കകൾ.

പരിശീലന ഡാറ്റയിൽ “വിഷം കലർന്ന” ചിത്രങ്ങളുടെ എണ്ണം കൂടുന്തോറും തടസ്സം വർദ്ധിക്കുന്നു. ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്നതിനാൽ, “വിഷം കലർന്ന” ഇമേജുകളിൽ നിന്നുള്ള കേടുപാടുകൾ ബന്ധപ്പെട്ട പ്രോംപ്റ്റ് കീവേഡുകളെയും ബാധിക്കുന്നു.

ഉദാഹരണത്തിന്, പരിശീലന ഡാറ്റയിൽ ഒരു ഫെരാരിയുടെ “വിഷം കലർന്ന” ചിത്രം ഉപയോഗിക്കുകയാണെങ്കിൽ, മറ്റ് കാർ ബ്രാൻഡുകൾക്കും വാഹനം, ഓട്ടോമൊബൈൽ പോലുള്ള മറ്റ് അനുബന്ധ പദങ്ങൾക്കും ഉടനടി ഫലങ്ങളെയും ബാധിച്ചേക്കാം.

ഈ ഉപകരണം വലിയ ടെക് കമ്പനികളെ പകർപ്പവകാശത്തെ കൂടുതൽ ബഹുമാനിക്കുമെന്ന് നൈറ്റ്ഷേഡിന്റെ ഡവലപ്പർ പ്രതീക്ഷിക്കുന്നു, പക്ഷേ ഉപയോക്താക്കൾ ഉപകരണം ദുരുപയോഗം ചെയ്യാനും അവരുടെ സേവനങ്ങൾ തടസ്സപ്പെടുത്താനും ശ്രമിക്കുന്നതിനായി ജനറേറ്ററുകളിലേക്ക് മനഃപൂർവ്വം “വിഷം കലർന്ന” ചിത്രങ്ങൾ അപ്ലോഡ് ചെയ്യാനും സാധ്യതയുണ്ട്.

ഒരു മറുമരുന്ന് ഉണ്ടോ?

പ്രതികരണമായി, പങ്കാളികൾ സാങ്കേതികവും മാനുഷികവുമായ പരിഹാരങ്ങളുടെ ഒരു ശ്രേണി നിർദ്ദേശിച്ചു. ഇൻപുട്ട് ഡാറ്റ എവിടെ നിന്ന് വരുന്നുവെന്നും അവ എങ്ങനെ ഉപയോഗിക്കാമെന്നും കൂടുതൽ ശ്രദ്ധ ചെലുത്തുക എന്നതാണ് ഏറ്റവും വ്യക്തമായ കാര്യം. അങ്ങനെ ചെയ്യുന്നത് വിവേചനരഹിതമായ ഡാറ്റാ വിളവെടുപ്പിന് കാരണമാകും.

ഈ സമീപനം കമ്പ്യൂട്ടർ ശാസ്ത്രജ്ഞർക്കിടയിലെ ഒരു പൊതു വിശ്വാസത്തെ വെല്ലുവിളിക്കുന്നു: ഓൺലൈനിൽ കാണപ്പെടുന്ന ഡാറ്റ അവർക്ക് അനുയോജ്യമെന്ന് തോന്നുന്ന ഏത് ആവശ്യത്തിനും ഉപയോഗിക്കാം.

ഡാറ്റയുടെ വിവിധ ഉപവിഭാഗങ്ങളിൽ വ്യത്യസ്ത മോഡലുകൾക്ക് പരിശീലനം നൽകുകയും നിർദ്ദിഷ്ട ഔട്ട്ലിയറുകൾ കണ്ടെത്തുന്നതിന് താരതമ്യം ചെയ്യുകയും ചെയ്യുന്ന “എൻസെംബിൾ മോഡലിംഗ്” ഉപയോഗവും മറ്റ് സാങ്കേതിക പരിഹാരങ്ങളിൽ ഉൾപ്പെടുന്നു. ഈ സമീപനം പരിശീലനത്തിന് മാത്രമല്ല, സംശയാസ്പദമായ “വിഷം” ഇമേജുകൾ കണ്ടെത്താനും ഉപേക്ഷിക്കാനും ഉപയോഗിക്കാം.

ഓഡിറ്റുകളാണ് മറ്റൊരു ഓപ്ഷൻ. പരിശീലനത്തിനായി ഒരിക്കലും ഉപയോഗിക്കാത്ത “ഹോൾഡ്-ഔട്ട്” ഡാറ്റ ഉപയോഗിച്ച് ഒരു “ടെസ്റ്റ് ബാറ്ററി” – ഒരു ചെറിയ, ഉയർന്ന ക്യൂറേറ്റഡ്, നന്നായി ലേബൽ ചെയ്ത ഡാറ്റാസെറ്റ് – വികസിപ്പിക്കുന്നത് ഒരു ഓഡിറ്റ് സമീപനത്തിൽ ഉൾപ്പെടുന്നു. മോഡലിന്റെ കൃത്യത പരിശോധിക്കാൻ ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കാം.

സാങ്കേതികവിദ്യയ്ക്കെതിരായ തന്ത്രങ്ങൾ

ഡാറ്റാ വിഷബാധ ഉൾപ്പെടെ “വിപരീത സമീപനങ്ങൾ” (ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റങ്ങളെ തരംതാഴ്ത്തുകയോ നിഷേധിക്കുകയോ വഞ്ചിക്കുകയോ കൈകാര്യം ചെയ്യുകയോ ചെയ്യുന്നവ) പുതിയതല്ല. ഫേഷ്യൽ റെക്കഗ്നിഷൻ സിസ്റ്റങ്ങളെ മറികടക്കാൻ മേക്കപ്പും വസ്ത്രങ്ങളും ഉപയോഗിക്കുന്നതും അവർ ചരിത്രപരമായി ഉൾപ്പെടുത്തിയിട്ടുണ്ട്.

ഉദാഹരണത്തിന്, വിശാലമായ സമൂഹത്തിൽ യന്ത്ര ദർശനത്തിന്റെ വിവേചനരഹിതമായ ഉപയോഗത്തെക്കുറിച്ച് മനുഷ്യാവകാശ പ്രവർത്തകർ കുറച്ച് കാലമായി ആശങ്കാകുലരാണ്. മുഖം തിരിച്ചറിയുന്നതുമായി ബന്ധപ്പെട്ട് ഈ ആശങ്ക പ്രത്യേകിച്ചും രൂക്ഷമാണ്.

ഇന്റർനെറ്റിൽ നിന്ന് സ്ക്രാപ്പ് ചെയ്ത മുഖങ്ങളുടെ ഒരു വലിയ തിരയൽ ഡാറ്റാബേസ് ഹോസ്റ്റുചെയ്യുന്ന ക്ലിയർവ്യൂ എഐ പോലുള്ള സംവിധാനങ്ങൾ ലോകമെമ്പാടുമുള്ള നിയമപാലകരും സർക്കാർ ഏജൻസികളും ഉപയോഗിക്കുന്നു. ക്ലിയർവ്യൂ എഐ ഓസ്ട്രേലിയക്കാരുടെ സ്വകാര്യത ലംഘിക്കുന്നുവെന്ന് 2021 ൽ ഓസ്ട്രേലിയൻ സർക്കാർ കണ്ടെത്തി.

നിയമാനുസൃതമായ പ്രതിഷേധക്കാർ ഉൾപ്പെടെയുള്ള നിർദ്ദിഷ്ട വ്യക്തികളെ പ്രൊഫൈൽ ചെയ്യാൻ ഫേഷ്യൽ റെക്കഗ്നിഷൻ സംവിധാനങ്ങൾ ഉപയോഗിക്കുന്നതിന് മറുപടിയായി, കലാകാരന്മാർ വിണ്ടുകീറിയ വരകളുടെയും അസമത്വ വളവുകളുടെയും വിപരീത മേക്കപ്പ് പാറ്റേണുകൾ ആവിഷ്കരിച്ചു, ഇത് നിരീക്ഷണ സംവിധാനങ്ങൾ അവരെ കൃത്യമായി തിരിച്ചറിയുന്നതിൽ നിന്ന് തടയുന്നു.

ഈ കേസുകളും ഡാറ്റാ വിഷബാധയുടെ പ്രശ്നവും തമ്മിൽ വ്യക്തമായ ബന്ധമുണ്ട്, കാരണം രണ്ടും സാങ്കേതിക ഭരണത്തെ ചുറ്റിപ്പറ്റിയുള്ള വലിയ ചോദ്യങ്ങളുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു.

പല ടെക്നോളജി വെണ്ടർമാരും ഡാറ്റാ വിഷം സാങ്കേതിക പരിഹാരങ്ങൾ ഉപയോഗിച്ച് പരിഹരിക്കേണ്ട ഒരു പ്രശ്നമായി കണക്കാക്കും. എന്നിരുന്നാലും, കലാകാരന്മാരുടെയും ഉപയോക്താക്കളുടെയും അടിസ്ഥാന ധാർമ്മിക അവകാശങ്ങളിൽ കടന്നുകയറുന്നതിനുള്ള നൂതന പരിഹാരമായി ഡാറ്റാ വിഷബാധയെ കാണുന്നത് നല്ലതാണ്.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

You May Also Like

കലാസൃഷ്ടികളിൽ പരിശീലനം നൽകുന്നതിൽ നിന്ന് ജെൻഎഐ മോഡലുകളെ തടയാൻ Kin.art സൗജന്യ ഉപകരണം അവതരിപ്പിക്കുന്നു

ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്, പ്രത്യേകിച്ച് മിഡ്ജൗർണി, ഓപ്പൺഎഐയുടെ ഡാൽ-ഇ 3 പോലുള്ള ടെക്സ്റ്റ്-ടു-ഇമേജ് എഐ മോഡലുകൾക്ക് എന്തുചെയ്യാൻ കഴിയുമെന്നത് ആശ്ചര്യകരമാണ്. ഫോട്ടോറിയലിസം മുതൽ ക്യൂബിസം വരെ, ഇമേജ്...

സാമ്പത്തിക ഡോക്യുമെന്റ് വിശകലനത്തിൽ കൃത്യത മെച്ചപ്പെടുത്തുന്നതിനുള്ള ഒരു ഉപകരണം സൃഷ്ടിക്കാൻ ലാങ്ചെയിൻ, റെഡിസ് സഹകരിക്കുന്നു

നൂതന ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകളുടെ ആവിർഭാവം പ്രകൃതി ഭാഷാ പ്രോസസ്സിംഗ് മേഖലയിൽ വിപ്ലവം സൃഷ്ടിച്ചു, ഇത് മനുഷ്യ ഭാഷയെ വിശകലനം ചെയ്യാനും വ്യാഖ്യാനിക്കാനും പ്രതികരിക്കാനും യന്ത്രങ്ങളെ പ്രാപ്തമാക്കി....

മാർക്കറ്റർമാർ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അസിസ്റ്റന്റ്, ഇൻസ്റ്റിറ്റ്യൂഷണൽ നോളജ് ടൂളായി കാണുന്നു

2010 കളുടെ മധ്യം മുതൽ അവസാനം വരെ, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മറ്റെല്ലാ വാർത്താ ബുള്ളറ്റിനുകളിലും ഇന്നത്തെപ്പോലെ ഇല്ലെങ്കിലും, മാർക്കറ്റിംഗിൽ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനെക്കുറിച്ച് ഇപ്പോഴും ധാരാളം ചർച്ചകൾ നടക്കുന്നുണ്ട്....

ബിസിനസ്സിൽ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ സാധ്യതകൾ അൺലോക്ക് ചെയ്യുന്നു: ഒരു സമഗ്ര ഗൈഡ്

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഇപ്പോൾ വെറുമൊരു ബഹള പദമല്ല; ഇത് ആധുനിക ബിസിനസ്സ് പ്രവർത്തനങ്ങളുടെ അവിഭാജ്യ ഘടകമായി മാറിയിരിക്കുന്നു. വളരെയധികം ഡാറ്റ പ്രോസസ്സ് ചെയ്യാനും അറിവുള്ള തീരുമാനങ്ങൾ എടുക്കാനും...