ഇത് സങ്കല്പിച്ചു നോക്കൂ. വർക്ക് അവതരണത്തിനായി നിങ്ങൾക്ക് ഒരു ബലൂണിന്റെ ചിത്രം ആവശ്യമാണ്, അനുയോജ്യമായ ഒരു ഇമേജ് സൃഷ്ടിക്കുന്നതിന് മിഡ്ജൗർണി അല്ലെങ്കിൽ ഡാൽ-ഇ പോലുള്ള ടെക്സ്റ്റ്-ടു-ഇമേജ് ജനറേറ്ററിലേക്ക് തിരിയുക.
“നീലാകാശത്തിനെതിരെ ചുവന്ന ബലൂൺ” എന്ന് നിങ്ങൾ പ്രോംപ്റ്റ് നൽകുക, പക്ഷേ ജനറേറ്റർ പകരം ഒരു മുട്ടയുടെ ചിത്രം നൽകുന്നു. നിങ്ങൾ വീണ്ടും ശ്രമിക്കുക, പക്ഷേ ഇത്തവണ, ജനറേറ്റർ ഒരു തണ്ണിമത്തന്റെ ചിത്രം കാണിക്കുന്നു.
എന്താണ് നടക്കുന്നത്?
നിങ്ങൾ ഉപയോഗിക്കുന്ന ജനറേറ്ററിന് “വിഷം” ഉണ്ടായിരിക്കാം.
എന്താണ് ‘ഡാറ്റാ വിഷബാധ’?
ദശലക്ഷക്കണക്കിന് അല്ലെങ്കിൽ കോടിക്കണക്കിന് ചിത്രങ്ങൾ ഉൾപ്പെടുന്ന വലിയ ഡാറ്റാസെറ്റുകളിൽ പരിശീലനം നേടിയാണ് ടെക്സ്റ്റ്-ടു-ഇമേജ് ജനറേറ്ററുകൾ പ്രവർത്തിക്കുന്നത്. അഡോബി അല്ലെങ്കിൽ ഗെറ്റി വാഗ്ദാനം ചെയ്യുന്നതുപോലുള്ള ചില ജനറേറ്ററുകൾ ജനറേറ്ററിന്റെ നിർമ്മാതാവിന്റെ ഉടമസ്ഥതയിലുള്ളതോ ഉപയോഗിക്കാൻ ലൈസൻസുള്ളതോ ആയ ഇമേജുകൾ ഉപയോഗിച്ച് മാത്രമേ പരിശീലനം നൽകുകയുള്ളൂ.
എന്നാൽ മറ്റ് ജനറേറ്ററുകൾ വിവേചനരഹിതമായി ഓൺലൈൻ ഇമേജുകൾ സ്ക്രാപ്പ് ചെയ്തുകൊണ്ട് പരിശീലനം നേടിയിട്ടുണ്ട്, അവയിൽ പലതും പകർപ്പവകാശത്തിന് കീഴിലായിരിക്കാം. വൻകിട ടെക് കമ്പനികൾ അവരുടെ സൃഷ്ടികൾ മോഷ്ടിക്കുകയും ലാഭം നേടുകയും ചെയ്യുന്നുവെന്ന് കലാകാരന്മാർ ആരോപിച്ച പകർപ്പവകാശ ലംഘന കേസുകളിലേക്ക് ഇത് നയിച്ചു.
ഇവിടെയാണ് “വിഷം” എന്ന ആശയം വരുന്നത്. വ്യക്തിഗത കലാകാരന്മാരെ ശാക്തീകരിക്കാൻ ആഗ്രഹിക്കുന്ന ഗവേഷകർ അടുത്തിടെ അനധികൃത ഇമേജ് സ്ക്രാപ്പിംഗിനെതിരെ പോരാടാൻ “നൈറ്റ്ഷെയ്ഡ്” എന്ന ഉപകരണം സൃഷ്ടിച്ചു.
കമ്പ്യൂട്ടർ കാഴ്ചയ്ക്ക് നാശമുണ്ടാക്കുന്ന രീതിയിൽ ഒരു ചിത്രത്തിന്റെ പിക്സലുകൾ സൂക്ഷ്മമായി മാറ്റിക്കൊണ്ട് ഉപകരണം പ്രവർത്തിക്കുന്നു, പക്ഷേ ചിത്രം ഒരു മനുഷ്യന്റെ കണ്ണുകൾക്ക് മാറ്റമില്ലാതെ വിടുന്നു.
ഭാവിയിലെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡൽ പരിശീലിപ്പിക്കുന്നതിനായി ഒരു ഓർഗനൈസേഷൻ ഈ ചിത്രങ്ങളിൽ ഒന്ന് സ്ക്രാപ്പ് ചെയ്യുകയാണെങ്കിൽ, അതിന്റെ ഡാറ്റാ പൂൾ “വിഷലിപ്തമായി” മാറുന്നു. ഒരു ഇമേജിനെ അസത്യമാണെന്ന് ഒരു മനുഷ്യൻ കാഴ്ചയിൽ അറിയുന്ന ഒന്നായി തരംതിരിക്കാൻ അൽഗോരിതം തെറ്റായി പഠിക്കുന്നതിന് ഇത് കാരണമാകും. തൽഫലമായി, ജനറേറ്ററിന് പ്രവചനാതീതവും അപ്രതീക്ഷിതവുമായ ഫലങ്ങൾ നൽകാൻ കഴിയും.
വിഷബാധയുടെ ലക്ഷണങ്ങൾ
ഞങ്ങളുടെ മുൻ ഉദാഹരണത്തിലെന്നപോലെ, ഒരു ബലൂൺ ഒരു മുട്ടയായി മാറിയേക്കാം. മോനെയുടെ ശൈലിയിൽ ഒരു ചിത്രത്തിനായുള്ള അഭ്യർത്ഥന പകരം പിക്കാസോയുടെ ശൈലിയിൽ ഒരു ചിത്രം തിരികെ നൽകിയേക്കാം.
മുമ്പത്തെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകളിലെ ചില പ്രശ്നങ്ങൾ, ഉദാഹരണത്തിന്, കൈകൾ കൃത്യമായി കൈമാറുന്നതിലെ ബുദ്ധിമുട്ട് പോലുള്ളവ തിരികെ വന്നേക്കാം. ചിത്രങ്ങൾക്ക് വിചിത്രവും യുക്തിരഹിതവുമായ മറ്റ് സവിശേഷതകളും മോഡലുകൾ അവതരിപ്പിക്കാൻ കഴിയും – ആറ് കാലുള്ള നായ്ക്കൾ അല്ലെങ്കിൽ വികൃതമായ കിടക്കകൾ.
പരിശീലന ഡാറ്റയിൽ “വിഷം കലർന്ന” ചിത്രങ്ങളുടെ എണ്ണം കൂടുന്തോറും തടസ്സം വർദ്ധിക്കുന്നു. ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്നതിനാൽ, “വിഷം കലർന്ന” ഇമേജുകളിൽ നിന്നുള്ള കേടുപാടുകൾ ബന്ധപ്പെട്ട പ്രോംപ്റ്റ് കീവേഡുകളെയും ബാധിക്കുന്നു.
ഉദാഹരണത്തിന്, പരിശീലന ഡാറ്റയിൽ ഒരു ഫെരാരിയുടെ “വിഷം കലർന്ന” ചിത്രം ഉപയോഗിക്കുകയാണെങ്കിൽ, മറ്റ് കാർ ബ്രാൻഡുകൾക്കും വാഹനം, ഓട്ടോമൊബൈൽ പോലുള്ള മറ്റ് അനുബന്ധ പദങ്ങൾക്കും ഉടനടി ഫലങ്ങളെയും ബാധിച്ചേക്കാം.
ഈ ഉപകരണം വലിയ ടെക് കമ്പനികളെ പകർപ്പവകാശത്തെ കൂടുതൽ ബഹുമാനിക്കുമെന്ന് നൈറ്റ്ഷേഡിന്റെ ഡവലപ്പർ പ്രതീക്ഷിക്കുന്നു, പക്ഷേ ഉപയോക്താക്കൾ ഉപകരണം ദുരുപയോഗം ചെയ്യാനും അവരുടെ സേവനങ്ങൾ തടസ്സപ്പെടുത്താനും ശ്രമിക്കുന്നതിനായി ജനറേറ്ററുകളിലേക്ക് മനഃപൂർവ്വം “വിഷം കലർന്ന” ചിത്രങ്ങൾ അപ്ലോഡ് ചെയ്യാനും സാധ്യതയുണ്ട്.
ഒരു മറുമരുന്ന് ഉണ്ടോ?
പ്രതികരണമായി, പങ്കാളികൾ സാങ്കേതികവും മാനുഷികവുമായ പരിഹാരങ്ങളുടെ ഒരു ശ്രേണി നിർദ്ദേശിച്ചു. ഇൻപുട്ട് ഡാറ്റ എവിടെ നിന്ന് വരുന്നുവെന്നും അവ എങ്ങനെ ഉപയോഗിക്കാമെന്നും കൂടുതൽ ശ്രദ്ധ ചെലുത്തുക എന്നതാണ് ഏറ്റവും വ്യക്തമായ കാര്യം. അങ്ങനെ ചെയ്യുന്നത് വിവേചനരഹിതമായ ഡാറ്റാ വിളവെടുപ്പിന് കാരണമാകും.
ഈ സമീപനം കമ്പ്യൂട്ടർ ശാസ്ത്രജ്ഞർക്കിടയിലെ ഒരു പൊതു വിശ്വാസത്തെ വെല്ലുവിളിക്കുന്നു: ഓൺലൈനിൽ കാണപ്പെടുന്ന ഡാറ്റ അവർക്ക് അനുയോജ്യമെന്ന് തോന്നുന്ന ഏത് ആവശ്യത്തിനും ഉപയോഗിക്കാം.
ഡാറ്റയുടെ വിവിധ ഉപവിഭാഗങ്ങളിൽ വ്യത്യസ്ത മോഡലുകൾക്ക് പരിശീലനം നൽകുകയും നിർദ്ദിഷ്ട ഔട്ട്ലിയറുകൾ കണ്ടെത്തുന്നതിന് താരതമ്യം ചെയ്യുകയും ചെയ്യുന്ന “എൻസെംബിൾ മോഡലിംഗ്” ഉപയോഗവും മറ്റ് സാങ്കേതിക പരിഹാരങ്ങളിൽ ഉൾപ്പെടുന്നു. ഈ സമീപനം പരിശീലനത്തിന് മാത്രമല്ല, സംശയാസ്പദമായ “വിഷം” ഇമേജുകൾ കണ്ടെത്താനും ഉപേക്ഷിക്കാനും ഉപയോഗിക്കാം.
ഓഡിറ്റുകളാണ് മറ്റൊരു ഓപ്ഷൻ. പരിശീലനത്തിനായി ഒരിക്കലും ഉപയോഗിക്കാത്ത “ഹോൾഡ്-ഔട്ട്” ഡാറ്റ ഉപയോഗിച്ച് ഒരു “ടെസ്റ്റ് ബാറ്ററി” – ഒരു ചെറിയ, ഉയർന്ന ക്യൂറേറ്റഡ്, നന്നായി ലേബൽ ചെയ്ത ഡാറ്റാസെറ്റ് – വികസിപ്പിക്കുന്നത് ഒരു ഓഡിറ്റ് സമീപനത്തിൽ ഉൾപ്പെടുന്നു. മോഡലിന്റെ കൃത്യത പരിശോധിക്കാൻ ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കാം.
സാങ്കേതികവിദ്യയ്ക്കെതിരായ തന്ത്രങ്ങൾ
ഡാറ്റാ വിഷബാധ ഉൾപ്പെടെ “വിപരീത സമീപനങ്ങൾ” (ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റങ്ങളെ തരംതാഴ്ത്തുകയോ നിഷേധിക്കുകയോ വഞ്ചിക്കുകയോ കൈകാര്യം ചെയ്യുകയോ ചെയ്യുന്നവ) പുതിയതല്ല. ഫേഷ്യൽ റെക്കഗ്നിഷൻ സിസ്റ്റങ്ങളെ മറികടക്കാൻ മേക്കപ്പും വസ്ത്രങ്ങളും ഉപയോഗിക്കുന്നതും അവർ ചരിത്രപരമായി ഉൾപ്പെടുത്തിയിട്ടുണ്ട്.
ഉദാഹരണത്തിന്, വിശാലമായ സമൂഹത്തിൽ യന്ത്ര ദർശനത്തിന്റെ വിവേചനരഹിതമായ ഉപയോഗത്തെക്കുറിച്ച് മനുഷ്യാവകാശ പ്രവർത്തകർ കുറച്ച് കാലമായി ആശങ്കാകുലരാണ്. മുഖം തിരിച്ചറിയുന്നതുമായി ബന്ധപ്പെട്ട് ഈ ആശങ്ക പ്രത്യേകിച്ചും രൂക്ഷമാണ്.
ഇന്റർനെറ്റിൽ നിന്ന് സ്ക്രാപ്പ് ചെയ്ത മുഖങ്ങളുടെ ഒരു വലിയ തിരയൽ ഡാറ്റാബേസ് ഹോസ്റ്റുചെയ്യുന്ന ക്ലിയർവ്യൂ എഐ പോലുള്ള സംവിധാനങ്ങൾ ലോകമെമ്പാടുമുള്ള നിയമപാലകരും സർക്കാർ ഏജൻസികളും ഉപയോഗിക്കുന്നു. ക്ലിയർവ്യൂ എഐ ഓസ്ട്രേലിയക്കാരുടെ സ്വകാര്യത ലംഘിക്കുന്നുവെന്ന് 2021 ൽ ഓസ്ട്രേലിയൻ സർക്കാർ കണ്ടെത്തി.
നിയമാനുസൃതമായ പ്രതിഷേധക്കാർ ഉൾപ്പെടെയുള്ള നിർദ്ദിഷ്ട വ്യക്തികളെ പ്രൊഫൈൽ ചെയ്യാൻ ഫേഷ്യൽ റെക്കഗ്നിഷൻ സംവിധാനങ്ങൾ ഉപയോഗിക്കുന്നതിന് മറുപടിയായി, കലാകാരന്മാർ വിണ്ടുകീറിയ വരകളുടെയും അസമത്വ വളവുകളുടെയും വിപരീത മേക്കപ്പ് പാറ്റേണുകൾ ആവിഷ്കരിച്ചു, ഇത് നിരീക്ഷണ സംവിധാനങ്ങൾ അവരെ കൃത്യമായി തിരിച്ചറിയുന്നതിൽ നിന്ന് തടയുന്നു.
ഈ കേസുകളും ഡാറ്റാ വിഷബാധയുടെ പ്രശ്നവും തമ്മിൽ വ്യക്തമായ ബന്ധമുണ്ട്, കാരണം രണ്ടും സാങ്കേതിക ഭരണത്തെ ചുറ്റിപ്പറ്റിയുള്ള വലിയ ചോദ്യങ്ങളുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു.
പല ടെക്നോളജി വെണ്ടർമാരും ഡാറ്റാ വിഷം സാങ്കേതിക പരിഹാരങ്ങൾ ഉപയോഗിച്ച് പരിഹരിക്കേണ്ട ഒരു പ്രശ്നമായി കണക്കാക്കും. എന്നിരുന്നാലും, കലാകാരന്മാരുടെയും ഉപയോക്താക്കളുടെയും അടിസ്ഥാന ധാർമ്മിക അവകാശങ്ങളിൽ കടന്നുകയറുന്നതിനുള്ള നൂതന പരിഹാരമായി ഡാറ്റാ വിഷബാധയെ കാണുന്നത് നല്ലതാണ്.
