ഇത് സങ്കല്പിച്ചു നോക്കൂ. വർക്ക് അവതരണത്തിനായി നിങ്ങൾക്ക് ഒരു ബലൂണിന്റെ ചിത്രം ആവശ്യമാണ്, അനുയോജ്യമായ ഒരു ഇമേജ് സൃഷ്ടിക്കുന്നതിന് മിഡ്ജൗർണി അല്ലെങ്കിൽ ഡാൽ-ഇ പോലുള്ള ടെക്സ്റ്റ്-ടു-ഇമേജ് ജനറേറ്ററിലേക്ക് തിരിയുക.

“നീലാകാശത്തിനെതിരെ ചുവന്ന ബലൂൺ” എന്ന് നിങ്ങൾ പ്രോംപ്റ്റ് നൽകുക, പക്ഷേ ജനറേറ്റർ പകരം ഒരു മുട്ടയുടെ ചിത്രം നൽകുന്നു. നിങ്ങൾ വീണ്ടും ശ്രമിക്കുക, പക്ഷേ ഇത്തവണ, ജനറേറ്റർ ഒരു തണ്ണിമത്തന്റെ ചിത്രം കാണിക്കുന്നു.

എന്താണ് നടക്കുന്നത്?

നിങ്ങൾ ഉപയോഗിക്കുന്ന ജനറേറ്ററിന് “വിഷം” ഉണ്ടായിരിക്കാം.

എന്താണ് ‘ഡാറ്റാ വിഷബാധ’?

ദശലക്ഷക്കണക്കിന് അല്ലെങ്കിൽ കോടിക്കണക്കിന് ചിത്രങ്ങൾ ഉൾപ്പെടുന്ന വലിയ ഡാറ്റാസെറ്റുകളിൽ പരിശീലനം നേടിയാണ് ടെക്സ്റ്റ്-ടു-ഇമേജ് ജനറേറ്ററുകൾ പ്രവർത്തിക്കുന്നത്. അഡോബി അല്ലെങ്കിൽ ഗെറ്റി വാഗ്ദാനം ചെയ്യുന്നതുപോലുള്ള ചില ജനറേറ്ററുകൾ ജനറേറ്ററിന്റെ നിർമ്മാതാവിന്റെ ഉടമസ്ഥതയിലുള്ളതോ ഉപയോഗിക്കാൻ ലൈസൻസുള്ളതോ ആയ ഇമേജുകൾ ഉപയോഗിച്ച് മാത്രമേ പരിശീലനം നൽകുകയുള്ളൂ.

എന്നാൽ മറ്റ് ജനറേറ്ററുകൾ വിവേചനരഹിതമായി ഓൺലൈൻ ഇമേജുകൾ സ്ക്രാപ്പ് ചെയ്തുകൊണ്ട് പരിശീലനം നേടിയിട്ടുണ്ട്, അവയിൽ പലതും പകർപ്പവകാശത്തിന് കീഴിലായിരിക്കാം. വൻകിട ടെക് കമ്പനികൾ അവരുടെ സൃഷ്ടികൾ മോഷ്ടിക്കുകയും ലാഭം നേടുകയും ചെയ്യുന്നുവെന്ന് കലാകാരന്മാർ ആരോപിച്ച പകർപ്പവകാശ ലംഘന കേസുകളിലേക്ക് ഇത് നയിച്ചു.

ഇവിടെയാണ് “വിഷം” എന്ന ആശയം വരുന്നത്. വ്യക്തിഗത കലാകാരന്മാരെ ശാക്തീകരിക്കാൻ ആഗ്രഹിക്കുന്ന ഗവേഷകർ അടുത്തിടെ അനധികൃത ഇമേജ് സ്ക്രാപ്പിംഗിനെതിരെ പോരാടാൻ “നൈറ്റ്ഷെയ്ഡ്” എന്ന ഉപകരണം സൃഷ്ടിച്ചു.

കമ്പ്യൂട്ടർ കാഴ്ചയ്ക്ക് നാശമുണ്ടാക്കുന്ന രീതിയിൽ ഒരു ചിത്രത്തിന്റെ പിക്സലുകൾ സൂക്ഷ്മമായി മാറ്റിക്കൊണ്ട് ഉപകരണം പ്രവർത്തിക്കുന്നു, പക്ഷേ ചിത്രം ഒരു മനുഷ്യന്റെ കണ്ണുകൾക്ക് മാറ്റമില്ലാതെ വിടുന്നു.

ഭാവിയിലെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡൽ പരിശീലിപ്പിക്കുന്നതിനായി ഒരു ഓർഗനൈസേഷൻ ഈ ചിത്രങ്ങളിൽ ഒന്ന് സ്ക്രാപ്പ് ചെയ്യുകയാണെങ്കിൽ, അതിന്റെ ഡാറ്റാ പൂൾ “വിഷലിപ്തമായി” മാറുന്നു. ഒരു ഇമേജിനെ അസത്യമാണെന്ന് ഒരു മനുഷ്യൻ കാഴ്ചയിൽ അറിയുന്ന ഒന്നായി തരംതിരിക്കാൻ അൽഗോരിതം തെറ്റായി പഠിക്കുന്നതിന് ഇത് കാരണമാകും. തൽഫലമായി, ജനറേറ്ററിന് പ്രവചനാതീതവും അപ്രതീക്ഷിതവുമായ ഫലങ്ങൾ നൽകാൻ കഴിയും.

വിഷബാധയുടെ ലക്ഷണങ്ങൾ

ഞങ്ങളുടെ മുൻ ഉദാഹരണത്തിലെന്നപോലെ, ഒരു ബലൂൺ ഒരു മുട്ടയായി മാറിയേക്കാം. മോനെയുടെ ശൈലിയിൽ ഒരു ചിത്രത്തിനായുള്ള അഭ്യർത്ഥന പകരം പിക്കാസോയുടെ ശൈലിയിൽ ഒരു ചിത്രം തിരികെ നൽകിയേക്കാം.

മുമ്പത്തെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകളിലെ ചില പ്രശ്നങ്ങൾ, ഉദാഹരണത്തിന്, കൈകൾ കൃത്യമായി കൈമാറുന്നതിലെ ബുദ്ധിമുട്ട് പോലുള്ളവ തിരികെ വന്നേക്കാം. ചിത്രങ്ങൾക്ക് വിചിത്രവും യുക്തിരഹിതവുമായ മറ്റ് സവിശേഷതകളും മോഡലുകൾ അവതരിപ്പിക്കാൻ കഴിയും – ആറ് കാലുള്ള നായ്ക്കൾ അല്ലെങ്കിൽ വികൃതമായ കിടക്കകൾ.

പരിശീലന ഡാറ്റയിൽ “വിഷം കലർന്ന” ചിത്രങ്ങളുടെ എണ്ണം കൂടുന്തോറും തടസ്സം വർദ്ധിക്കുന്നു. ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്നതിനാൽ, “വിഷം കലർന്ന” ഇമേജുകളിൽ നിന്നുള്ള കേടുപാടുകൾ ബന്ധപ്പെട്ട പ്രോംപ്റ്റ് കീവേഡുകളെയും ബാധിക്കുന്നു.

ഉദാഹരണത്തിന്, പരിശീലന ഡാറ്റയിൽ ഒരു ഫെരാരിയുടെ “വിഷം കലർന്ന” ചിത്രം ഉപയോഗിക്കുകയാണെങ്കിൽ, മറ്റ് കാർ ബ്രാൻഡുകൾക്കും വാഹനം, ഓട്ടോമൊബൈൽ പോലുള്ള മറ്റ് അനുബന്ധ പദങ്ങൾക്കും ഉടനടി ഫലങ്ങളെയും ബാധിച്ചേക്കാം.

ഈ ഉപകരണം വലിയ ടെക് കമ്പനികളെ പകർപ്പവകാശത്തെ കൂടുതൽ ബഹുമാനിക്കുമെന്ന് നൈറ്റ്ഷേഡിന്റെ ഡവലപ്പർ പ്രതീക്ഷിക്കുന്നു, പക്ഷേ ഉപയോക്താക്കൾ ഉപകരണം ദുരുപയോഗം ചെയ്യാനും അവരുടെ സേവനങ്ങൾ തടസ്സപ്പെടുത്താനും ശ്രമിക്കുന്നതിനായി ജനറേറ്ററുകളിലേക്ക് മനഃപൂർവ്വം “വിഷം കലർന്ന” ചിത്രങ്ങൾ അപ്ലോഡ് ചെയ്യാനും സാധ്യതയുണ്ട്.

ഒരു മറുമരുന്ന് ഉണ്ടോ?

പ്രതികരണമായി, പങ്കാളികൾ സാങ്കേതികവും മാനുഷികവുമായ പരിഹാരങ്ങളുടെ ഒരു ശ്രേണി നിർദ്ദേശിച്ചു. ഇൻപുട്ട് ഡാറ്റ എവിടെ നിന്ന് വരുന്നുവെന്നും അവ എങ്ങനെ ഉപയോഗിക്കാമെന്നും കൂടുതൽ ശ്രദ്ധ ചെലുത്തുക എന്നതാണ് ഏറ്റവും വ്യക്തമായ കാര്യം. അങ്ങനെ ചെയ്യുന്നത് വിവേചനരഹിതമായ ഡാറ്റാ വിളവെടുപ്പിന് കാരണമാകും.

ഈ സമീപനം കമ്പ്യൂട്ടർ ശാസ്ത്രജ്ഞർക്കിടയിലെ ഒരു പൊതു വിശ്വാസത്തെ വെല്ലുവിളിക്കുന്നു: ഓൺലൈനിൽ കാണപ്പെടുന്ന ഡാറ്റ അവർക്ക് അനുയോജ്യമെന്ന് തോന്നുന്ന ഏത് ആവശ്യത്തിനും ഉപയോഗിക്കാം.

ഡാറ്റയുടെ വിവിധ ഉപവിഭാഗങ്ങളിൽ വ്യത്യസ്ത മോഡലുകൾക്ക് പരിശീലനം നൽകുകയും നിർദ്ദിഷ്ട ഔട്ട്ലിയറുകൾ കണ്ടെത്തുന്നതിന് താരതമ്യം ചെയ്യുകയും ചെയ്യുന്ന “എൻസെംബിൾ മോഡലിംഗ്” ഉപയോഗവും മറ്റ് സാങ്കേതിക പരിഹാരങ്ങളിൽ ഉൾപ്പെടുന്നു. ഈ സമീപനം പരിശീലനത്തിന് മാത്രമല്ല, സംശയാസ്പദമായ “വിഷം” ഇമേജുകൾ കണ്ടെത്താനും ഉപേക്ഷിക്കാനും ഉപയോഗിക്കാം.

ഓഡിറ്റുകളാണ് മറ്റൊരു ഓപ്ഷൻ. പരിശീലനത്തിനായി ഒരിക്കലും ഉപയോഗിക്കാത്ത “ഹോൾഡ്-ഔട്ട്” ഡാറ്റ ഉപയോഗിച്ച് ഒരു “ടെസ്റ്റ് ബാറ്ററി” – ഒരു ചെറിയ, ഉയർന്ന ക്യൂറേറ്റഡ്, നന്നായി ലേബൽ ചെയ്ത ഡാറ്റാസെറ്റ് – വികസിപ്പിക്കുന്നത് ഒരു ഓഡിറ്റ് സമീപനത്തിൽ ഉൾപ്പെടുന്നു. മോഡലിന്റെ കൃത്യത പരിശോധിക്കാൻ ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കാം.

സാങ്കേതികവിദ്യയ്ക്കെതിരായ തന്ത്രങ്ങൾ

ഡാറ്റാ വിഷബാധ ഉൾപ്പെടെ “വിപരീത സമീപനങ്ങൾ” (ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസ്റ്റങ്ങളെ തരംതാഴ്ത്തുകയോ നിഷേധിക്കുകയോ വഞ്ചിക്കുകയോ കൈകാര്യം ചെയ്യുകയോ ചെയ്യുന്നവ) പുതിയതല്ല. ഫേഷ്യൽ റെക്കഗ്നിഷൻ സിസ്റ്റങ്ങളെ മറികടക്കാൻ മേക്കപ്പും വസ്ത്രങ്ങളും ഉപയോഗിക്കുന്നതും അവർ ചരിത്രപരമായി ഉൾപ്പെടുത്തിയിട്ടുണ്ട്.

ഉദാഹരണത്തിന്, വിശാലമായ സമൂഹത്തിൽ യന്ത്ര ദർശനത്തിന്റെ വിവേചനരഹിതമായ ഉപയോഗത്തെക്കുറിച്ച് മനുഷ്യാവകാശ പ്രവർത്തകർ കുറച്ച് കാലമായി ആശങ്കാകുലരാണ്. മുഖം തിരിച്ചറിയുന്നതുമായി ബന്ധപ്പെട്ട് ഈ ആശങ്ക പ്രത്യേകിച്ചും രൂക്ഷമാണ്.

ഇന്റർനെറ്റിൽ നിന്ന് സ്ക്രാപ്പ് ചെയ്ത മുഖങ്ങളുടെ ഒരു വലിയ തിരയൽ ഡാറ്റാബേസ് ഹോസ്റ്റുചെയ്യുന്ന ക്ലിയർവ്യൂ എഐ പോലുള്ള സംവിധാനങ്ങൾ ലോകമെമ്പാടുമുള്ള നിയമപാലകരും സർക്കാർ ഏജൻസികളും ഉപയോഗിക്കുന്നു. ക്ലിയർവ്യൂ എഐ ഓസ്ട്രേലിയക്കാരുടെ സ്വകാര്യത ലംഘിക്കുന്നുവെന്ന് 2021 ൽ ഓസ്ട്രേലിയൻ സർക്കാർ കണ്ടെത്തി.

നിയമാനുസൃതമായ പ്രതിഷേധക്കാർ ഉൾപ്പെടെയുള്ള നിർദ്ദിഷ്ട വ്യക്തികളെ പ്രൊഫൈൽ ചെയ്യാൻ ഫേഷ്യൽ റെക്കഗ്നിഷൻ സംവിധാനങ്ങൾ ഉപയോഗിക്കുന്നതിന് മറുപടിയായി, കലാകാരന്മാർ വിണ്ടുകീറിയ വരകളുടെയും അസമത്വ വളവുകളുടെയും വിപരീത മേക്കപ്പ് പാറ്റേണുകൾ ആവിഷ്കരിച്ചു, ഇത് നിരീക്ഷണ സംവിധാനങ്ങൾ അവരെ കൃത്യമായി തിരിച്ചറിയുന്നതിൽ നിന്ന് തടയുന്നു.

ഈ കേസുകളും ഡാറ്റാ വിഷബാധയുടെ പ്രശ്നവും തമ്മിൽ വ്യക്തമായ ബന്ധമുണ്ട്, കാരണം രണ്ടും സാങ്കേതിക ഭരണത്തെ ചുറ്റിപ്പറ്റിയുള്ള വലിയ ചോദ്യങ്ങളുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു.

പല ടെക്നോളജി വെണ്ടർമാരും ഡാറ്റാ വിഷം സാങ്കേതിക പരിഹാരങ്ങൾ ഉപയോഗിച്ച് പരിഹരിക്കേണ്ട ഒരു പ്രശ്നമായി കണക്കാക്കും. എന്നിരുന്നാലും, കലാകാരന്മാരുടെയും ഉപയോക്താക്കളുടെയും അടിസ്ഥാന ധാർമ്മിക അവകാശങ്ങളിൽ കടന്നുകയറുന്നതിനുള്ള നൂതന പരിഹാരമായി ഡാറ്റാ വിഷബാധയെ കാണുന്നത് നല്ലതാണ്.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

You May Also Like

എലോൺ മസ്കിന്റെ എക്സ്എഐ 1 ബില്യൺ ഡോളർ ധനസഹായം സമാഹരിക്കാൻ ആഗ്രഹിക്കുന്നു - ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് കമ്പനി ഇതിനകം 135 മില്യൺ ഡോളർ നേടിയതായി സെക്യൂരിറ്റീസ് ഫയലിംഗുകൾ കാണിക്കുന്നു

എലോൺ മസ്കിന്റെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സ്റ്റാർട്ടപ്പായ എക്സ്എഐ വെഞ്ച്വർ ക്യാപിറ്റൽ നിക്ഷേപകരിൽ നിന്ന് ഒരു ബില്യൺ ഡോളർ വരെ സമാഹരിക്കാൻ പദ്ധതിയിടുന്നതായി റെഗുലേറ്ററി ഫയലിംഗിൽ പറയുന്നു. സെക്യൂരിറ്റീസ്...

വിപുലീകരിച്ച ചരിത്രപരമായ മാർക്കറ്റ് ലെവൽ ഡാറ്റ ഉപയോഗിച്ച് ഗ്രീൻ സ്ട്രീറ്റ് 2024 യുഎസ് മേഖല കാഴ്ചപ്പാടുകൾ പുറത്തിറക്കുന്നു

പ്രവർത്തനക്ഷമമായ വാണിജ്യ റിയൽ എസ്റ്റേറ്റ് ഇന്റലിജൻസ്, അനലിറ്റിക്സ് എന്നിവയുടെ മുൻനിര ദാതാവായ ഗ്രീൻ സ്ട്രീറ്റ് അതിന്റെ 2024 സെക്ടർ ഔട്ട്ലുക്സ് പുറത്തിറക്കി, വാണിജ്യ റിയൽ എസ്റ്റേറ്റിന്റെ പ്രവർത്തന...

artificial-intelligence

Articul8: ഇന്റലിന്റെ എന്റർപ്രൈസ് ഫോക്കസ്ഡ് GenAI കമ്പനിയെക്കുറിച്ചുള്ള എല്ലാം ഇതാ

യുഎസ് ആസ്ഥാനമായുള്ള ചിപ്പ് നിർമാതാക്കളായ ഇന്റൽ, ആഗോള നിക്ഷേപ സ്ഥാപനമായ ഡിജിറ്റൽ ബ്രിഡ്ജുമായി സഹകരിച്ച് ഒരു സ്വതന്ത്ര എന്റർപ്രൈസ് കേന്ദ്രീകൃത ജനറേറ്റീവ് എഐ സോഫ്റ്റ്വെയർ കമ്പനിക്ക് രൂപം...

ബിസിനസ്സിലെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് : മികച്ച നേട്ടങ്ങൾ

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അല്ലെങ്കിൽ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് പ്രത്യക്ഷപ്പെടുന്നത് ബിസിനസുകളുടെ ആവാസവ്യവസ്ഥയെ മാറ്റുകയും ഡിജിറ്റൽ പരിവർത്തനത്തിനായുള്ള മത്സര മത്സരത്തിന് ആക്കം കൂട്ടുകയും ചെയ്തു. വലുപ്പമോ വ്യവസായമോ കണക്കിലെടുക്കാതെ ബിസിനസുകൾക്ക്...