ഇമേജ് ജനറേഷൻ സാങ്കേതികവിദ്യ സമീപ വർഷങ്ങളിൽ അതിവേഗം പുരോഗമിച്ചിട്ടുണ്ട്, എന്നിരുന്നാലും അനുയോജ്യമായ വീഡിയോ റെൻഡറിംഗ് കൈവരിക്കുന്നത് സമകാലിക ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകൾക്ക് ഒരു വെല്ലുവിളിയായി തുടരുന്നു. എന്നിരുന്നാലും, ഗൂഗിൾ അടുത്തിടെ ഈ മേഖലയിൽ ശ്രദ്ധേയമായ പുരോഗതി പ്രകടമാക്കി, വീഡിയോ ജനറേഷൻ മേഖലയിൽ ഗണ്യമായി മെച്ചപ്പെട്ട സാങ്കേതികവിദ്യ പ്രദർശിപ്പിച്ചു.

വീഡിയോ സൃഷ്ടിക്കുന്നതിനുള്ള കമ്പനിയുടെ ഏറ്റവും പുതിയ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലായ ലൂമിയർ ഗൂഗിൾ പുറത്തിറക്കി. “യാഥാർത്ഥ്യബോധമുള്ളതും വൈവിധ്യമാർന്നതും യുക്തിസഹവുമായ ചലനം” സൃഷ്ടിക്കുന്നത് എല്ലായ്പ്പോഴും ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അധിഷ്ഠിത വീഡിയോ ജനറേഷന്റെ പ്രധാന വെല്ലുവിളികളിലൊന്നായതിനാൽ വീഡിയോ സമന്വയത്തിൽ ലൂമിയർ ഒരു പ്രധാന മെച്ചപ്പെടുത്തലാണെന്ന് ഗൂഗിൾ പറയുന്നു. ലൂമിയർ ഒരു സ്പേസ്-ടൈം ഡിഫ്യൂഷൻ മോഡൽ നൽകുന്നു, അത് ആ പ്രശ്നം പരിഹരിക്കാനോ പരിഹരിക്കാനോ കഴിയും.

ടെക്സ്റ്റ്-ടു-വീഡിയോ ജനറേഷൻ, ഇമേജ്-ടു-വീഡിയോ റെൻഡറിംഗ്, സ്റ്റൈലൈസ്ഡ് ജനറേഷൻ എന്നിവയ്ക്ക് ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ബിസിനസിലേക്കുള്ള മൗണ്ടൻ വ്യൂവിന്റെ ഏറ്റവും പുതിയ പ്രവേശനം പര്യാപ്തമാണ്. ഉപയോക്താക്കൾക്ക് ഒരു വാചക പ്രോംപ്റ്റ് എഴുതുന്നതിലൂടെയും ഒരു ഉറവിട ചിത്രം നൽകുന്നതിലൂടെയും (ആ ചിത്രം എത്ര ആധികാരികമോ യാഥാർത്ഥ്യബോധമുള്ളതോ എഡിറ്റുചെയ്തതോ ആകട്ടെ), അല്ലെങ്കിൽ ഒരു റഫറൻസ് ഇമേജ് ടാർഗെറ്റ് ശൈലിയായി ഉപയോഗിക്കുന്നതിലൂടെയും പൂർണ്ണമായും പുതിയ വീഡിയോ ക്ലിപ്പ് സൃഷ്ടിക്കാൻ കഴിയും.

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലിലെ ഒരൊറ്റ പാസിലൂടെ മുഴുവൻ വീഡിയോ ക്ലിപ്പും ഒരേസമയം സൃഷ്ടിക്കുന്ന “സ്പേസ്-ടൈം യു-നെറ്റ് ആർക്കിടെക്ചർ” ലൂമിയർ ഉപയോഗിക്കുന്നു. ഒരേ വീഡിയോയ്ക്കായി വ്യത്യസ്ത കീഫ്രെയിമുകൾ സമന്വയിപ്പിക്കുന്ന നിലവിലുള്ള മോഡലുകളുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ, ലൂമിയറിന്റെ സമീപനത്തിന് അത്യാധുനിക ടെക്സ്റ്റ്-ടു-വീഡിയോ ഫലങ്ങൾ നേടാൻ കഴിയും.

സോഴ്സ് വീഡിയോയെ വ്യത്യസ്ത മെറ്റീരിയലുകളാക്കി മാറ്റുന്ന വീഡിയോ സ്റ്റൈലൈസേഷൻ, സോഴ്സ് ഇമേജിൽ പരിമിതവും ഹൈലൈറ്റ് ചെയ്തതുമായ ഭാഗം ആനിമേറ്റ് ചെയ്യുന്നതിനുള്ള വഴി നൽകുന്ന സിനിമാഗ്രാഫുകൾ എന്നിവ ലൂമിയറിന്റെ അധിക കഴിവുകളിൽ ഉൾപ്പെടുന്നു. ഒരു പെൺകുട്ടിയുടെ വസ്ത്രത്തിന്റെ നിറങ്ങൾ, മെറ്റീരിയലുകൾ അല്ലെങ്കിൽ ടെക്സ്ചറുകൾ മാറ്റുന്നത് പോലുള്ള സോഴ്സ് വീഡിയോയുടെ ഒരൊറ്റ ഭാഗങ്ങൾ മാറ്റാൻ വീഡിയോ ഇൻപൈന്റിംഗ് ഫീച്ചറിന് കഴിയും.

ഔദ്യോഗിക പേപ്പറിൽ ഗൂഗിൾ എടുത്തുകാണിക്കുന്നതുപോലെ, 5 സെക്കൻഡിൽ കൂടുതൽ നീണ്ടുനിൽക്കുന്ന 1024×1024 വീഡിയോകൾ “ലോ-റെസല്യൂഷൻ” സൃഷ്ടിക്കാൻ ലൂമിയറിന് കഴിയും. മുമ്പത്തെ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് വീഡിയോ മോഡലുകൾക്ക് ദൈർഘ്യമേറിയ വീഡിയോകൾ സൃഷ്ടിക്കാൻ കഴിവുണ്ടായിരുന്നു, പക്ഷേ ഉപയോക്താക്കൾ നിലവിലുള്ള ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകളേക്കാൾ ലൂമിയറിന്റെ ഔട്ട്പുട്ട് ഇഷ്ടപ്പെടുന്നുവെന്ന് ഗൂഗിൾ അവകാശപ്പെടുന്നു. 30 ദശലക്ഷം വീഡിയോകളും അവയുടെ ടെക്സ്റ്റ് വിവരണങ്ങളും അടങ്ങിയ ഒരു ഡാറ്റാസെറ്റിൽ ലൂമിയർ പരിശീലനം നേടിയതായി മൗണ്ടൻ വ്യൂ പറയുന്നു, എന്നിരുന്നാലും ഉറവിടമായ 5 സെക്കൻഡ് വീഡിയോകളുടെ ഉത്ഭവം (അല്ലെങ്കിൽ പകർപ്പവകാശ നില) നിലവിൽ അജ്ഞാതമാണ്.

ഗൂഗിൾ ഗവേഷകരുടെ പ്രബന്ധം ലൂമിയർ പോലുള്ള വീഡിയോ ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സാങ്കേതികവിദ്യയുടെ “സാമൂഹിക സ്വാധീനം” എടുത്തുകാണിക്കുന്നു, പുതിയ സർഗ്ഗാത്മകവും വഴക്കമുള്ളതുമായ വഴികളിൽ വിഷ്വൽ ഉള്ളടക്കം സൃഷ്ടിക്കാൻ “പുതിയ ഉപയോക്താക്കളെ” പ്രാപ്തരാക്കുക എന്നതാണ് മോഡലിന്റെ പ്രാഥമിക ലക്ഷ്യം. എന്നിരുന്നാലും, വീഡിയോ ജനറേറ്റീവ് മോഡലുകളുടെ പക്ഷപാതവും “ദോഷകരമായ” ഉപയോഗ കേസുകളും കണ്ടെത്തുന്നതിനുള്ള പുതിയ ഉപകരണങ്ങൾ വികസിപ്പിക്കണം.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

You May Also Like

"ഇന്ത്യയുടെ സ്വന്തം ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്" - ക്രുട്രിം: ആദ്യം മുതൽ നിർമ്മിച്ചതും വിശാലമായ ഇന്ത്യൻ ഡാറ്റയിൽ പരിശീലനം ലഭിച്ചതുമായ ഒരു ഇന്ത്യൻ നിർമ്മിത മോഡൽ

"പരിശീലന അടിസ്ഥാന (എഐ) മോഡലുകളിൽ ഞങ്ങളുമായി മത്സരിക്കുന്നത് തികച്ചും നിരാശാജനകമാണ്... എന്തായാലും ശ്രമിക്കുക എന്നതാണ് നിങ്ങളുടെ ജോലി," ചാറ്റ്ജിപിടി നിർമ്മാതാക്കളായ ഓപ്പൺഎഐയുടെ ചീഫ് എക്സിക്യൂട്ടീവ് ഓഫീസർ സാം...

ഐഒഎസ് 18 ൽ ജനറേറ്റീവ് എഐ ഉപയോഗിച്ച് ആപ്പിളിന്റെ സിരി മേക്കോവർ ലഭിക്കുമോ? റിപ്പോർട്ട് സൂചിപ്പിക്കുന്നത് ഇതാ

ഈ വർഷത്തെ വേൾഡ് വൈഡ് ഡെവലപ്പർ കോൺഫറൻസിൽ (ഡബ്ല്യുഡബ്ല്യുഡിസി) ഐഫോണിനായി ഐഒഎസ് 18 പുറത്തിറക്കുന്നതിനൊപ്പം ആപ്പിൾ ഒരു പുതിയ അപ്ഡേറ്റ് അവതരിപ്പിക്കുമെന്ന് അഭ്യൂഹമുണ്ട്. ഫിനാൻഷ്യൽ ടൈംസിന്റെ സമീപകാല...

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന് ശാസ്ത്രത്തെ തന്നെ മാറ്റാൻ കഴിയുമോ?

"മനുഷ്യബുദ്ധി വർദ്ധിപ്പിക്കുന്നതിലൂടെ, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഒരു പുതിയ നവോത്ഥാനത്തിന് കാരണമായേക്കാം, ഒരുപക്ഷേ ജ്ഞാനോദയത്തിന്റെ ഒരു പുതിയ ഘട്ടം," ആധുനിക ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ (എഐ) ഗോഡ്ഫാദർമാരിൽ ഒരാളായ യാൻ...

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സിസിഐ ലെൻസിന് കീഴിൽ: ചെയർപേഴ്സൺ രവ്നീത് കൗർ

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്  സംബന്ധിച്ച വിപണി പഠനങ്ങൾ നടത്താൻ പദ്ധതിയിടുന്നതായി കോമ്പറ്റീഷൻ കമ്മീഷൻ ഓഫ് ഇന്ത്യ (സിസിഐ) ചൊവ്വാഴ്ച അറിയിച്ചു. "ഞങ്ങൾക്ക് അതിൽ (എഐയുടെ സ്വാധീനം) വളരെ താൽപ്പര്യമുണ്ട്....