ടെക്സ്റ്റ്, ഇമേജുകൾ, ഇപ്പോൾ വീഡിയോകൾ – ഓപ്പൺ എഐയുടെ ഏറ്റവും പുതിയ ഓഫറായ സോറ തീർച്ചയായും ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സാങ്കേതികവിദ്യയിലെ ഒരു മുന്നേറ്റമാണ്, പ്രത്യേകിച്ചും ടെക്സ്റ്റ് ഇൻപുട്ടുകളിൽ നിന്ന് വീഡിയോകൾ സൃഷ്ടിക്കുന്നതിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. ചാറ്റ്ജിപിടി, ഡാൽ-ഇ തുടങ്ങിയ ഉപകരണങ്ങളുടെ വികസനത്തെത്തുടർന്ന് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മേഖലയിലെ ഒരു സുപ്രധാന ചുവടുവയ്പ്പാണ് ഇത് അടയാളപ്പെടുത്തുന്നത്.
ഗൂഗിൾ, മെറ്റ, സ്റ്റാർട്ടപ്പ് റൺവേ എം എൽ എന്നിവ സമാനമായ സാങ്കേതികവിദ്യകൾ ഉപയോഗിച്ചിട്ടുണ്ടെങ്കിലും ഓപ്പൺ എഐയുടെ സോറ അതിന്റെ അതിശയകരമായ വീഡിയോ ഗുണനിലവാരവുമായി തലതിരിച്ചു വിടുകയാണ്.
ഇതാ സോറ, ഞങ്ങളുടെ വീഡിയോ ജനറേഷൻ മോഡൽ: https://t.co/CDr4DdCrh1 ഇന്ന് ഞങ്ങൾ റെഡ്-ടീമിംഗ് ആരംഭിക്കുകയും പരിമിതമായ എണ്ണം creators.@_tim_brooks @billpeeb @model_mechanic ആക്സസ് വാഗ്ദാനം ചെയ്യുകയും ചെയ്യുന്നത് ശരിക്കും അവിശ്വസനീയമാണ്; അവരുടെയും ടീമിന്റെയും അതിശയകരമായ പ്രവർത്തനം.ശ്രദ്ധേയമായ നിമിഷം.— സാം ആൾട്ട്മാൻ (@sama) ഫെബ്രുവരി 15, 2024
സിഇഒ സാം ആൾട്ട്മാൻ സോഷ്യൽ മീഡിയ ഉപയോക്താക്കളെ രേഖാമൂലമുള്ള പ്രോംപ്റ്റുകൾ വലിച്ചെറിയാൻ ക്ഷണിച്ചതോടെ സോറയെ ചുറ്റിപ്പറ്റിയുള്ള ചർച്ചകൾ ചൂടുപിടിച്ചു. ഒരു മുത്തശ്ശി ഇൻഫ്ലുവൻസർ വീട്ടിൽ നിർമ്മിച്ച ഗ്നോച്ചിക്കായി ഒരു ഗ്രാമീണ പാചക സെഷൻ ആതിഥേയത്വം വഹിക്കുന്നത് മുതൽ വിവിധ മൃഗങ്ങളെ അത്ലറ്റുകളായി സമുദ്രത്തിൽ ഒരു സൈക്കിൾ ഓട്ടം വരെ പ്രതികരണങ്ങൾ ശ്രദ്ധേയമായിരുന്നു.
എന്നിരുന്നാലും, നിമിഷങ്ങൾക്കുള്ളിൽ, സോറ ഈ വാക്കുകളെ അതിശയകരമായ റിയലിസ്റ്റിക് വീഡിയോകളാക്കി മാറ്റി, അത് കാഴ്ചക്കാരെ അതിശയിപ്പിച്ചു.
സോറയെക്കുറിച്ചുള്ള ചില പ്രധാന പോയിന്റുകളുടെ ഒരു ബ്രേക്ക്ഡൗൺ ഇതാ:
പ്രവർത്തനക്ഷമത: ടെക്സ്റ്റ്-ടു-വീഡിയോ ഡിഫ്യൂഷൻ മോഡലാണ് സോറ, വാചക വിവരണങ്ങളെ അടിസ്ഥാനമാക്കി വീഡിയോകൾ സൃഷ്ടിക്കാൻ കഴിയും. ഉപയോക്താക്കൾക്ക് ടെക്സ്റ്റ് പ്രോംപ്റ്റുകൾ ഇൻപുട്ട് ചെയ്യാൻ കഴിയും, സോറ അനുബന്ധ വീഡിയോ ഉള്ളടക്കം സൃഷ്ടിക്കും.
കഴിവുകൾ: ഒരു മിനിറ്റ് വരെ ദൈർഘ്യമുള്ള റിയലിസ്റ്റിക്, സങ്കീർണ്ണമായ വീഡിയോകൾ നിർമ്മിക്കാൻ സോറയ്ക്ക് കഴിയും. ഒന്നിലധികം കഥാപാത്രങ്ങളുള്ള വിശദമായ രംഗങ്ങൾ സൃഷ്ടിക്കാൻ ഇതിന് കഴിയും, സർഗ്ഗാത്മക ആവിഷ്കാരത്തിന് വിശാലമായ സാധ്യതകൾ നൽകുന്നു.
സുരക്ഷാ നടപടികൾ: സോറയുടെ ഉത്തരവാദിത്തമുള്ള ഉപയോഗം ഉറപ്പാക്കാൻ ഓപ്പൺഎഐ മുൻകരുതലുകൾ എടുക്കുന്നു. മോഡലുമായി ബന്ധപ്പെട്ട അപകടസാധ്യതകളും ദോഷങ്ങളും തിരിച്ചറിയുന്നതിന് റെഡ്-ടീമിംഗ് വ്യായാമങ്ങളിൽ ഏർപ്പെടുന്നത് ഇതിൽ ഉൾപ്പെടുന്നു. കൂടാതെ, സോറ സൃഷ്ടിച്ച വീഡിയോകൾ ലേബൽ ചെയ്യുന്നതിനുള്ള ടൂളുകൾ ഓപ്പൺഎഐ വികസിപ്പിക്കുകയും അനുചിതമോ ദോഷകരമോ ആയ ടെക്സ്റ്റ് പ്രോംപ്റ്റുകൾ നിരസിക്കുന്നതിന് ഡാൽ-ഇ ഉപയോഗിച്ചതിന് സമാനമായ സുരക്ഷാ രീതികൾ പ്രയോഗിക്കുകയും ചെയ്യുന്നു.
പങ്കാളികളുമായുള്ള ഇടപെടൽ: നയരൂപകർത്താക്കൾ, അധ്യാപകർ, കലാകാരന്മാർ എന്നിവരുമായി അവരുടെ ആശങ്കകൾ മനസിലാക്കുന്നതിനും സോറയ്ക്കുള്ള പോസിറ്റീവ് ഉപയോഗ കേസുകൾ തിരിച്ചറിയുന്നതിനും ഓപ്പൺഎഐ സജീവമായി ഇടപെടുന്നു. ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സാങ്കേതികവിദ്യകളുടെ ധാർമ്മികവും ഉത്തരവാദിത്തപരവുമായ വിന്യാസത്തെക്കുറിച്ച് സംഭാഷണവും സഹകരണവും പ്രോത്സാഹിപ്പിക്കുന്നതിനുള്ള പ്രതിബദ്ധതയാണ് ഇത് പ്രതിഫലിപ്പിക്കുന്നതെന്ന് ഓപ്പൺഎഐ പറഞ്ഞു.
മറ്റ് മോഡലുകളുമായി താരതമ്യം: മറ്റ് വീഡിയോ ജനറേറ്റിംഗ് മോഡലുകൾ നിലവിലുണ്ടെങ്കിലും, റിയലിസ്റ്റിക്, സങ്കീർണ്ണമായ വീഡിയോകൾ നിർമ്മിക്കാനുള്ള കഴിവിൽ സോറ വേറിട്ടുനിൽക്കുന്നു. ഹ്രസ്വ വീഡിയോ ക്ലിപ്പുകൾ സൃഷ്ടിക്കുന്നതിനുള്ള ഒരു ഉപകരണം മെറ്റയ്ക്ക് ഉണ്ട്, ഗൂഗിൾ അതിന്റെ ടെക്സ്റ്റ്-ടു-വീഡിയോ മോഡലിൽ പ്രവർത്തിക്കുന്നു, പക്ഷേ സോറയ്ക്ക് കൂടുതൽ വിപുലമായ വീഡിയോ ജനറേഷൻ കഴിവുണ്ട്.
എന്നിരുന്നാലും, ശ്രദ്ധേയമായ കഴിവുകൾ ഉണ്ടായിരുന്നിട്ടും, സോറ ഇതുവരെ പൊതുജനങ്ങൾക്ക് ലഭ്യമല്ല, ഓപ്പൺഎഐ അതിന്റെ വികസന പ്രക്രിയയെക്കുറിച്ച് പരിമിതമായ വിവരങ്ങൾ വെളിപ്പെടുത്തിയിട്ടുണ്ട്. സോറയെ പരിശീലിപ്പിക്കാൻ ഉപയോഗിച്ച ഇമേജറിയുടെയും വീഡിയോയുടെയും ഉറവിടങ്ങളെക്കുറിച്ച് ആശങ്കകൾ ഉയർന്നിട്ടുണ്ട്, പ്രത്യേകിച്ചും പകർപ്പവകാശമുള്ള കൃതികളുടെ ഉപയോഗവുമായി ബന്ധപ്പെട്ട ഓപ്പൺഎഐയുടെ മുൻകാല നിയമ പ്രശ്നങ്ങൾ കണക്കിലെടുക്കുമ്പോൾ.
