ഗിറ്റ്ഹബിലെ 6 ട്രെൻഡിംഗ് കമ്പ്യൂട്ടർ വിഷൻ മോഡലുകൾ

You are currently viewing ഗിറ്റ്ഹബിലെ 6 ട്രെൻഡിംഗ് കമ്പ്യൂട്ടർ വിഷൻ മോഡലുകൾ

മനുഷ്യർക്ക് കാര്യങ്ങൾ വളരെ വേഗത്തിൽ കണ്ടെത്താൻ കഴിയും – അവർക്ക് വേണ്ടത് ഒരു നോട്ടം മാത്രമാണ്. ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ, ക്ലാസിഫിക്കേഷൻ, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിലെ ഇമേജ് റെക്കഗ്നിഷൻ എന്നിവയിലൂടെ കമ്പ്യൂട്ടർ ശാസ്ത്രജ്ഞർ കമ്പ്യൂട്ടറുകളെ ഇത് ചെയ്യാൻ പഠിപ്പിക്കുന്നു. ചിത്രങ്ങളോ വീഡിയോകളോ കാണാനും അവയിൽ എന്താണുള്ളതെന്ന് കണ്ടെത്താനും വിശദാംശങ്ങളിൽ ലേബലുകൾ ഇടാനും അവർക്ക് യന്ത്രങ്ങൾ ലഭിക്കുന്നു.

യഥാർത്ഥ ലോക ഉപയോഗ കേസുകൾ വർദ്ധിക്കുന്നതിനാൽ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിൽ ഇമേജ് തിരിച്ചറിയലിന്റെ പുതിയ മാതൃകകൾ പര്യവേക്ഷണം ചെയ്യപ്പെടുന്നു. അതിനാൽ മികച്ച കമ്പ്യൂട്ടർ വിഷൻ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് നിർമ്മിക്കാൻ സഹായിക്കുന്ന ആറ് ടൂളുകൾ ഇതാ.

യോലോ

വാണിജ്യ ഉൽപ്പന്നങ്ങളിലെ പ്രധാന ടെക് കളിക്കാർ സ്വീകരിക്കുന്ന കമ്പ്യൂട്ടർ കാഴ്ചയിൽ വ്യാപകമായി സ്വീകരിക്കുന്ന തത്സമയ ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ അൽഗോരിതമാണ് ‘യു ഓൺലി ലുക്ക് വൺസ്’ എന്നതിന്റെ ചുരുക്കപ്പേരായ യോളോ. 2016 ൽ അവതരിപ്പിച്ച യഥാർത്ഥ മോഡൽ വേഗതയിൽ എതിരാളികളെ മറികടന്ന് ഒബ്ജക്റ്റ് കണ്ടെത്തലിൽ വിപ്ലവം സൃഷ്ടിച്ചു.

അതിനുശേഷം, YOLOv4 ഉൾപ്പെടെ വിവിധ ആവർത്തനങ്ങൾ ഉയർന്നുവന്നു, ഓരോന്നും പ്രകടനവും കാര്യക്ഷമതയും വർദ്ധിപ്പിക്കുന്നു. ചിയെൻ-യാവോ വാങ്, അലക്സി ബോച്ച്കോവ്സ്കി, ഹോങ്-യുവാൻ മാർക്ക് ലിയാവോ എന്നിവർ 2022 ജൂലൈയിൽ അനാച്ഛാദനം ചെയ്ത യോലോവ് 7 വേഗതയേറിയതും കൃത്യവുമായ തത്സമയ ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ മോഡലുകളിൽ ഒന്നാണ്.

അൾട്രാലൈറ്റിക്സ് രൂപകൽപ്പന ചെയ്ത യോലോവ് 8 വേഗത, കൃത്യത, ഉപയോക്തൃ സൗഹൃദം എന്നിവയ്ക്ക് മുൻഗണന നൽകുന്നു, ഇത് ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ, ട്രാക്കിംഗ്, ഇൻസ്റ്റൻസ് സെഗ്മെന്റേഷൻ, ഇമേജ് ക്ലാസിഫിക്കേഷൻ, പോസ് എസ്റ്റിമേറ്റ് തുടങ്ങിയ ജോലികൾക്ക് മികച്ച തിരഞ്ഞെടുപ്പായി മാറുന്നു.

മൊസൈക് ഡാറ്റ മെച്ചപ്പെടുത്തൽ, സ്വയം-വിപരീത പരിശീലനം, ക്രോസ്-മിനി-ബാച്ച് നോർമലൈസേഷൻ തുടങ്ങിയ പുതുമകൾ ഉപയോഗിച്ച്, ഈ യോലോ ആവർത്തനങ്ങൾ കമ്പ്യൂട്ടർ വിഷൻ സിസ്റ്റങ്ങളുടെ കഴിവുകൾ മുന്നോട്ട് കൊണ്ടുപോകുന്നത് തുടരുന്നു.

ImageAI

ലളിതവും കുറച്ച് കോഡുകളും ഉപയോഗിച്ച് സ്വയം നിയന്ത്രിത കഴിവുകളുള്ള ആപ്ലിക്കേഷനുകളും സിസ്റ്റങ്ങളും നിർമ്മിക്കാൻ ഡവലപ്പർമാരെ ശാക്തീകരിക്കുന്നതിനായി നിർമ്മിച്ച ഒരു ഓപ്പൺ സോഴ്സ് പൈത്തൺ ലൈബ്രറിയാണ് ഇമേജ്എഐ.

മോസസ് ഒലാഫെൻവ സൃഷ്ടിച്ച ഈ ലൈബ്രറി അത്യാധുനിക കമ്പ്യൂട്ടർ വിഷൻ സവിശേഷതകൾ എളുപ്പത്തിൽ സമന്വയിപ്പിക്കുന്നതിനും ഇഷ് ടാനുസൃത വസ്തുക്കൾ കണ്ടെത്തുന്നതിനും തിരിച്ചറിയുന്നതിനും ഇഷ് ടാനുസൃത ഇമേജ് / വീഡിയോ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകൾ പരിശീലിപ്പിക്കുന്നതിനും വിന്യസിക്കുന്നതിനും എല്ലാ തലങ്ങളിലുമുള്ള വൈദഗ്ധ്യമുള്ള പ്രോഗ്രാമർമാരെ ശാക്തീകരിക്കുന്നു.

ലൈബ്രറി 400,000 തവണ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ട്, കൂടാതെ 7,000+ ആരംഭങ്ങളുണ്ട്. 2018 മുതൽ, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അനുമാനത്തിനും ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഡാറ്റാ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നതിനുമായി ഒലാഫെൻവ കൂടുതൽ ഓപ്പൺ സോഴ്സ് പ്രോജക്ടുകൾ പുറത്തിറക്കി.

IdenProf, FireNET, ActionNET, DeepStack_ExDark, TrafficNET എന്നിവയാണ് ചില പ്രോജക്ടുകൾ.

PaddleClas

പാഡിൽ പാഡിൽ വികസിപ്പിച്ചെടുത്ത പാഡിൽക്ലാസ്, ഇമേജ് റെക്കഗ്നിഷനിൽ വ്യവസായത്തിനും അക്കാദമിക് മേഖലയ്ക്കും ഒരുപോലെ സഹായിക്കുന്ന ശക്തമായ ഇമേജ് ക്ലാസിഫിക്കേഷൻ, റെക്കഗ്നിഷൻ ടൂൾസെറ്റാണ്.

ടോപ്പ്-ടയർ കമ്പ്യൂട്ടർ വിഷൻ മോഡലുകൾ പരിശീലിപ്പിക്കുന്നതിനായി രൂപകൽപ്പന ചെയ്ത ഇത് ഇമേജ്നെറ്റ് 1 കെ, പിയുഎൽസി ഡാറ്റാസെറ്റുകൾ എന്നിവയിൽ നിന്നുള്ള വൈവിധ്യമാർന്ന ഇമേജ് ക്ലാസിഫിക്കേഷൻ മോഡലുകളെ പിന്തുണയ്ക്കുന്നു, പ്രവചനങ്ങൾക്കായി പൈത്തൺ വീൽ പാക്കേജുകൾ വാഗ്ദാനം ചെയ്യുന്നു. ട്യൂട്ടോറിയലുകളും ആപ്ലിക്കേഷൻ ഉദാഹരണങ്ങളും ഉൾപ്പെടെ നിരവധി ഡോക്യുമെന്റേഷനുകളുള്ള റെസ്നെറ്റ്, മൊബൈൽനെറ്റ്, ഷഫിൾനെറ്റ് തുടങ്ങിയ വിവിധ നെറ്റ്വർക്ക് ഘടനകളെ പാഡിൽക്ലാസ് ഉൾക്കൊള്ളുന്നു.

സിപിയു, ജിപിയു എന്നിവയ്ക്കുള്ള മൂല്യനിർണ്ണയ പരിതസ്ഥിതികളിലേക്ക് അതിന്റെ വൈവിധ്യം വ്യാപിക്കുന്നു, ഇത് ഇമേജ് വർഗ്ഗീകരണത്തിലും തിരിച്ചറിയൽ ശ്രമങ്ങളിലും ഏർപ്പെട്ടിരിക്കുന്ന ഡവലപ്പർമാർക്കും ഗവേഷകർക്കും വിലമതിക്കാനാവാത്ത വിഭവമായി മാറുന്നു.

Emgu CV

സി #, വിബി, വിസി ++, അയൺപൈത്തോൺ തുടങ്ങിയ .നെറ്റ് അനുയോജ്യമായ ഭാഷകളിൽ നിന്ന് ഓപ്പൺ സിവി ഫംഗ്ഷനുകൾ ഇൻവോക്കേഷൻ സുഗമമാക്കുന്ന ഓപ്പൺ സിവി ഇമേജ് പ്രോസസ്സിംഗ് ലൈബ്രറിക്കുള്ള ഒരു ക്രോസ്-പ്ലാറ്റ്ഫോം .നെറ്റ് റാപ്പറാണ് എംഗു സിവി. പൂർണ്ണമായും സി # ൽ രൂപകൽപ്പന ചെയ്ത ഇത് മോണോയിൽ തടസ്സമില്ലാതെ സമാഹരിക്കുന്നു, വിൻഡോസ്, ലിനക്സ്, മാക് ഒഎസ് എക്സ്, ഐഒഎസ്, ആൻഡ്രോയിഡ് എന്നിവയുടെ പിന്തുണയുള്ള പ്ലാറ്റ്ഫോമുകളിലുടനീളം പൊരുത്തപ്പെടുന്നു.

ഒരു ജനറിക് ഇമേജ് ക്ലാസ്, ഓട്ടോമാറ്റിക് ഗാർബേജ് കളക്ഷൻ, എക്സ്എംഎൽ സീരിയൽ ഇമേജുകൾ, ഇന്റലിസെൻസ് പിന്തുണ തുടങ്ങിയ സവിശേഷതകൾ അവകാശപ്പെടുന്ന എംഗു സിവി ഇമേജ് പ്രോസസ്സിംഗ് ജോലികൾ കാര്യക്ഷമമാക്കുന്നു. ഇത് ജനറിക് പിക്സൽ പ്രവർത്തനങ്ങളെ പിന്തുണയ്ക്കുകയും ചിത്രീകരണ കോഡ് സ്നിപ്പറ്റുകളുമായി എത്തുകയും ചെയ്യുന്നു. നിലവിലെ ആവർത്തനം ഒരു ന്യൂജെറ്റ് പാക്കേജായി സൗകര്യപ്രദമായി ആക്സസ് ചെയ്യാൻ കഴിയും.

SOD Embedded

ഓപ്പൺ സോഴ്സ്, വാണിജ്യ ഉൽപ്പന്നങ്ങളിൽ മെഷീൻ പെർസെപ്ഷൻ വ്യാപകമായി സ്വീകരിക്കുന്നതിന് കമ്പ്യൂട്ടർ വിഷൻ ആപ്ലിക്കേഷനുകൾക്കായി ഒരു ഏകീകൃത അടിത്തറ സ്ഥാപിക്കുന്നതിനാണ് എസ്ഒഡി സൃഷ്ടിച്ചത്.

ഈ നൂതന, എംബഡഡ്, ക്രോസ്-പ്ലാറ്റ്ഫോം കമ്പ്യൂട്ടർ വിഷൻ, മെഷീൻ ലേണിംഗ് സോഫ്റ്റ്വെയർ ലൈബ്രറി ആഴത്തിലുള്ള പഠനം, സങ്കീർണ്ണമായ മാധ്യമ വിശകലനം, തത്സമയ, മൾട്ടി-ക്ലാസ് ഒബ്ജക്റ്റ് കണ്ടെത്തൽ എന്നിവയ്ക്കായി എപിഐകൾ നൽകുന്നു.

നിയന്ത്രിത കമ്പ്യൂട്ടേഷണൽ റിസോഴ്സുകളും ഐഒടി ഉപകരണങ്ങളുമുള്ള എംബഡഡ് സിസ്റ്റങ്ങൾക്കായി പ്രത്യേകമായി രൂപകൽപ്പന ചെയ്ത എസ്ഒഡി ക്ലാസിക്, അത്യാധുനിക ഡീപ് ന്യൂറൽ നെറ്റ്വർക്കുകളുടെ വൈവിധ്യമാർന്ന നിര ഉൾക്കൊള്ളുന്നു. വിവിധ ആപ്ലിക്കേഷനുകളിലും പ്ലാറ്റ്ഫോമുകളിലും ഉടനീളം മെഷീൻ ധാരണ ത്വരിതപ്പെടുത്തുന്നതിനുള്ള വൈവിധ്യമാർന്ന പരിഹാരമാണിത്.

MILVUS Bootcamp

ചിത്രങ്ങൾ കണ്ടെത്തുക, ഓഡിയോ അല്ലെങ്കിൽ തന്മാത്രകൾ തിരയുക, വീഡിയോകൾ വിശകലനം ചെയ്യുക, സ്വാഭാവിക ഭാഷ ഉപയോഗിച്ച് ചോദ്യങ്ങളിലും ഉത്തരങ്ങളിലും പ്രവർത്തിക്കുക തുടങ്ങിയ ഘടനാരഹിതമായ ഡാറ്റയെ സഹായിക്കുന്നതിനാണ് ഈ മോഡൽ നിർമ്മിച്ചിരിക്കുന്നത്. ഇത് ഒരു സമ്പൂർണ്ണ പരിശീലന പരിപാടിയല്ല, പക്ഷേ ഡെവലപ്പർമാർക്കും ഗവേഷകർക്കും വ്യത്യസ്ത ജോലികൾക്കായി മിൽവസിനൊപ്പം ഉപയോഗിക്കാൻ ഉദാഹരണങ്ങളുണ്ട്.

ലളിതമായ പതിപ്പായ മിൽവസ് ലൈറ്റിനൊപ്പം പോകുന്ന കാര്യങ്ങൾ ശേഖരത്തിൽ ഉൾപ്പെടുന്നു. നിങ്ങൾ കൂടുതൽ ലളിതമായ മിൽവസ് അധിഷ്ഠിത പരിഹാരങ്ങളിൽ പ്രവർത്തിക്കാൻ ശ്രമിക്കുകയാണെങ്കിൽ നിങ്ങൾക്ക് ഇവിടെ സഹായകരമായ ഉദാഹരണങ്ങളും മെറ്റീരിയലുകളും കണ്ടെത്താൻ കഴിയും.

Dr Bibin

Experienced Researcher with a demonstrated history of working in the Deep Learning, Computer Vision

Leave a Reply