എൽഎൽഎമ്മിൽ വീണ്ടെടുക്കൽ-ഓഗ്മെന്റഡ് ജനറേഷനിലേക്ക് ഒരു ആഴത്തിലുള്ള ഡൈവ്

നിങ്ങൾ ഒരു അനലിസ്റ്റാണെന്ന് കരുതുക, നിങ്ങൾക്ക് ഒരു വലിയ ഭാഷാ മോഡലിലേക്ക് പ്രവേശനം ലഭിച്ചു. ഇത് നിങ്ങളുടെ വർക്ക്ഫ്ലോയിലേക്ക് കൊണ്ടുവരുന്ന പ്രതീക്ഷകളെക്കുറിച്ച് നിങ്ങൾ ആവേശത്തിലാണ്. എന്നാൽ, ഏറ്റവും പുതിയ സ്റ്റോക്ക് വിലകളെക്കുറിച്ചോ നിലവിലെ പണപ്പെരുപ്പ നിരക്കിനെക്കുറിച്ചോ നിങ്ങൾ ചോദിക്കുന്നു, അത് നിങ്ങളെ ബാധിക്കുന്നു:

“ക്ഷമിക്കണം, എനിക്ക് തത്സമയ അല്ലെങ്കിൽ പോസ്റ്റ്-കട്ട് ഓഫ് ഡാറ്റ നൽകാൻ കഴിയില്ല. എന്റെ അവസാന പരിശീലന ഡാറ്റ 2022 ജനുവരി വരെ മാത്രമേ പോകുന്നുള്ളൂ.

ലാർജ് ലാംഗ്വേജ് മോഡൽ, അവയുടെ ഭാഷാപരമായ എല്ലാ ശക്തിയും ഉണ്ടായിരുന്നിട്ടും, ‘ഇപ്പോൾ’ ഗ്രഹിക്കാനുള്ള കഴിവില്ല. വേഗതയേറിയ ലോകത്ത്, ‘ഇപ്പോൾ’ ആണ് എല്ലാം.

വലിയ പ്രീ-ട്രെയിനഡ് ലാംഗ്വേജ് മോഡലുകളും (എൽഎൽഎം) വസ്തുതാപരമായ അറിവിന്റെ കലവറകളാണെന്ന് ഗവേഷണങ്ങൾ തെളിയിച്ചിട്ടുണ്ട്.

അവർക്ക് വളരെയധികം ഡാറ്റയിൽ പരിശീലനം ലഭിച്ചിട്ടുണ്ട്, അവർ ധാരാളം വസ്തുതകളും കണക്കുകളും ആഗിരണം ചെയ്തു. നന്നായി ക്രമീകരിക്കുമ്പോൾ, വിവിധതരം എൻ എൽ പി ജോലികളിൽ ശ്രദ്ധേയമായ ഫലങ്ങൾ നേടാൻ അവർക്ക് കഴിയും.

എന്നാൽ ഇതാ ഒരു കാര്യം: സംഭരിച്ചിരിക്കുന്ന ഈ അറിവ് ആക്സസ് ചെയ്യാനും കൈകാര്യം ചെയ്യാനുമുള്ള അവരുടെ കഴിവ്, ചിലപ്പോൾ തികഞ്ഞതല്ല. പ്രത്യേകിച്ചും കൈയിലുള്ള ജോലി വിജ്ഞാനാധിഷ്ഠിതമാകുമ്പോൾ, ഈ മോഡലുകൾക്ക് കൂടുതൽ പ്രത്യേക വാസ്തുവിദ്യകളേക്കാൾ പിന്നിലാകാൻ കഴിയും. ലോകത്തിലെ എല്ലാ പുസ്തകങ്ങളുമുള്ള ഒരു ലൈബ്രറി ഉള്ളതുപോലെയാണ് ഇത്, പക്ഷേ നിങ്ങൾക്ക് ആവശ്യമുള്ളത് കണ്ടെത്താൻ കാറ്റലോഗ് ഇല്ല.

OpenAI-യുടെ ChatGPT-യ്ക്ക് ബ്രൗസിംഗ് അപ് ഗ്രേഡ് ലഭിക്കുന്നു

ചാറ്റ്ജിപിടിയുടെ ബ്രൗസിംഗ് ശേഷിയെക്കുറിച്ചുള്ള ഓപ്പൺ എഐയുടെ സമീപകാല പ്രഖ്യാപനം വീണ്ടെടുക്കൽ-ഓഗ്മെന്റഡ് ജനറേഷന്റെ (ആർഎജി) ദിശയിലേക്കുള്ള ഒരു പ്രധാന കുതിപ്പാണ്. നിലവിലെതും ആധികാരികവുമായ വിവരങ്ങൾക്കായി ചാറ്റ്ജിപിടിക്ക് ഇപ്പോൾ ഇന്റർനെറ്റിൽ തിരയാൻ കഴിയുന്നതിനാൽ, സമ്പുഷ്ടമായ പ്രതികരണങ്ങൾ നൽകുന്നതിന് ബാഹ്യ സ്രോതസ്സുകളിൽ നിന്ന് ഡാറ്റ ചലനാത്മകമായി വലിച്ചെടുക്കുന്ന ആർഎജി സമീപനത്തെ ഇത് പ്രതിഫലിപ്പിക്കുന്നു.

ഉറവിടങ്ങളിലേക്കുള്ള നേരിട്ടുള്ള ലിങ്കുകൾ ഉപയോഗിച്ച് പൂർണ്ണമായ നിലവിലെതും ആധികാരികവുമായ വിവരങ്ങൾ നിങ്ങൾക്ക് നൽകുന്നതിന് ചാറ്റ്ജിപിടിക്ക് ഇപ്പോൾ ഇന്റർനെറ്റ് ബ്രൗസ് ചെയ്യാൻ കഴിയും. ഇത് 2021 സെപ്റ്റംബറിന് മുമ്പുള്ള ഡാറ്റയിൽ മാത്രമായി പരിമിതപ്പെടുത്തിയിട്ടില്ല.

നിലവിൽ പ്ലസ്, എന്റർപ്രൈസ് ഉപയോക്താക്കൾക്ക് ലഭ്യമായ ഓപ്പൺഎഐ ഈ സവിശേഷത ഉടൻ തന്നെ എല്ലാ ഉപയോക്താക്കൾക്കും ലഭ്യമാക്കാൻ പദ്ധതിയിടുന്നു. ജിപിടി -4 ഓപ്ഷന് കീഴിൽ ‘ബ്രൗസ് വിത്ത് ബിംഗ്’ തിരഞ്ഞെടുത്ത് ഉപയോക്താക്കൾക്ക് ഇത് സജീവമാക്കാം.

പ്രോംപ്റ്റ് എഞ്ചിനീയറിംഗ് ഫലപ്രദമാണ്, പക്ഷേ അപര്യാപ്തമാണ്

പ്രോംപ്റ്റുകൾ എൽഎൽഎമ്മിന്റെ അറിവിലേക്കുള്ള കവാടമായി വർത്തിക്കുന്നു. അവർ മോഡലിനെ നയിക്കുന്നു, പ്രതികരണത്തിന് ഒരു ദിശാബോധം നൽകുന്നു. എന്നിരുന്നാലും, ഫലപ്രദമായ പ്രോംപ്റ്റ് രൂപകൽപ്പന ചെയ്യുന്നത് ഒരു എൽഎൽഎമ്മിൽ നിന്ന് നിങ്ങൾക്ക് ആവശ്യമുള്ളത് നേടുന്നതിനുള്ള പൂർണ്ണമായ പരിഹാരമല്ല. എന്നിരുന്നാലും, ഒരു പ്രോംപ്റ്റ് എഴുതുമ്പോൾ പരിഗണിക്കേണ്ട ചില നല്ല പരിശീലനങ്ങളിലൂടെ നമുക്ക് പോകാം:

വ്യക്തത: നന്നായി നിർവചിച്ച പ്രോംപ്റ്റ് അവ്യക്തത ഇല്ലാതാക്കുന്നു. ഇത് ലളിതമായിരിക്കണം, മോഡൽ ഉപയോക്താവിന്റെ ഉദ്ദേശ്യം മനസ്സിലാക്കുന്നുവെന്ന് ഉറപ്പാക്കണം. ഈ വ്യക്തത പലപ്പോഴും കൂടുതൽ യുക്തിസഹവും പ്രസക്തവുമായ പ്രതികരണങ്ങളിലേക്ക് വിവർത്തനം ചെയ്യുന്നു.

സന്ദർഭം: പ്രത്യേകിച്ചും വിപുലമായ ഇൻപുട്ടുകൾക്ക്, നിർദ്ദേശത്തിന്റെ സ്ഥാനം ഔട്ട്പുട്ടിനെ സ്വാധീനിക്കും. ഉദാഹരണത്തിന് , ഒരു നീണ്ട പ്രോംപ്റ്റിന്റെ അവസാനത്തിലേക്ക് പ്രബോധനം നീക്കുന്നത് മിക്കപ്പോഴും മെച്ചപ്പെട്ട ഫലങ്ങൾ നൽകും. പ്രബോധനത്തിലെ

കൃത്യത: “ആർ, എന്ത്, എവിടെ, എപ്പോൾ, എന്തുകൊണ്ട്, എങ്ങനെ” എന്ന ചട്ടക്കൂടിലൂടെ പലപ്പോഴും കൈമാറുന്ന ചോദ്യത്തിന്റെ ശക്തിക്ക് കൂടുതൽ കേന്ദ്രീകൃത പ്രതികരണത്തിലേക്ക് മോഡലിനെ നയിക്കാൻ കഴിയും. കൂടാതെ, ആവശ്യമുള്ള ഔട്ട്പുട്ട് ഫോർമാറ്റ് അല്ലെങ്കിൽ വലുപ്പം വ്യക്തമാക്കുന്നത് മോഡലിന്റെ ഔട്ട്പുട്ട് കൂടുതൽ മെച്ചപ്പെടുത്തും.

അനിശ്ചിതത്വം കൈകാര്യം ചെയ്യുക: ഉറപ്പില്ലാത്തപ്പോൾ എങ്ങനെ പ്രതികരിക്കണമെന്ന് മോഡലിനെ നയിക്കേണ്ടത് അത്യാവശ്യമാണ്. ഉദാഹരണത്തിന്, അനിശ്ചിതത്വം ഉണ്ടാകുമ്പോൾ “എനിക്കറിയില്ല” എന്ന് മറുപടി നൽകാൻ മോഡലിന് നിർദ്ദേശം നൽകുന്നത് കൃത്യതയില്ലാത്തതോ “തെറ്റിദ്ധാരണാജനകമോ ആയ” പ്രതികരണങ്ങൾ സൃഷ്ടിക്കുന്നതിൽ നിന്ന് തടയും.

ഘട്ടം ഘട്ടമായുള്ള ചിന്ത: സങ്കീർണ്ണമായ നിർദ്ദേശങ്ങൾക്കായി, ആസൂത്രിതമായി ചിന്തിക്കാൻ മോഡലിനെ നയിക്കുക അല്ലെങ്കിൽ ടാസ്ക് സബ് ടാസ്കുകളായി വിഭജിക്കുക എന്നിവ കൂടുതൽ സമഗ്രവും കൃത്യവുമായ ഔട്ട്പുട്ടുകളിലേക്ക് നയിക്കും.

ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകളിലെ വെല്ലുവിളികൾ

പ്രോംപ്റ്റ് എഞ്ചിനീയറിംഗിൽ നിങ്ങളുടെ മോഡലിന്റെ പ്രകടനം വർദ്ധിപ്പിക്കുന്നതിന് നൽകിയ നിർദ്ദേശങ്ങൾ മികച്ചതാക്കുന്നത് ഉൾപ്പെടുന്നു. നിങ്ങളുടെ ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ആപ്ലിക്കേഷൻ കൃത്യത വർദ്ധിപ്പിക്കുന്നതിനുള്ള വളരെ ചെലവ് കുറഞ്ഞ മാർഗമാണിത്, ചെറിയ കോഡ് ക്രമീകരണങ്ങൾ മാത്രം ആവശ്യമാണ്. പ്രോംപ്റ്റ് എഞ്ചിനീയറിംഗിന് ഔട്ട്പുട്ടുകൾ ഗണ്യമായി വർദ്ധിപ്പിക്കാൻ കഴിയുമെങ്കിലും, വലിയ ഭാഷാ മോഡലുകളുടെ (എൽഎൽഎം) അന്തർലീനമായ പരിമിതികൾ മനസിലാക്കേണ്ടത് നിർണായകമാണ്. രണ്ട് പ്രധാന വെല്ലുവിളികൾ മതിഭ്രമവും വിജ്ഞാന വിച്ഛേദനവുമാണ്.

മതിഭ്രമം: മോഡൽ തെറ്റായതോ കെട്ടിച്ചമച്ചതോ ആയ പ്രതികരണം ആത്മവിശ്വാസത്തോടെ നൽകുന്ന സന്ദർഭങ്ങളെ ഇത് സൂചിപ്പിക്കുന്നു. അത്തരം ഔട്ട്പുട്ടുകൾ തിരിച്ചറിയുന്നതിനും ഒഴിവാക്കുന്നതിനും നൂതന എൽഎൽഎമ്മിന് ബിൽറ്റ്-ഇൻ സംവിധാനങ്ങൾ ഉണ്ടെങ്കിലും.

നോളജ് കട്ട് ഓഫ്: ഓരോ എൽഎൽഎം മോഡലിനും ഒരു പരിശീലന അവസാന തീയതിയുണ്ട്, അതിനുശേഷം ഇവന്റുകളോ സംഭവവികാസങ്ങളോ അറിയില്ല. ഈ പരിമിതി അർത്ഥമാക്കുന്നത് മോഡലിന്റെ അറിവ് അതിന്റെ അവസാന പരിശീലന തീയതിയുടെ ഘട്ടത്തിൽ മരവിച്ചിരിക്കുന്നു എന്നാണ്. ഉദാഹരണത്തിന്, 2022 വരെ പരിശീലനം ലഭിച്ച ഒരു മോഡലിന് 2023 ലെ സംഭവങ്ങൾ അറിയില്ല.

വീണ്ടെടുക്കൽ-ഓഗ്മെന്റഡ് ജനറേഷൻ (ആർഎജി) ഈ വെല്ലുവിളികൾക്ക് ഒരു പരിഹാരം നൽകുന്നു. ബാഹ്യ വിവരങ്ങൾ ആക്സസ് ചെയ്യാനും ഉടമസ്ഥാവകാശ അല്ലെങ്കിൽ ഡൊമെയ്ൻ നിർദ്ദിഷ്ട ഡാറ്റയിലേക്ക് പ്രവേശനം നൽകിക്കൊണ്ട് മതിഭ്രമങ്ങളുടെ പ്രശ്നങ്ങൾ ലഘൂകരിക്കാനും ഇത് മോഡലുകളെ അനുവദിക്കുന്നു. നോളജ് കട്ട്-ഓഫുകൾക്കായി, മോഡലിന്റെ പരിശീലന തീയതിക്കപ്പുറം നിലവിലെ വിവരങ്ങൾ ആക്സസ് ചെയ്യാൻ ആർഎജിക്ക് കഴിയും, ഔട്ട്പുട്ട് കാലികമാണെന്ന് ഉറപ്പാക്കുന്നു.

വിവിധ ബാഹ്യ സ്രോതസ്സുകളിൽ നിന്ന് തത്സമയം ഡാറ്റ വലിച്ചെടുക്കാനും ഇത് എൽഎൽഎമ്മിനെ അനുവദിക്കുന്നു. ഇത് വിജ്ഞാന അടിത്തറകളോ ഡാറ്റാബേസുകളോ ഇന്റർനെറ്റിന്റെ വിശാലമായ വിസ്തൃതിയോ ആകാം.

വീണ്ടെടുക്കൽ-ഓഗ് മെന്റഡ് ജനറേഷന്റെ ആമുഖം

വീണ്ടെടുക്കൽ-ഓഗ്മെന്റഡ് ജനറേഷൻ (ആർഎജി) ഒരു നിർദ്ദിഷ്ട സാങ്കേതികവിദ്യയേക്കാൾ ഒരു ചട്ടക്കൂടാണ്, ഇത് ലാർജ് ലാംഗ്വേജ് മോഡലുകളെ അവർക്ക് പരിശീലനം നൽകാത്ത ഡാറ്റ ടാപ്പുചെയ്യാൻ പ്രാപ്തമാക്കുന്നു. RAG നടപ്പിലാക്കുന്നതിന് ഒന്നിലധികം മാർഗങ്ങളുണ്ട്, ഏറ്റവും അനുയോജ്യമായത് നിങ്ങളുടെ നിർദ്ദിഷ്ട ജോലിയെയും നിങ്ങളുടെ ഡാറ്റയുടെ സ്വഭാവത്തെയും ആശ്രയിച്ചിരിക്കുന്നു.

RAG ചട്ടക്കൂട് ഒരു ഘടനാപരമായ രീതിയിൽ പ്രവർത്തിക്കുന്നു:

കൃത്യമായ ഇൻപുട്ട്

ഒരു ഉപയോക്താവിന്റെ ഇൻപുട്ട് അല്ലെങ്കിൽ പ്രോംപ്റ്റ് ഉപയോഗിച്ച് പ്രക്രിയ ആരംഭിക്കുന്നു. ഇത് ഒരു ചോദ്യമോ നിർദ്ദിഷ്ട വിവരങ്ങൾ തേടുന്ന പ്രസ്താവനയോ ആകാം.

ബാഹ്യ സ്രോതസ്സുകളിൽ നിന്നുള്ള വീണ്ടെടുക്കൽ

പരിശീലനത്തെ അടിസ്ഥാനമാക്കി നേരിട്ട് ഒരു പ്രതികരണം സൃഷ്ടിക്കുന്നതിനുപകരം, മോഡൽ, ഒരു റിട്രീവർ ഘടകത്തിന്റെ സഹായത്തോടെ ബാഹ്യ ഡാറ്റ ഉറവിടങ്ങളിലൂടെ തിരയുന്നു. ഈ സ്രോതസ്സുകൾ വിജ്ഞാന അടിത്തറകൾ, ഡാറ്റാബേസുകൾ, ഡോക്യുമെന്റ് സ്റ്റോറുകൾ മുതൽ ഇന്റർനെറ്റ് ആക്സസ് ചെയ്യാവുന്ന ഡാറ്റ വരെയാകാം.

വീണ്ടെടുക്കൽ മനസ്സിലാക്കുക

അതിന്റെ സാരാംശത്തിൽ, വീണ്ടെടുക്കൽ ഒരു തിരയൽ പ്രവർത്തനത്തെ പ്രതിഫലിപ്പിക്കുന്നു. ഒരു ഉപയോക്താവിന്റെ ഇൻപുട്ടിനുള്ള പ്രതികരണമായി ഏറ്റവും പ്രസക്തമായ വിവരങ്ങൾ വേർതിരിച്ചെടുക്കുന്നതിനെക്കുറിച്ചാണ് ഇത്. ഈ പ്രക്രിയയെ രണ്ട് ഘട്ടങ്ങളായി വിഭജിക്കാം:

ഇൻഡെക്സിംഗ്: മുഴുവൻ ആർഎജി യാത്രയിലെയും ഏറ്റവും വെല്ലുവിളി നിറഞ്ഞ ഭാഗം നിങ്ങളുടെ അറിവിന്റെ അടിത്തറയെ സൂചികപ്പെടുത്തുക എന്നതാണ്. ഇൻഡെക്സിംഗ് പ്രക്രിയയെ വിശാലമായി രണ്ട് ഘട്ടങ്ങളായി തിരിക്കാം: ലോഡിംഗ്, ലാങ്ചെയിൻ പോലുള്ള Splitting.In ഉപകരണങ്ങൾ, ഈ പ്രക്രിയകളെ “ലോഡറുകൾ” എന്നും “സ്പ്ലിറ്ററുകൾ” എന്നും വിളിക്കുന്നു. വെബ് പേജുകളോ പിഡിഎഫുകളോ ആകട്ടെ, ലോഡർമാർ വിവിധ ഉറവിടങ്ങളിൽ നിന്ന് ഉള്ളടക്കം നേടുന്നു. ഒരിക്കൽ ലഭിച്ചുകഴിഞ്ഞാൽ, സ്പ്ലിറ്ററുകൾ ഈ ഉള്ളടക്കത്തെ കടി വലുപ്പത്തിലുള്ള കഷണങ്ങളായി വിഭജിക്കുന്നു, ഇത് എംബെഡിംഗിനും തിരയലിനും ഒപ്റ്റിമൈസ് ചെയ്യുന്നു.

ചോദ്യം ചെയ്യൽ: ഒരു തിരയൽ പദത്തെ അടിസ്ഥാനമാക്കി ഏറ്റവും പ്രസക്തമായ വിജ്ഞാന ശകലങ്ങൾ വേർതിരിച്ചെടുക്കുന്ന പ്രവൃത്തിയാണിത്.

വീണ്ടെടുക്കലിനെ സമീപിക്കാൻ നിരവധി മാർഗങ്ങളുണ്ടെങ്കിലും, ലളിതമായ ടെക്സ്റ്റ് മാച്ചിംഗ് മുതൽ ഗൂഗിൾ പോലുള്ള സെർച്ച് എഞ്ചിനുകൾ ഉപയോഗിക്കുന്നത് വരെ, ആധുനിക റിട്രീവൽ-ഓഗ്മെന്റഡ് ജനറേഷൻ (ആർഎജി) സംവിധാനങ്ങൾ സെമാന്റിക് തിരയലിനെ ആശ്രയിച്ചിരിക്കുന്നു. സെമാന്റിക് തിരയലിന്റെ ഹൃദയഭാഗത്ത് ഉൾച്ചേർക്കൽ എന്ന ആശയം സ്ഥിതിചെയ്യുന്നു.

ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ (എൽഎൽഎം) ഭാഷ എങ്ങനെ മനസ്സിലാക്കുന്നു എന്നതിന്റെ കേന്ദ്രമാണ് എംബെഡിംഗ്സ്. വാക്കുകളിൽ നിന്ന് എങ്ങനെ അർത്ഥം നേടുന്നുവെന്ന് മനുഷ്യർ വിശദീകരിക്കാൻ ശ്രമിക്കുമ്പോൾ, വിശദീകരണം പലപ്പോഴും അന്തർലീനമായ ധാരണയിലേക്ക് തിരിയുന്നു. നമ്മുടെ വൈജ്ഞാനിക ഘടനകൾക്കുള്ളിൽ, “കുട്ടി”, “കുട്ടി” എന്നിവ പര്യായപദങ്ങളാണെന്നും അല്ലെങ്കിൽ “ചുവപ്പ്”, “പച്ച” എന്നിവ നിറങ്ങളെ സൂചിപ്പിക്കുന്നുവെന്നും ഞങ്ങൾ തിരിച്ചറിയുന്നു.

പ്രോംപ്റ്റ് വർദ്ധിപ്പിക്കുക

വീണ്ടെടുത്ത വിവരങ്ങൾ യഥാർത്ഥ പ്രോംപ്റ്റുമായി സംയോജിപ്പിച്ച് ഒരു ഓഗ്മെന്റഡ് അല്ലെങ്കിൽ വിപുലീകരിച്ച പ്രോംപ്റ്റ് സൃഷ്ടിക്കുന്നു. ഈ ഓഗ്മെന്റഡ് പ്രോംപ്റ്റ് മോഡലിന് അധിക സന്ദർഭം നൽകുന്നു, ഡാറ്റ ഡൊമെയ്ൻ നിർദ്ദിഷ്ടമാണെങ്കിൽ അല്ലെങ്കിൽ മോഡലിന്റെ യഥാർത്ഥ പരിശീലന കോർപ്പസിന്റെ ഭാഗമല്ലെങ്കിൽ ഇത് പ്രത്യേകിച്ചും മൂല്യവത്താണ്.

പൂർത്തീകരണം സൃഷ്ടിക്കൽ

കൈയിൽ ഓഗ്മെന്റഡ് പ്രോംപ്റ്റ് ഉപയോഗിച്ച്, മോഡൽ ഒരു പൂർത്തീകരണമോ പ്രതികരണമോ സൃഷ്ടിക്കുന്നു. ഈ പ്രതികരണം മോഡലിന്റെ പരിശീലനത്തെ അടിസ്ഥാനമാക്കിയുള്ളതല്ല, മറിച്ച് വീണ്ടെടുത്ത തത്സമയ ഡാറ്റയും അറിയിക്കുന്നു.

ആദ്യ RAG LLM-ന്റെ വാസ്തുവിദ്യ

2020 ൽ പ്രസിദ്ധീകരിച്ച മെറ്റയുടെ ഗവേഷണ പ്രബന്ധം “നോളജ്-ഇന്റൻസീവ് എൻഎൽപി ടാസ്ക്കുകൾക്കായുള്ള വീണ്ടെടുക്കൽ-ഓഗ്മെന്റഡ് ജനറേഷൻ” ഈ സാങ്കേതികതയെക്കുറിച്ച് ആഴത്തിൽ പരിശോധിക്കുന്നു. വീണ്ടെടുക്കൽ-ഓഗ്മെന്റഡ് ജനറേഷൻ മോഡൽ ഒരു ബാഹ്യ വീണ്ടെടുക്കൽ അല്ലെങ്കിൽ തിരയൽ സംവിധാനം ഉപയോഗിച്ച് പരമ്പരാഗത തലമുറ പ്രക്രിയയെ വർദ്ധിപ്പിക്കുന്നു. സന്ദർഭോചിതമായി കൃത്യമായ പ്രതികരണങ്ങൾ സൃഷ്ടിക്കാനുള്ള കഴിവ് വർദ്ധിപ്പിക്കുന്നതിലൂടെ ഡാറ്റയുടെ വിശാലമായ കോർപ്പറേഷനിൽ നിന്ന് പ്രസക്തമായ വിവരങ്ങൾ വലിച്ചെടുക്കാൻ ഇത് മോഡലിനെ അനുവദിക്കുന്നു.

ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് ഇതാ:

പാരാമെട്രിക് മെമ്മറി: ഇത് നിങ്ങളുടെ പരമ്പരാഗത ഭാഷാ മോഡൽ ആണ്, ഒരു സെക്ക് 2 സെക്ക് മോഡൽ പോലെ. ഇത് ധാരാളം ഡാറ്റയിൽ പരിശീലനം നേടിയിട്ടുണ്ട്, ധാരാളം അറിയാം. നോൺ-പാരാമെട്രിക് മെമ്മറി: ഇത് ഒരു സെർച്ച് എഞ്ചിനായി ചിന്തിക്കുക. ന്യൂറൽ റിട്രീവർ ഉപയോഗിച്ച് ആക്സസ് ചെയ്യാൻ കഴിയുന്ന വിക്കിപീഡിയയുടെ സാന്ദ്രമായ വെക്റ്റർ സൂചികയാണിത്.

സംയോജിപ്പിക്കുമ്പോൾ, ഇവ രണ്ടും കൃത്യമായ ഒരു മോഡൽ സൃഷ്ടിക്കുന്നു. ആർഎജി മോഡൽ ആദ്യം അതിന്റെ നോൺ-പാരാമെട്രിക് മെമ്മറിയിൽ നിന്ന് പ്രസക്തമായ വിവരങ്ങൾ വീണ്ടെടുക്കുകയും തുടർന്ന് അനുയോജ്യമായ പ്രതികരണം നൽകുന്നതിന് അതിന്റെ പാരാമെട്രിക് അറിവ് ഉപയോഗിക്കുകയും ചെയ്യുന്നു.

1. രണ്ട് ഘട്ട പ്രക്രിയ:

RAG LLM രണ്ട് ഘട്ട പ്രക്രിയയിലാണ് പ്രവർത്തിക്കുന്നത്:

വീണ്ടെടുക്കൽ: മോഡൽ ആദ്യം ഒരു വലിയ ഡാറ്റാസെറ്റിൽ നിന്ന് പ്രസക്തമായ രേഖകളോ പാസേജുകളോ തിരയുന്നു. സാന്ദ്രമായ വീണ്ടെടുക്കൽ സംവിധാനം ഉപയോഗിച്ചാണ് ഇത് ചെയ്യുന്നത്, ഇത് ചോദ്യത്തെയും രേഖകളെയും പ്രതിനിധീകരിക്കുന്നതിന് എംബഡിംഗ് ഉപയോഗിക്കുന്നു. സാമ്യത സ്കോറുകൾ കണക്കാക്കാൻ എംബെഡിംഗ്സ് ഉപയോഗിക്കുന്നു, കൂടാതെ മികച്ച റാങ്കുള്ള ഡോക്യുമെന്റുകൾ വീണ്ടെടുക്കുന്നു.

: മോഡൽ ആദ്യം ഒരു വലിയ ഡാറ്റാസെറ്റിൽ നിന്ന് പ്രസക്തമായ ഡോക്യുമെന്റുകൾ അല്ലെങ്കിൽ പാസേജുകൾ തിരയുന്നു. സാന്ദ്രമായ വീണ്ടെടുക്കൽ സംവിധാനം ഉപയോഗിച്ചാണ് ഇത് ചെയ്യുന്നത്, ഇത് ചോദ്യത്തെയും രേഖകളെയും പ്രതിനിധീകരിക്കുന്നതിന് എംബഡിംഗ് ഉപയോഗിക്കുന്നു. സാമ്യത സ്കോറുകൾ കണക്കാക്കാൻ എംബെഡിംഗ്സ് ഉപയോഗിക്കുന്നു, കൂടാതെ മികച്ച റാങ്കുള്ള ഡോക്യുമെന്റുകൾ വീണ്ടെടുക്കുന്നു. ജനറേഷൻ: ടോപ്പ്-കെ പ്രസക്തമായ രേഖകൾ കൈവശമുള്ളതിനാൽ, അവ പ്രാരംഭ ചോദ്യത്തോടൊപ്പം ഒരു സീക്വൻസ്-ടു-സീക്വൻസ് ജനറേറ്ററിലേക്ക് ചാനൽ ചെയ്യുന്നു. ഈ ജനറേറ്റർ അന്തിമ ഔട്ട്പുട്ട് രൂപകൽപ്പന ചെയ്യുന്നു, ചോദ്യത്തിൽ നിന്നും ലഭിച്ച രേഖകളിൽ നിന്നും സന്ദർഭം വരയ്ക്കുന്നു.

2. സാന്ദ്രമായ വീണ്ടെടുക്കൽ:

പരമ്പരാഗത വീണ്ടെടുക്കൽ സംവിധാനങ്ങൾ പലപ്പോഴും ടിഎഫ്-ഐഡിഎഫ് പോലുള്ള വിരളമായ പ്രാതിനിധ്യങ്ങളെ ആശ്രയിക്കുന്നു. എന്നിരുന്നാലും, RAG LLM സാന്ദ്രമായ പ്രാതിനിധ്യങ്ങൾ ഉപയോഗിക്കുന്നു, അവിടെ അന്വേഷണവും ഡോക്യുമെന്റുകളും തുടർച്ചയായ വെക്റ്റർ ഇടങ്ങളിൽ ഉൾച്ചേർത്തിരിക്കുന്നു. ഇത് കൂടുതൽ സൂക്ഷ്മമായ സാമ്യത താരതമ്യങ്ങൾ അനുവദിക്കുന്നു, കേവലം കീവേഡ് പൊരുത്തപ്പെടുത്തലിനപ്പുറം സെമാന്റിക് ബന്ധങ്ങൾ പിടിച്ചെടുക്കുന്നു.

3. സീക്വൻസ്-ടു-സീക്വൻസ് ജനറേഷൻ:

വീണ്ടെടുത്ത ഡോക്യുമെന്റുകൾ ജനറേഷൻ മോഡലിന്റെ വിപുലമായ സന്ദർഭമായി പ്രവർത്തിക്കുന്നു. പലപ്പോഴും ട്രാൻസ്ഫോർമറുകൾ പോലുള്ള ആർക്കിടെക്ചറുകളെ അടിസ്ഥാനമാക്കിയുള്ള ഈ മോഡൽ അന്തിമ ഔട്ട്പുട്ട് സൃഷ്ടിക്കുന്നു, ഇത് യുക്തിസഹവും സന്ദർഭോചിതവുമായി പ്രസക്തമാണെന്ന് ഉറപ്പാക്കുന്നു.

രേഖ തിരയൽ

ഡോക്യുമെന്റ് സൂചികയും വീണ്ടെടുക്കലും

കാര്യക്ഷമമായ വിവര വീണ്ടെടുക്കലിനായി, പ്രത്യേകിച്ച് വലിയ രേഖകളിൽ നിന്ന്, ഡാറ്റ പലപ്പോഴും ഒരു വെക്റ്റർ ഡാറ്റാബേസിൽ സംഭരിക്കുന്നു. ഉള്ളടക്കത്തിന്റെ സെമാന്റിക് സത്ത പിടിച്ചെടുക്കുന്ന ഒരു എംബെഡിംഗ് വെക്റ്ററിനെ അടിസ്ഥാനമാക്കിയാണ് ഓരോ ഡാറ്റയും ഡോക്യുമെന്റും ഇൻഡെക്സ് ചെയ്യുന്നത്. ഇൻപുട്ട് പ്രോംപ്റ്റിനെ അടിസ്ഥാനമാക്കി പ്രസക്തമായ വിവരങ്ങൾ വേഗത്തിൽ വീണ്ടെടുക്കൽ കാര്യക്ഷമമായ ഇൻഡെക്സിംഗ് ഉറപ്പാക്കുന്നു.

വെക്റ്റർ ഡാറ്റാബേസുകൾ

വെക്റ്റർ ഡാറ്റാബേസുകൾ, ചിലപ്പോൾ വെക്റ്റർ സ്റ്റോറേജ് എന്ന് വിളിക്കുന്നു, വെക്റ്റർ ഡാറ്റ സംഭരിക്കുന്നതിലും കൊണ്ടുവരുന്നതിലും വിദഗ്ദ്ധരായ ഡാറ്റാബേസുകളാണ്. ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്, കമ്പ്യൂട്ടർ സയൻസ് എന്നിവയുടെ മേഖലയിൽ, വെക്റ്ററുകൾ അടിസ്ഥാനപരമായി ഒരു മൾട്ടി-ഡയമെൻഷണൽ സ്പേസിലെ പോയിന്റുകളെ പ്രതീകപ്പെടുത്തുന്ന സംഖ്യകളുടെ പട്ടികകളാണ്. ടാബുലാർ ഡാറ്റയുമായി കൂടുതൽ പൊരുത്തപ്പെടുന്ന പരമ്പരാഗത ഡാറ്റാബേസുകളിൽ നിന്ന് വ്യത്യസ്തമായി, എഐ മോഡലുകളിൽ നിന്നുള്ള എംബഡിംഗ് പോലുള്ള ഒരു വെക്റ്റർ ഫോർമാറ്റിന് സ്വാഭാവികമായി യോജിക്കുന്ന ഡാറ്റ കൈകാര്യം ചെയ്യുന്നതിൽ വെക്റ്റർ ഡാറ്റാബേസുകൾ തിളങ്ങുന്നു.

ചില ശ്രദ്ധേയമായ വെക്റ്റർ ഡാറ്റാബേസുകളിൽ അനോയ്, ഫൈസ് ബൈ മെറ്റ, മിൽവസ്, പൈനെക്കോൺ എന്നിവ ഉൾപ്പെടുന്നു. ഈ ഡാറ്റാബേസുകൾ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ആപ്ലിക്കേഷനുകളിൽ നിർണായകമാണ്, ശുപാർശ സംവിധാനങ്ങൾ മുതൽ ഇമേജ് തിരയലുകൾ വരെയുള്ള ജോലികളിൽ സഹായിക്കുന്നു. എഡബ്ല്യുഎസ് പോലുള്ള പ്ലാറ്റ്ഫോമുകൾ വെക്റ്റർ ഡാറ്റാബേസ് ആവശ്യങ്ങൾക്കായി രൂപകൽപ്പന ചെയ്ത സേവനങ്ങളും വാഗ്ദാനം ചെയ്യുന്നു, അതായത് ആമസോൺ ഓപ്പൺ സെർച്ച് സേവനം, പോസ്റ്റ്ഗ്രെസ്ക്യുഎല്ലിനായി ആമസോൺ ആർഡിഎസ്. ഈ സേവനങ്ങൾ നിർദ്ദിഷ്ട ഉപയോഗ കേസുകൾക്കായി ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നു, കാര്യക്ഷമമായ സൂചികയും അന്വേഷണവും ഉറപ്പാക്കുന്നു.

പ്രസക്തിക്കായി ചങ്കിംഗ്

പല രേഖകളും വിപുലമായതിനാൽ, “ചങ്കിംഗ്” എന്നറിയപ്പെടുന്ന ഒരു സാങ്കേതികത പലപ്പോഴും ഉപയോഗിക്കുന്നു. വലിയ രേഖകൾ ചെറിയതും അർത്ഥപരമായി യോജിച്ചതുമായ ഭാഗങ്ങളായി വിഭജിക്കുന്നത് ഇതിൽ ഉൾപ്പെടുന്നു. ഈ കഷണങ്ങൾ പിന്നീട് ഇൻഡെക്സ് ചെയ്യുകയും ആവശ്യാനുസരണം വീണ്ടെടുക്കുകയും ചെയ്യുന്നു, ഇത് ഒരു ഡോക്യുമെന്റിന്റെ ഏറ്റവും പ്രസക്തമായ ഭാഗങ്ങൾ ഉടനടി വർദ്ധിപ്പിക്കുന്നതിന് ഉപയോഗിക്കുന്നുവെന്ന് ഉറപ്പാക്കുന്നു.

Context window പരിഗണനകൾ

ഓരോ എൽഎൽഎമ്മും ഒരു സന്ദർഭ ജാലകത്തിലാണ് പ്രവർത്തിക്കുന്നത്, ഇത് അടിസ്ഥാനപരമായി ഒരേസമയം പരിഗണിക്കാൻ കഴിയുന്ന പരമാവധി വിവരങ്ങളാണ്. ബാഹ്യ ഡാറ്റ സ്രോതസ്സുകൾ ഈ വിൻഡോയെ മറികടക്കുന്ന വിവരങ്ങൾ നൽകുകയാണെങ്കിൽ, മോഡലിന്റെ സന്ദർഭ ജാലകത്തിനുള്ളിൽ യോജിക്കുന്ന ചെറിയ കഷണങ്ങളായി അത് വിഭജിക്കേണ്ടതുണ്ട്.

വീണ്ടെടുക്കൽ-ഓഗ് മെന്റഡ് ജനറേഷൻ ഉപയോഗിക്കുന്നതിന്റെ പ്രയോജനങ്ങൾ

മെച്ചപ്പെട്ട കൃത്യത: ബാഹ്യ ഡാറ്റ സ്രോതസ്സുകളെ പ്രയോജനപ്പെടുത്തുന്നതിലൂടെ, RAG LLM-ന് അതിന്റെ പരിശീലന ഡാറ്റയെ അടിസ്ഥാനമാക്കിയുള്ള പ്രതികരണങ്ങൾ സൃഷ്ടിക്കാൻ കഴിയും, മാത്രമല്ല വീണ്ടെടുക്കൽ കോർപ്പസിൽ ലഭ്യമായ ഏറ്റവും പ്രസക്തവും കാലികവുമായ വിവരങ്ങളാൽ അറിയിക്കപ്പെടുകയും ചെയ്യുന്നു.

വിജ്ഞാന വിടവുകൾ മറികടക്കൽ: മോഡലിന്റെ പരിശീലന കട്ട് ഓഫ് മൂലമോ അല്ലെങ്കിൽ അതിന്റെ പരിശീലന കോർപ്പസിൽ ഡൊമെയ്ൻ നിർദ്ദിഷ്ട ഡാറ്റയുടെ അഭാവം മൂലമോ എൽഎൽഎമ്മിന്റെ അന്തർലീനമായ അറിവ് പരിമിതികളെ ആർഎജി ഫലപ്രദമായി അഭിസംബോധന ചെയ്യുന്നു.

വൈവിധ്യം: ഒരു ഓർഗനൈസേഷനിലെ കുത്തക ഡാറ്റാബേസുകൾ മുതൽ പൊതുവായി ആക്സസ് ചെയ്യാവുന്ന ഇന്റർനെറ്റ് ഡാറ്റ വരെ വിവിധ ബാഹ്യ ഡാറ്റ ഉറവിടങ്ങളുമായി ആർഎജി സംയോജിപ്പിക്കാൻ കഴിയും. ഇത് വൈവിധ്യമാർന്ന ആപ്ലിക്കേഷനുകളുമായും വ്യവസായങ്ങളുമായും പൊരുത്തപ്പെടുന്നു.

മതിഭ്രമം കുറയ്ക്കൽ: എൽഎൽഎമ്മിന്റെ വെല്ലുവിളികളിലൊന്ന് “മതിഭ്രമങ്ങൾ” അല്ലെങ്കിൽ വസ്തുതാപരമായി തെറ്റായതോ കെട്ടിച്ചമച്ചതോ ആയ വിവരങ്ങളുടെ ഉത്പാദനമാണ്. തത്സമയ ഡാറ്റ സന്ദർഭം നൽകുന്നതിലൂടെ, അത്തരം ഔട്ട്പുട്ടുകളുടെ സാധ്യതകൾ ഗണ്യമായി കുറയ്ക്കാൻ ആർഎജിക്ക് കഴിയും.

സ്കെയിലബിലിറ്റി: RAG LLM-ന്റെ പ്രാഥമിക നേട്ടങ്ങളിലൊന്ന് സ്കെയിൽ ചെയ്യാനുള്ള കഴിവാണ്. വീണ്ടെടുക്കൽ, ജനറേഷൻ പ്രക്രിയകൾ വേർതിരിക്കുന്നതിലൂടെ, മോഡലിന് വിശാലമായ ഡാറ്റാസെറ്റുകൾ കാര്യക്ഷമമായി കൈകാര്യം ചെയ്യാൻ കഴിയും, ഇത് ഡാറ്റ സമൃദ്ധമായ യഥാർത്ഥ ലോക ആപ്ലിക്കേഷനുകൾക്ക് അനുയോജ്യമാക്കുന്നു.

വെല്ലുവിളികളും പരിഗണനകളും

കംപ്യൂട്ടേഷണൽ ഓവർഹെഡ്: രണ്ട് ഘട്ട പ്രക്രിയ കമ്പ്യൂട്ടേഷണൽ തീവ്രമായിരിക്കാം, പ്രത്യേകിച്ചും വലിയ ഡാറ്റാസെറ്റുകൾ കൈകാര്യം ചെയ്യുമ്പോൾ.

: രണ്ട് ഘട്ട പ്രക്രിയ കണക്കുകൂട്ടൽ തീവ്രമായിരിക്കാം, പ്രത്യേകിച്ചും വലിയ ഡാറ്റാസെറ്റുകൾ കൈകാര്യം ചെയ്യുമ്പോൾ. ഡാറ്റാ ആശ്രിതത്വം: വീണ്ടെടുത്ത ഡോക്യുമെന്റുകളുടെ ഗുണനിലവാരം ജനറേഷൻ ഗുണനിലവാരത്തെ നേരിട്ട് ബാധിക്കുന്നു. അതിനാൽ, സമഗ്രവും നന്നായി തയ്യാറാക്കിയതുമായ വീണ്ടെടുക്കൽ കോർപ്പസ് ഉണ്ടായിരിക്കേണ്ടത് നിർണായകമാണ്.

വീണ്ടെടുക്കൽ, ജനറേഷൻ പ്രക്രിയകൾ സമന്വയിപ്പിക്കുന്നതിലൂടെ, റിട്രീവൽ-ഓഗ്മെന്റഡ് ജനറേഷൻ അറിവ് തീവ്രമായ ജോലികൾക്ക് ശക്തമായ പരിഹാരം വാഗ്ദാനം ചെയ്യുന്നു, ഇത് അറിവുള്ളതും സന്ദർഭോചിതമായി പ്രസക്തവുമായ ഔട്ട്പുട്ടുകൾ ഉറപ്പാക്കുന്നു.

ആർഎജിയുടെ യഥാർത്ഥ വാഗ്ദാനം അതിന്റെ യഥാർത്ഥ ലോക ആപ്ലിക്കേഷനുകളിലാണ്. സമയബന്ധിതവും കൃത്യവുമായ വിവരങ്ങൾ നിർണായകമാകാൻ കഴിയുന്ന ആരോഗ്യസംരക്ഷണം പോലുള്ള മേഖലകൾക്ക്, വിശാലമായ മെഡിക്കൽ സാഹിത്യത്തിൽ നിന്ന് തടസ്സമില്ലാതെ ഉൾക്കാഴ്ചകൾ വേർതിരിച്ചെടുക്കാനും സൃഷ്ടിക്കാനുമുള്ള കഴിവ് ആർഎജി വാഗ്ദാനം ചെയ്യുന്നു. ഓരോ നിമിഷവും വിപണികൾ വികസിക്കുന്ന ധനകാര്യ മേഖലയിൽ, ആർഎജിക്ക് തത്സമയ ഡാറ്റ അടിസ്ഥാനമാക്കിയുള്ള ഉൾക്കാഴ്ചകൾ നൽകാൻ കഴിയും, ഇത് അറിവുള്ള തീരുമാനമെടുക്കാൻ സഹായിക്കുന്നു. കൂടാതെ, അക്കാദമിക മേഖലയിലും ഗവേഷണത്തിലും, പണ്ഡിതർക്ക് വിവരങ്ങളുടെ വിശാലമായ ശേഖരങ്ങൾ സ്കാൻ ചെയ്യാനും സാഹിത്യ അവലോകനങ്ങളും ഡാറ്റാ വിശകലനവും കൂടുതൽ കാര്യക്ഷമമാക്കാനും ആർഎജി ഉപയോഗിക്കാൻ കഴിയും.

OpenAI-യുടെ ChatGPT-യ്ക്ക് ബ്രൗസിംഗ് അപ് ഗ്രേഡ് ലഭിക്കുന്നു

പ്രോംപ്റ്റ് എഞ്ചിനീയറിംഗ് ഫലപ്രദമാണ്, പക്ഷേ അപര്യാപ്തമാണ്

ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകളിലെ വെല്ലുവിളികൾ

വീണ്ടെടുക്കൽ-ഓഗ് മെന്റഡ് ജനറേഷന്റെ ആമുഖം