ഓർഗാനിക് തന്മാത്രകളുടെ ഇലക്ട്രോണിക്, ഫംഗ്ഷണൽ ഗുണങ്ങൾ പ്രവചിക്കാൻ യുകെ ആസ്ഥാനമായുള്ള ഗവേഷകർ ജിപിടി -3 നന്നായി ക്രമീകരിച്ചു.
ജിപിടി -3 ന് സ്മൈൽസ് തിരിച്ചറിയാൻ കഴിയും – ലളിതമാക്കിയ മോളിക്യുലാർ ഇൻപുട്ട് ലൈൻ എൻട്രി സിസ്റ്റം – ഒരു ടെക്സ്റ്റ് സ്ട്രിംഗ് എന്ന നിലയിൽ രാസ ഘടനകളെ പ്രതിനിധീകരിക്കുന്ന ഒരു കുറിപ്പ്, പക്ഷേ സാധാരണയായി വിശാലവും വിദഗ്ദ്ധമല്ലാത്തതുമായ വിവരണം നൽകുന്നു. ഉദാഹരണത്തിന്, ജിപിടി -3 ബെൻസീൻ സ്മൈൽസ് സ്ട്രിംഗിനെ ഒരു വളയ ഘടനയുള്ള ഒരു സുഗന്ധ സംയുക്തമായി വിവരിക്കും, പക്ഷേ തന്മാത്രാ ഗുണങ്ങളെക്കുറിച്ച് ആഴത്തിലുള്ള ഉൾക്കാഴ്ച നൽകാൻ കഴിയില്ല.
കേംബ്രിഡ്ജ് സ്ട്രക്ചറൽ ഡാറ്റാബേസിൽ (സിഎസ്ഡി) നിന്ന് വേർതിരിച്ചെടുത്ത 48,182 ഓർഗാനിക് തന്മാത്രകളും തന്മാത്രകളുടെ സിന്തറ്റിക് റൂട്ടുകൾ, സോളിഡ് സ്റ്റേറ്റ് സ്ഥിരത, ഇലക്ട്രോണിക് ഗുണങ്ങൾ എന്നിവയെക്കുറിച്ചുള്ള വിശദാംശങ്ങളും അടങ്ങിയ ഡാറ്റാസെറ്റാണ് ലിവർപൂൾ സർവകലാശാലയിലെ ആൻഡ്രൂ കൂപ്പറും ബർമിംഗ്ഹാം സർവകലാശാലയിലെ ലിൻജിയാങ് ചെനും ചേർന്ന് സംഘം ഉപയോഗിച്ചത്. സിഎസ്ഡി ഡാറ്റ ഉപയോഗിച്ച് അവർ ജിപിടി -3 നന്നായി ക്രമീകരിച്ചു, തുടർന്ന് ഒരു സ്മൈൽസ് സ്ട്രിംഗ് നൽകുമ്പോൾ ഓർഗാനിക് അർദ്ധചാലകങ്ങളുടെ ഹോമോ, ലൂമോ മൂല്യങ്ങൾ പ്രവചിക്കാനും തരംതിരിക്കാനും മോഡലിനെ പരിശീലിപ്പിച്ചു, ഇത് ചോദ്യങ്ങളുടെ ഉപയോഗം വളരെയധികം വർദ്ധിപ്പിച്ചു.
ഇൻപുട്ട് സ്മൈൽസ് സ്ട്രിംഗിൽ നിന്ന് ആറ്റങ്ങളും ഫംഗ്ഷണൽ ഗ്രൂപ്പുകളും നീക്കം ചെയ്യുന്നതിലൂടെ, അപൂർണ്ണമായ ഡാറ്റയിലേക്ക് മികച്ച രീതിയിൽ ട്യൂൺ ചെയ്ത ജിപിടി -3 മോഡലിന്റെ വീണ്ടെടുക്കൽ ടീം പ്രകടമാക്കി. ഈ കാണാതായ ഡാറ്റ ഉണ്ടായിരുന്നിട്ടും, പ്രോപ്പർട്ടി പ്രവചനങ്ങൾ കൃത്യതയോടെ തുടരുകയും ഉദ്ദേശിച്ച പുഞ്ചിരികളെ ശരിയായി തിരിച്ചറിയുകയും ചെയ്തു. അജ്ഞാത വസ്തുക്കളുടെ ഗുണങ്ങൾ പ്രവചിക്കാനുള്ള ജിപിടി -3 ന്റെ കഴിവ് പരിശീലനത്തിലും ഫൈൻ ട്യൂണിംഗിലും ഒരു ടെട്രാസീൻ ശകലം അടങ്ങിയ എല്ലാ തന്മാത്രകളും നീക്കം ചെയ്യുകയും തുടർന്ന് കാണാതായ ഈ ഇനങ്ങളുടെ ഗുണങ്ങൾ വിജയകരമായി തിരികെ നൽകുകയും ചെയ്തു.
ജിപിടി -3 വിഭവ തീവ്രമായി തുടരുന്നുണ്ടെങ്കിലും, വലിയ ഭാഷാ മോഡലുകൾ വിലകുറഞ്ഞതും കൂടുതൽ കാര്യക്ഷമവുമായിത്തീരുന്നതിനാൽ കമ്പ്യൂട്ടേഷണൽ വർക്ക്ഫ്ലോകളുമായി ഭാവി സംയോജനത്തിനായി വലിയ ഭാഷാ മോഡലുകളുടെ സാധ്യത ഈ പഠനം എടുത്തുകാണിക്കുന്നു.
