ജനറേറ്റീവ് ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസിൻ്റെ (AI) പുതുമ അവസാനിച്ചതിന് ശേഷം പലരും ഒരു പ്രധാന ചോദ്യം ഉന്നയിച്ചു. അത് രസകരമാണ്. എന്നാൽ യഥാർത്ഥ ലോകത്ത് ഇത് എങ്ങനെ സ്വാധീനം ചെലുത്തും? സാധുവായ ഒരു ചോദ്യമായിരുന്നു അത്. AI ചാറ്റ്ബോട്ടുകളെ പെട്ടെന്ന് വിവരങ്ങൾ കണ്ടെത്തുന്നതിനും, വേഗത്തിലുള്ള സംഭാഷണം നടത്തുന്നതിനും, ഉപന്യാസങ്ങൾ എഴുതുന്നതിനും, ചിത്രങ്ങളോ വീഡിയോകളോ സൃഷ്ടിക്കുന്നതിനും ഒരു ഏകജാലക സംവിധാനമായി കാണാൻ കഴിയുമെങ്കിലും ഒരു മനുഷ്യ ഉപയോക്താവിന് നിരന്തരം ആവശ്യമായി വരുന്ന ഒരു സംവിധാനത്തിൽ അവയുടെ പങ്ക് പരിമിതമായിരിക്കുന്നു.
അതിൻ്റെ കഴിവുകൾ തള്ളിക്കളയാനാവില്ലെങ്കിലും ചില മേഖലകളിലെ തൊഴിലാളികളുടെ ഉൽപ്പാദനക്ഷമത മെച്ചപ്പെടുത്തുന്നതിൽ അത് കാര്യമായ സ്വാധീനം ചെലുത്തിയെങ്കിലും ചുമതലകൾ കൈകാര്യം ചെയ്യാനും യഥാർത്ഥത്തിൽ യാന്ത്രികമാക്കാനും കഴിയുന്ന ഒരു വിശ്വസ്ത സഹായിയായി മാറുന്നതിൽ നിന്ന് അതിനെ തടഞ്ഞു. ഇന്നത്തെ ജനറേറ്റീവ് AI ഒരു വ്യക്തിയുടെ ജോലിയുടെ ചില വശങ്ങളെ സഹായിക്കാൻ കഴിയും. എന്നാൽ അതിന് ഒരു ടാസ്ക് നിർവഹിക്കാൻ കഴിയില്ല.
ഉദാഹരണത്തിന്, ഒരു അപ്രതീക്ഷിത കാലതാമസത്തെ കുറിച്ച് ഒരു ക്ലയൻ്റിനെ അറിയിക്കുന്നതിന് ഒരു ഇമെയിൽ എഴുതാൻ നിങ്ങൾക്ക് ആവശ്യപ്പെടാം. പക്ഷേ അതിന് ആ സന്ദേശം അയയ്ക്കാനോ അവർ അയക്കുന്ന കോപാകുലമായ മറുപടിയുമായി ഇടപെടാനോ കഴിയില്ല. അതുപോലെ, “വീഡിയോകൾ ഷൂട്ട് ചെയ്യുന്നതിനുള്ള ഏറ്റവും മികച്ച സ്മാർട്ട്ഫോൺ” ആവശ്യപ്പെടാൻ ജെമിനി അല്ലെങ്കിൽ ചാറ്റ്ജിപിടി ഉപയോഗിക്കാം. ഇതിന് ഏറ്റവും പുതിയ iPhone 16 Pro Max അല്ലെങ്കിൽ Samsung Galaxy S24 Ultra ശുപാർശ ചെയ്യാം. എന്നാൽ നിങ്ങൾക്ക് ഏറ്റവും മികച്ച ഡീൽ കണ്ടെത്താനും ഒരു വാങ്ങൽ നടത്താനും വെബിൽ പരതാൻ അതിന് കഴിയില്ല.
എന്താണ് ഒരു AI ഏജൻ്റ്?
ഈ സാങ്കേതിക വിദ്യ ഇപ്പോഴും അതിൻ്റെ നവോത്ഥാന ഘട്ടത്തിലായതിനാൽ കൃത്യമായി എന്താണ് AI ഏജൻ്റ് എന്നതിന് ഏകീകൃത നിർവചനം ഇല്ല. ഒരു വർക്ക്ഫ്ലോ രൂപകൽപന ചെയ്തും ടൂളുകൾ ഉപയോഗിച്ചും “ഒരു ഉപയോക്താവിന് വേണ്ടി സ്വയമേവ ചുമതലകൾ നിർവഹിക്കാൻ കഴിവുള്ള” ഒരു സിസ്റ്റമായി IBM അതിനെ നിർവചിക്കുന്നു . അതുപോലെ, കഴിഞ്ഞ വർഷം പ്രൊജക്റ്റ് മാരിനർ എന്ന് പേരിട്ട ആദ്യത്തെ AI ഏജൻ്റ് പ്രഖ്യാപിച്ച ഗൂഗിൾ, മനുഷ്യർക്ക് ഒരു അസിസ്റ്റൻ്റ് പോലെ പ്രവർത്തിക്കുകയും ജോലികൾ പൂർത്തിയാക്കാൻ അവരെ സഹായിക്കുകയും ചെയ്യുന്ന ഒരു സിസ്റ്റം എന്ന് വിളിക്കുന്നു.
കൂടുതൽ സമഗ്രമായ ഒരു നിർവചനം ആമസോൺ നൽകുന്നു. അത് “അതിൻ്റെ പരിസ്ഥിതിയുമായി സംവദിക്കാനും ഡാറ്റ ശേഖരിക്കാനും മുൻകൂട്ടി നിശ്ചയിച്ച ലക്ഷ്യങ്ങൾ കൈവരിക്കുന്നതിന് സ്വയം നിർണ്ണയിച്ച ജോലികൾ ചെയ്യാൻ ഡാറ്റ ഉപയോഗിക്കാനും കഴിയുന്ന ഒരു സോഫ്റ്റ്വെയർ പ്രോഗ്രാം” എന്ന് വിവരിക്കുന്നു. മനുഷ്യർ ലക്ഷ്യങ്ങൾ സജ്ജീകരിക്കുന്നു. എന്നാൽ ഒരു AI ഏജൻ്റ് സ്വതന്ത്രമായി ആ ലക്ഷ്യങ്ങൾ കൈവരിക്കുന്നതിന് ആവശ്യമായ മികച്ച പ്രവർത്തനങ്ങൾ തിരഞ്ഞെടുക്കുന്നു.
AI ഏജൻ്റിനെ തകർക്കുന്നു
ഒരു സാധാരണ AI ഏജൻ്റിന് അതിൻ്റെ തലച്ചോറായി ഒരു വലിയ ഭാഷാ മാതൃക (LLM) ഉണ്ടായിരിക്കും. എന്നാൽ ആ ബുദ്ധി പ്രവർത്തനങ്ങളിൽ ഉപയോഗിക്കാൻ പ്രാപ്തമാക്കുന്ന മറ്റ് ഘടകങ്ങളും ഇതിൽ ഉൾപ്പെടും. ഈ അധിക ഭാഗങ്ങൾ വ്യത്യസ്ത സെൻസറുകൾ, മെക്കാനിക്കൽ ഭാഗങ്ങൾ, എൻകോഡറുകൾ അല്ലെങ്കിൽ മറ്റ് സോഫ്റ്റ്വെയറുകളിലേക്കുള്ള സംയോജനമാണ്.
വ്യത്യസ്ത ഫോർമാറ്റുകളിൽ ഉടനീളം ഡാറ്റ ശേഖരിക്കാൻ സെൻസറുകൾ ഒരു AI ഏജൻ്റിനെ പ്രാപ്തമാക്കുന്നു. ഇവ ദൃശ്യമോ ശബ്ദമോ താപനിലയോ ഇലക്ട്രോണിക് സിഗ്നലുകളോ ആകാം. മെക്കാനിക്കൽ ഭാഗങ്ങൾ സാധാരണയായി എംബോഡിഡ് AI അല്ലെങ്കിൽ റോബോട്ടുകൾക്കായി ഉപയോഗിക്കുന്നു. അവ ഒരു വസ്തുവിനെ ഉയർത്തുകയോ ഒരിടത്ത് നിന്ന് മറ്റൊരിടത്തേക്ക് നീങ്ങുകയോ പോലുള്ള യഥാർത്ഥ ലോക പ്രവർത്തനങ്ങൾ നടപ്പിലാക്കേണ്ടതുണ്ട്.
വിവിധ തരം സിഗ്നലുകളെ LLM-കൾക്ക് പ്രോസസ്സ് ചെയ്യാൻ കഴിയുന്ന വിവരങ്ങളാക്കി മാറ്റാൻ എൻകോഡറുകൾ ഉപയോഗിക്കുന്നു. അവസാനമായി, സോഫ്റ്റ്വെയർ സംയോജനം ടാസ്ക്കുകൾ നിർവഹിക്കാനുള്ള കഴിവ് പ്രാപ്തമാക്കുന്നു.
ഈ ഘട്ടത്തിൽ AI മോഡലുകളും AI ഏജൻ്റുമാരും തമ്മിലുള്ള മറ്റൊരു നിർണായക വ്യത്യാസം എടുത്തു കാണിക്കേണ്ടത് പ്രധാനമാണ്. AI മോഡലുകളിൽ അവരുടെ അറിവിൻ്റെ അടിസ്ഥാനമായ ഒരു പ്രീ-ട്രെയിനിംഗ് ഡാറ്റാബേസ് അടങ്ങിയിരിക്കുന്നു. ഡാറ്റാബേസിൻ്റെ ഭാഗമല്ലാത്ത ഒന്നും ഒരു ഔട്ട്പുട്ട് സൃഷ്ടിക്കില്ല. ഇൻ്റർനെറ്റുമായി ബന്ധിപ്പിച്ചിട്ടില്ലാത്തതും വിജ്ഞാന കട്ട്- ഓഫ് തീയതിയുള്ളതുമായ ചാറ്റ്ജിപിടിയുടെ ആദ്യകാല പതിപ്പ് ഇതിന് മികച്ച ഉദാഹരണമാണ്. സമകാലിക കാര്യങ്ങളെക്കുറിച്ചുള്ള ചോദ്യത്തിന് ഉത്തരം നൽകാൻ പ്രേരിപ്പിച്ചാൽ അതിന് ഉത്തരം നൽകാൻ അതിന് കഴിയില്ല.
AI ഏജൻ്റുമാരുടെ ആപ്ലിക്കേഷനുകൾ
AI സ്ഥാപനങ്ങൾ AI ഏജൻ്റുമാരെ വ്യവസായങ്ങളിലും വ്യത്യസ്ത സാഹചര്യങ്ങളിലും ഉപയോഗിക്കാവുന്ന ഒരു ഉപകരണമായി ഉയർത്തിക്കാട്ടുന്നു. ഉപകരണ നിർദ്ദിഷ്ട ടാസ്ക്കുകൾ (ചിത്രമെടുക്കുകയോ സംഗീതം പ്ലേ ചെയ്യുകയോ പോലുള്ളവ) നിർവഹിക്കാൻ കഴിയുന്ന ഉപകരണങ്ങൾക്കായി ഇത് ഒരു വോയ്സ് അസിസ്റ്റൻ്റായി ഉപയോഗിക്കാം. ഇത് ഒരു ആപ്പിലേക്കോ സോഫ്റ്റ്വെയറിലേക്കോ ചേർക്കാനും അതിനുള്ളിലെ ചുമതലകൾ നിർവഹിക്കാനും കഴിയും (ബ്രൗസർ അടിസ്ഥാനമാക്കിയുള്ള ഏജൻ്റ് വഴി ഒരു ഉൽപ്പന്നം വാങ്ങുന്നത്). ഇത് എൻ്റർപ്രൈസ് സിസ്റ്റങ്ങളിലേക്കും ചേർക്കാനും വഞ്ചന കണ്ടെത്താനും അല്ലെങ്കിൽ വ്യത്യസ്ത പ്രക്രിയകൾ ഒപ്റ്റിമൈസ് ചെയ്യാനുള്ള വഴികൾ കണ്ടെത്താനും കഴിയും.
കൂടാതെ, AI ഏജൻ്റുമാർ ചില വ്യവസായങ്ങളിൽ രൂപാന്തരപ്പെടുത്തുന്ന ജോലികൾ ചെയ്യുന്നതായും പറയപ്പെടുന്നു. ആരോഗ്യ സംരക്ഷണത്തിൽ, രോഗനിർണയം, ചികിത്സ ശുപാർശ, മരുന്ന് കണ്ടെത്തൽ എന്നിവയ്ക്കായി ഇത് ഉപയോഗിക്കാം. ഓട്ടോമോട്ടീവ് മേഖലയിൽ, സ്വയം ഡ്രൈവിംഗ് കാറുകൾ സൃഷ്ടിക്കാൻ ഇത് ഉപയോഗിക്കാം. ഡാറ്റ ശേഖരിക്കുന്നതിനും വിശകലനം ചെയ്യുന്നതിനും രക്ഷാപ്രവർത്തനങ്ങൾക്കായി പ്രവർത്തനക്ഷമമായ സ്ഥിതി വിവരക്കണക്കുകൾ നൽകുന്നതിനും AI ഏജൻ്റുമാർക്ക് ദുരന്ത പ്രദേശങ്ങളിൽ ഡ്രോണുകൾ പൈലറ്റ് ചെയ്യാൻ കഴിയുമെന്ന് പറയപ്പെടുന്നു.
2025-ൽ AI ഏജൻ്റുകൾ
ഈ വർഷം AI ഏജൻ്റുമാരിൽ നിന്ന് യഥാർത്ഥത്തിൽ എന്താണ് പ്രതീക്ഷിക്കാൻ കഴിയുകയെന്ന് മനസ്സിലാക്കുകയും ചെയ്യേണ്ടത് പ്രധാനമാണ്. നിർമ്മാണം, ഓട്ടോമൊബൈൽ, ആരോഗ്യ സംരക്ഷണം അല്ലെങ്കിൽ വിദ്യാഭ്യാസം തുടങ്ങിയ നിർണായക മേഖലകളിൽ ഒന്നിൽ AI ഏജൻ്റുമാർ ജോലിയിൽ പ്രവേശിക്കാൻ സാധ്യതയില്ല.
എന്നിരുന്നാലും, ഈ വർഷം കൺസ്യൂമർ ഇലക്ട്രോണിക്സ്, മൊബൈൽ, ഡെസ്ക്ടോപ്പ് ആപ്ലിക്കേഷനുകളിലും വെബ്സൈറ്റുകളിലും പ്ലാറ്റ്ഫോമുകളിലും AI ഏജൻ്റുമാരുടെ പ്രവേശനം അടയാളപ്പെടുത്തണം. ഉദാഹരണത്തിന്, Google-ൻ്റെ Project Mariner, Google Chrome-മായി സംയോജിപ്പിച്ച് ഈ വർഷം അവസാനത്തോടെ വെബിൽ നിന്ന് വാങ്ങലുകൾ നടത്തുന്നതിനും ഫയലുകൾ കണ്ടെത്തുന്നതിനും ഉപയോക്താക്കളെ സഹായിക്കുന്നു.