AI தொழில்நுட்பம் இன்றைய காலகட்டத்தில் தவிர்க்க முடியாத ஒன்றாக மாறிவிட்ட போதிலும், அதன் செயல்பாட்டு முறை பலருக்கும் புதிராகவே உள்ளது. குறிப்பாக சாட்ஜிபிடி போன்ற ‘லார்ஜ் லாங்குவேஜ் மாடல்’ (LLM) கருவிகள் மனித மூளையை போலச் சிந்திப்பதாக நாம் கருதினாலும், உண்மையில் அவை மிகவும் நுட்பமான ஒரு கணித தேடுபொறியாகவே செயல்படுகின்றன. இதனை எளிமையாக சொல்ல வேண்டுமானால், ஒரு வாக்கியத்தில் ஒரு சொல்லுக்கு அடுத்ததாக வரப்போகும் சரியான சொல்லைக் கணிக்கும் கருவி (Next-word Predictor) என்று அழைக்கலாம். இது சுயமாக சிந்திப்பதை காட்டிலும், தனக்கு கொடுக்கப்பட்ட தரவுகளின் அடிப்படையில் அடுத்த சொல் எதுவாக இருக்கும் என்பதை புள்ளிவிவர ரீதியாக தீர்மானிக்கிறது.
AI தொழில்நுட்ப கருவிகள் பொதுமக்களின் பயன்பாட்டிற்கு வருவதற்கு முன்பாக, அவற்றுக்கு பிரம்மாண்டமான அளவில் பயிற்சிகள் அளிக்கப்படுகின்றன. கோடிக்கணக்கான புத்தகங்கள், இணைய கட்டுரைகள், விக்கிப்பீடியா பக்கங்கள் மற்றும் கணினி Coding என உலகளாவிய தகவல்கள் அனைத்தும் இதன் நினைவகத்தில் ஏற்றப்படுகின்றன. இந்த ‘டிரெய்னிங்’ மூலம் ஒரு மொழி எவ்வாறு கட்டமைக்கப்படுகிறது என்பதையும், இலக்கணம் மற்றும் தகவல்களையும் AI கருவி தனது நினைவகத்தில் ஒரு வரைபடமாக சேமித்து கொள்கிறது. இந்த அடிப்படை அறிவுதான் நாம் கேட்கும் கேள்விகளுக்கு பதில் அளிக்க அதற்கு ஆதாரமாக அமைகிறது.
நாம் ஒரு கேள்வியைக் கேட்கும்போது, AI அந்த முழு வாக்கியத்தையும் ஒரே நேரத்தில் உள்வாங்குவதில்லை. அதற்கு பதிலாக வாக்கியத்தை சின்ன சின்ன துண்டுகளாக பிரித்து படிக்கிறது. உதாரணமாக, “ஆப்பிள் ஒரு பழம்” என்ற வாக்கியத்தை ஆப்பிள், ஒரு, பழம் என தனித்தனியாக பிரித்து, ஒவ்வொன்றுக்கும் ஒரு குறிப்பிட்ட எண்களை வழங்குகிறது. அதன் பின்னர், தனக்கு அளிக்கப்பட்ட பயிற்சியின் மூலம் அந்த எண்களுக்கு பின்னால் உள்ள அர்த்தத்தை புரிந்துகொண்டு, ஒரு முழுமையான வாக்கியமாக பதிலை வழங்குகிறது. இதற்காக ‘டிரான்ஸ்ஃபார்மர்’ என்ற நவீனக் கட்டமைப்பு பயன்படுத்தப்படுகிறது.
ஒரு வாக்கியத்தில் உள்ள தொடர்புகளை கண்டறிவதில் AI மிகவும் கில்லாடி. உதாரணமாக, “நான் ஆற்றில் குளித்தேன், அதன் தண்ணீர் குளிர்ச்சியாக இருந்தது” என்று சொன்னால், இதில் வரும் ‘அதன்’ என்ற சொல் ஆற்றை குறிக்கிறது என்பதை AI உடனடியாக கண்டறிந்துவிடும். ஒரு பதிலை எழுதும்போது, ஒவ்வொரு வார்த்தையை தொடர்ந்து அடுத்த வார்த்தை எதுவாக இருக்க அதிக வாய்ப்பு உள்ளது என்பதை அது ஒரு நொடிக்கும் குறைவான நேரத்தில் கணக்கிடுகிறது. “மழை பெய்தால் தரை…” என்று நாம் தொடங்கினால், அடுத்த வார்த்தை “நனையும்” என்பதாக இருக்கவே 99 சதவீத வாய்ப்பு உள்ளது என்பதை தனது தரவுகளிலிருந்து அறிந்து பதிலளிக்கிறது.
ஏஐ கருவிகள் வழங்கும் தகவல்கள் மனிதர்களுக்குப் பாதுகாப்பானதாகவும், பயனுள்ளதாகவும் இருப்பதை உறுதி செய்ய ‘RLHF அதாவது Reinforcement Learning from Human Feedback என்ற முறை பயன்படுத்தப்படுகிறது. இதில் மனிதர்கள் AI வழங்கும் பல்வேறு பதில்களை ஆய்வு செய்து, எது சிறந்தது மற்றும் சரியானது என்று மதிப்பிடுவார்கள். இந்த மதிப்பீடுகளின் அடிப்படையில் AI தனது தவறுகளை திருத்திக்கொண்டு மீண்டும் மீண்டும் மெருகேறுகிறது. இதன் மூலம் தேவையற்ற அல்லது தவறான தகவல்கள் தவிர்க்கப்பட்டு, மனிதர்களுக்கு நெருக்கமான பதில்களை வழங்க AI பழகுகிறது.
சுருக்கமாக சொன்னால், AI என்பது மனிதனை போல உணர்ச்சிகளோ அல்லது தனிப்பட்ட மூளையோ கொண்ட ஒரு உயிர் அல்ல. அது ஒரு பிரம்மாண்டமான டிஜிட்டல் கணித நூலகம் ஆகும். நாம் கேட்கும் கேள்விகளுக்கு, அது ஏற்கனவே சேமித்து வைத்திருக்கும் பில்லியன் கணக்கான தரவுகளில் இருந்து மிகவும் பொருத்தமான தகவல்களை எடுத்து, அவற்றை ஒரு கோர்வையான வாக்கியமாக நமக்கு வழங்குகிறது. இப்படித்தான் சாட்ஜிபிடி உள்ளிட்ட அனைத்து AI கருவிகளும் தங்களின் பின்னணியில் ஒரு கணித மாயாஜாலத்தை நிகழ்த்தி வருகின்றன என்பது குறிப்பிடத்தக்கது.
