செயற்கை நுண்ணறிவின் அதிவேக முன்னேற்றம், உலகளாவிய தொழில்நுட்ப நிலப்பரப்பை சீர்குலைக்கும் கண்டுபிடிப்புகளுடன் குறிக்கிறது, இது ஒரு அடிப்படை தடையுடன் மோத உள்ளது: பயிற்சிக்கான உயர்தர தரவு பற்றாக்குறை. தொழில் வல்லுநர்கள் மற்றும் ஆராய்ச்சியாளர்கள் தற்போதைய வளர்ச்சியின் வேகம் தாங்க முடியாததாக இருக்கலாம் என்று எச்சரிக்கின்றனர், அடுத்த சில ஆண்டுகளில் அதிநவீன மாடல்களைப் பயிற்றுவிப்பதற்கான நோக்கங்களுக்காக இணையத்தில் பொதுவில் அணுகக்கூடிய நூல்கள் மற்றும் தகவல்களின் இருப்பு தீர்ந்துவிடும் என்று கணிப்புகள் தெரிவிக்கின்றன.
இந்த சவால் தொழில்நுட்பத்தின் வெற்றியின் நேரடி முரண்பாடாகத் தோன்றுகிறது. OpenAI, Google மற்றும் Anthropic ஆல் உருவாக்கப்பட்ட மாதிரிகள் மிகவும் சிக்கலானதாகவும் திறமையானதாகவும் மாறும் போது, உயர்தர, மாறுபட்ட தரவுகளின் பாரிய தொகுதிகளுக்கான தேவை அதிவேகமாக வளர்கிறது. ஹார்டுவேர் மேம்பாட்டில் என்விடியா மற்றும் ஓப்பன் சோர்ஸ் அப்ளிகேஷன்களில் மெட்டா போன்ற பந்தயத்தில் முன்னணியில் இருக்கும் நிறுவனங்கள், பரிணாமம் தேக்கமடையாமல் இருப்பதை உறுதிசெய்ய, தங்கள் படைப்புகளை வளர்ப்பதில் சவாலை எதிர்கொள்கின்றன.
இந்த சூழ்நிலை தொழில்துறையை ஒரு மூலோபாய குறுக்கு வழியில் வைக்கிறது, பயிற்சி முறைகளை மறுமதிப்பீடு செய்ய கட்டாயப்படுத்துகிறது மற்றும் சாத்தியமான மாற்றுகளுக்கான தேடலைத் தூண்டுகிறது. AI அமைப்புகளின் துல்லியம் மற்றும் பாதுகாப்பை சமரசம் செய்யாமல், அதிக தரவுகளை கண்டுபிடிப்பதில் மட்டும் தீர்வு இல்லை, ஆனால் ஏற்கனவே உள்ள வளங்களைப் பயன்படுத்துவதற்கும் புதிய செயற்கைத் தகவல்களை உருவாக்குவதற்கும் சிறந்த, திறமையான வழிகளை உருவாக்குவதில் உள்ளது.
விரைவுபடுத்தப்பட்ட வெற்றியின் முரண்பாடு
2025 ஆம் ஆண்டு, கார்ப்பரேட் சூழலில் செயற்கை நுண்ணறிவை ஒரு தவிர்க்க முடியாத உற்பத்திக் கருவியாக ஒருங்கிணைப்பதற்கான ஒரு மைல்கல்லாக இருந்தது, டைம் இதழின் “ஆண்டின் சிறந்த நபர்” என்று அதன் கட்டிடக் கலைஞர்களை அங்கீகரிப்பதில் உச்சக்கட்டமாக இருந்தது. என்விடியாவின் ஜென்சன் ஹுவாங் மற்றும் ஓபன்ஏஐயின் சாம் ஆல்ட்மேன் போன்ற தலைவர்கள், AI சோதனை முயற்சியில் இருந்து செயல்திறன் மற்றும் புதுமையின் தூணாக மாறிய ஒரு சகாப்தத்தை இயக்கியதற்காக கொண்டாடப்பட்டது. இந்த காலகட்டத்தில், என்விடியா அதன் சிப் உற்பத்தியை நான்கு மடங்காக உயர்த்தியது, அதன் சொந்த செயல்முறைகளை மேம்படுத்த AI கருவிகளை உள்நாட்டில் பயன்படுத்தியது. அதே நேரத்தில், ஆந்த்ரோபிக் நிறுவனத்தில் இருந்து கிளாட் போன்ற மேம்பட்ட மாதிரிகள், தங்கள் சொந்த குறியீட்டில் 90% வரை எழுதும் திறனை நிரூபித்தன, சுயாட்சி மற்றும் திறனில் ஒரு பாய்ச்சலைக் காட்டுகின்றன. இந்த ஏற்றம் மகத்தான முதலீடுகளால் ஆதரிக்கப்பட்டது, அமேசான், மைக்ரோசாப்ட் மற்றும் கூகுள் போன்ற தொழில்நுட்ப ஜாம்பவான்கள் தரவு மைய உள்கட்டமைப்பில் 370 பில்லியன் டாலர்கள் ஒருங்கிணைந்த முதலீட்டை அறிவித்தனர். எவ்வாறாயினும், இந்த பாரிய விரிவாக்கம், தரவுக்கான தேவையை இப்போது எதிர்கால முன்னேற்றத்தையே அச்சுறுத்தும் நிலைக்கு விரைவுபடுத்தியது, வெற்றி அதன் மிகப்பெரிய சவாலை உருவாக்கிய ஒரு சூழ்நிலையை உருவாக்குகிறது.
உயர்தர தரவுகளின் உடனடி பற்றாக்குறை
விரிவான ஆய்வுகள் கவலையளிக்கும் காலவரிசையை சுட்டிக்காட்டுகின்றன. 2026 மற்றும் 2032 க்கு இடையில், அதிநவீன மொழி மாதிரிகளைப் பயிற்றுவிப்பதற்குத் தேவையான உயர்தர மனித நூல்களின் கையிருப்பு, சார்பு அல்லது தவறுகளை அறிமுகப்படுத்தாமல் முற்றிலும் தீர்ந்துவிடும் என்பது கணிப்பு.
வழங்கலுக்கும் தேவைக்கும் இடையிலான வேறுபாடு நிலைமையை மோசமாக்குகிறது. AI பயிற்சிக்கான தரவுகளின் தேவை ஆண்டுதோறும் இரட்டிப்பாகிறது, இணையத்தில் புதிய தரமான பொது உள்ளடக்கத்தின் வளர்ச்சி வருடத்திற்கு சுமார் 10% என மதிப்பிடப்படும் மிகவும் மெதுவான வேகத்தில் தொடர்கிறது. இந்த இடைவெளியானது தற்போதைய வளர்ச்சி மாதிரியை நடுத்தர காலத்தில் நீடிக்க முடியாததாக ஆக்குகிறது.
குறைந்த-தரமான தரவு நீண்ட காலத்திற்குக் கிடைக்கலாம், ஒருவேளை 2050 வரை, இது குறிப்பிடத்தக்க முன்னேற்றங்களை ஏற்படுத்த போதுமானதாக இல்லை மற்றும் மாதிரியின் செயல்திறனை சமரசம் செய்யலாம். தற்போதைய மதிப்பீடுகள், உயர்தர தரவுகளின் பயனுள்ள ஸ்டாக் சுமார் 300 டிரில்லியன் டோக்கன்கள் என்று குறிப்பிடுகின்றன, இது விரைவாக நுகரப்படுகிறது.
விஷயங்களை மேலும் சிக்கலாக்கும் வகையில், பதிப்புரிமைக் கவலைகள் காரணமாக இயங்குதளங்களும் உள்ளடக்கம் வைத்திருப்பவர்களும் கடுமையான கட்டுப்பாடுகளை விதிக்கின்றனர். இந்த சட்டத் தடையானது பரந்த அளவிலான தகவல் களஞ்சியங்களுக்கான அணுகலைக் கட்டுப்படுத்துகிறது, மேலும் பயிற்சிப் பொருட்களைப் பெறுவதற்கு தொழில்துறை புதிய எல்லைகளைத் தேடுவதை கட்டாயப்படுத்துகிறது.
தகவல் நெருக்கடிக்கு புதுமையான தீர்வுகள்
பாரம்பரிய ஆதாரங்களின் உடனடித் தேய்மானத்தை எதிர்கொள்ளும் வகையில், AI தொழில்துறையானது, முக்கிய தணிப்பு உத்திகளில் ஒன்றாக செயற்கை தரவு உருவாக்கத்திற்கு மாறுகிறது. இந்த அணுகுமுறையானது நிஜ உலகத் தகவலை உருவகப்படுத்தும் புதிய, செயற்கையான தரவுத் தொகுப்புகளை உருவாக்க ஏற்கனவே பயிற்சி பெற்ற AI மாதிரிகளைப் பயன்படுத்துகிறது. மனிதத் தரவைச் சார்ந்து இல்லாமல் மருத்துவ நோயறிதல் அல்லது தன்னாட்சி ஓட்டுதல் போன்ற சிக்கலான பணிகளில் அமைப்புகளைப் பயிற்றுவிப்பதற்காக குறிப்பிட்ட மற்றும் தனிப்பயனாக்கப்பட்ட காட்சிகளை உருவாக்க இந்த நுட்பம் அனுமதிக்கிறது. இருப்பினும், இந்தத் தீர்வுக்கு தீவிர கவனிப்பு தேவைப்படுகிறது, ஏனெனில் மற்ற இயந்திரங்களைப் பயிற்றுவிப்பதற்காக இயந்திரங்களால் உருவாக்கப்பட்ட தரவை அதிகமாகப் பயன்படுத்துவது தரச் சிதைவின் நிகழ்வுக்கு வழிவகுக்கும், அங்கு மாதிரிகள் தங்கள் சொந்த பிழைகள் மற்றும் சார்புகளை மீண்டும் மீண்டும் அதிகரிக்கத் தொடங்குகின்றன, யதார்த்தத்துடன் தொடர்பை இழக்கின்றன.
செயற்கைத் தரவைத் தவிர, பிற அணுகுமுறைகள் ஏற்கனவே உள்ள வளங்களின் பயன்பாட்டை மேம்படுத்த இழுவையைப் பெறுகின்றன. ஸ்மால்-ஷாட் கற்றல் மற்றும் பரிமாற்றக் கற்றல் போன்ற நுட்பங்கள், முன் பயிற்சி பெற்ற அமைப்புகளிலிருந்து ஒருங்கிணைக்கப்பட்ட அறிவின் அடிப்படையில் புதிய மாதிரிகளை உருவாக்க அனுமதிக்கின்றன, இது புதிய தகவல்களின் பரந்த அளவிலான தேவையை வெகுவாகக் குறைக்கிறது. புதுமையின் மற்றொரு முன்னோடி பாடத்திட்டக் கற்றல் ஆகும், இது ஒரு தருக்க வரிசையில் பயிற்சி தரவை, எளிமையானது முதல் மிகவும் சிக்கலானது வரை ஒழுங்கமைக்கிறது, இதனால் மாதிரி மிகவும் திறமையாகவும் புத்திசாலித்தனமாகவும் கற்றுக்கொள்கிறது. இணையாக, உயர்தர தனியார் மற்றும் ஆஃப்லைன் தரவுக் களஞ்சியங்களுக்கான அணுகலைப் பெற ஆராய்ச்சி நிறுவனங்கள் மற்றும் நிறுவனங்களுடன் நெறிமுறை ஒத்துழைப்புகள் மற்றும் கூட்டாண்மைகள் உருவாக்கப்படுகின்றன, இது தொழில்நுட்பத்தின் தொடர்ச்சியான முன்னேற்றத்திற்குத் தேவையான பன்முகத்தன்மை மற்றும் வலுவான தன்மையை உறுதி செய்கிறது.
ஒரு மூலோபாய முன்னுரிமையாக தரம்
AI க்கான போட்டி பல நிறுவனங்களில் ஒரு பாதிப்பை வெளிப்படுத்தியுள்ளது: அவற்றின் உள் தரவுத்தளங்களின் மோசமான தரம். 2025 ஆம் ஆண்டில், பெரிய அளவிலான தகவல்களை வைத்திருப்பது மட்டும் போதாது என்பது தெளிவாகியது. பணிநீக்கம், காலாவதியான தரவு மற்றும் தரநிலைப்படுத்தல் இல்லாமை போன்ற சிக்கல்கள் செயற்கை நுண்ணறிவு தீர்வுகளை திறம்பட செயல்படுத்துவதற்கு பெரும் தடைகளாக உள்ளன.
இந்த உணர்தல் ஒரு கலாச்சார மாற்றத்தை ஏற்படுத்தியது, நிறுவனங்கள் தரவு நிர்வாகம் மற்றும் க்யூரேஷனுக்கு முன்னுரிமை அளிக்கத் தொடங்கின. எந்தவொரு எதிர்கால முன்னேற்றத்திற்கும் ஒரு முன்நிபந்தனையாகக் கருதப்படும் உள் தகவல்களைச் சுத்தம் செய்வதும் ஒழுங்கமைப்பதும் அத்தியாவசியமான செயல்களாகிவிட்டன. தகவல் தொழில்நுட்பம், இணக்கம் மற்றும் தரவு பகுப்பாய்வு துறைகள், மூலத் தரவை மதிப்புமிக்க மூலோபாய சொத்துக்களாக மாற்றுவதற்கு தடையின்றி ஒத்துழைக்கத் தொடங்கியுள்ளன, AI அவர்களின் பயிற்சி ஆதாரங்களின் பலம் மற்றும் பலவீனங்கள் இரண்டையும் பெருக்குகிறது.
கணக்கீட்டுத் திறனை விரிவுபடுத்துதல்
சிறப்பு சில்லுகளின் தொடர்ச்சியான மேம்பாடு மற்றும் மென்பொருள் அல்காரிதம்களின் மேம்படுத்தல் ஆகியவை தரவு வரம்புகளை கடக்க ஒரு முக்கியமான முன்பக்கத்தை பிரதிபலிக்கிறது. இந்த கண்டுபிடிப்புகள் பயிற்சி தகவலின் அளவின் விகிதாசார அதிகரிப்பு இல்லாமல் குறிப்பிடத்தக்க செயல்திறன் ஆதாயங்களை அனுமதித்துள்ளன, ஏற்கனவே உள்ள தரவுகளிலிருந்து அதிகபட்ச அறிவைப் பிரித்தெடுப்பதில் கவனம் செலுத்துகின்றன.
மேம்பட்ட குளிரூட்டும் தீர்வுகள் மற்றும் புதுப்பிக்கத்தக்க ஆதாரங்களின் அதிகரித்து வரும் பயன்பாடு ஆகியவற்றால் ஆதரிக்கப்படும் அதிக ஆற்றல் திறனுடன் நிகழ்நேர தகவலைச் செயலாக்க தரவு மைய உள்கட்டமைப்புகள் மேம்படுத்தப்படுகின்றன. கணக்கீட்டு சக்தி மற்றும் ஆற்றல் நிலைத்தன்மை ஆகியவற்றுக்கு இடையேயான இந்த சமநிலையானது துறையின் புதிய நடைமுறை வரம்புகளை வரையறுக்கிறது.
துறையில் வளர்ந்து வரும் மாற்றுகள்
மூல அளவிடுதல் மாதிரியிலிருந்து சிறந்த, நிலையான அணுகுமுறைக்கு மாறுவது முழு வீச்சில் உள்ளது. பயிற்சி முறைகளைப் பயன்படுத்துவதிலும் வளங்களை மேம்படுத்துவதிலும் உள்ள படைப்பாற்றல் இப்போது தரவைக் குவிப்பதை விட முக்கியமானது என்பதை தொழில்துறை அங்கீகரிக்கிறது.
OpenAI மற்றும் Google இன் நிர்வாகிகள் உட்பட தொழில்துறை தலைவர்கள், பொது இணையத் தரவை நம்புவதற்கு அப்பால் செல்லும் புதிய முன்னுதாரணங்களை ஆராய வேண்டியதன் அவசியத்தை ஏற்கனவே சமிக்ஞை செய்துள்ளனர். மூலோபாய கூட்டாண்மை மூலம் பெறப்பட்ட தனிப்பட்ட தரவுகளுடன் மாதிரிகளைப் பயிற்றுவிப்பதற்கான முயற்சிகள் விரைவாக முன்னேறி வருகின்றன, உடனடி கட்டுப்பாடுகளை எதிர்கொண்டாலும் முன்னேற்றங்களின் வேகத்தைத் தக்கவைக்க முயல்கின்றன.
தற்போதைய செயற்கை நுண்ணறிவு நிலப்பரப்பில் ஸ்மார்ட் உள்கட்டமைப்பு மற்றும் ஒழுக்கமான தரவு மேலாண்மை ஆகியவை முக்கிய போட்டி நன்மையாக மாறியுள்ளன என்ற பார்வையை இந்த முயற்சிகள் வலுப்படுத்துகின்றன.
எதிர்கால பயிற்சியில் சவால்கள்
தொழில்துறையின் கவனம் சோதனைக் கட்டத்தில் இருந்து உலக அளவில் நடைமுறை, நெகிழ்ச்சியான செயலாக்கத்திற்கு மாறுகிறது. வரவிருக்கும் ஆண்டுகளில் AI இன் முதிர்ச்சி அதன் திறனால் மட்டும் வரையறுக்கப்படும், ஆனால் உண்மையான செயல்முறைகளில் அதன் திறமையான மற்றும் குறைந்த விலை ஒருங்கிணைப்பு, ஆளுகை மற்றும் உகந்த செயல்பாட்டின் முக்கியத்துவத்தை வலியுறுத்துகிறது.
கணக்கீட்டு செயல்திறனில் புதுமைகள் மற்றும் செயற்கை மற்றும் க்யூரேட்டட் தரவுகளின் பயன்பாடு ஆகியவை முன்னேற்றத்தை விரிவாக்குவதற்கு முக்கியமாக இருக்கும். செயற்கை நுண்ணறிவின் எதிர்காலம், தரவுகளின் எல்லையற்ற விரிவாக்கம் மற்றும் பெருகிய முறையில் தெளிவான மற்றும் வரையறுக்கப்பட்ட வள எல்லைகளுக்குள் புதுமை மற்றும் செயல்படும் திறனைப் பொறுத்தது.

