News (TA)

பயிற்சி தரவுகள் தீர்ந்துபோவது, வரும் ஆண்டுகளில் செயற்கை நுண்ணறிவின் எதிர்காலத்தை அச்சுறுத்துகிறது

Por Maria

Publicado em 21 de janeiro de 2026

inteligência artificial - Digineer Station/Shutterstock.com

Siga o Mix Vale no GoogleVeja as notícias do Mundo com destaque nas buscas do GoogleAdicionar

செயற்கை நுண்ணறிவின் அதிவேக முன்னேற்றம், உலகளாவிய தொழில்நுட்ப நிலப்பரப்பை சீர்குலைக்கும் கண்டுபிடிப்புகளுடன் குறிக்கிறது, இது ஒரு அடிப்படை தடையுடன் மோத உள்ளது: பயிற்சிக்கான உயர்தர தரவு பற்றாக்குறை. தொழில் வல்லுநர்கள் மற்றும் ஆராய்ச்சியாளர்கள் தற்போதைய வளர்ச்சியின் வேகம் தாங்க முடியாததாக இருக்கலாம் என்று எச்சரிக்கின்றனர், அடுத்த சில ஆண்டுகளில் அதிநவீன மாடல்களைப் பயிற்றுவிப்பதற்கான நோக்கங்களுக்காக இணையத்தில் பொதுவில் அணுகக்கூடிய நூல்கள் மற்றும் தகவல்களின் இருப்பு தீர்ந்துவிடும் என்று கணிப்புகள் தெரிவிக்கின்றன.

இந்த சவால் தொழில்நுட்பத்தின் வெற்றியின் நேரடி முரண்பாடாகத் தோன்றுகிறது. OpenAI, Google மற்றும் Anthropic ஆல் உருவாக்கப்பட்ட மாதிரிகள் மிகவும் சிக்கலானதாகவும் திறமையானதாகவும் மாறும் போது, உயர்தர, மாறுபட்ட தரவுகளின் பாரிய தொகுதிகளுக்கான தேவை அதிவேகமாக வளர்கிறது. ஹார்டுவேர் மேம்பாட்டில் என்விடியா மற்றும் ஓப்பன் சோர்ஸ் அப்ளிகேஷன்களில் மெட்டா போன்ற பந்தயத்தில் முன்னணியில் இருக்கும் நிறுவனங்கள், பரிணாமம் தேக்கமடையாமல் இருப்பதை உறுதிசெய்ய, தங்கள் படைப்புகளை வளர்ப்பதில் சவாலை எதிர்கொள்கின்றன.

இந்த சூழ்நிலை தொழில்துறையை ஒரு மூலோபாய குறுக்கு வழியில் வைக்கிறது, பயிற்சி முறைகளை மறுமதிப்பீடு செய்ய கட்டாயப்படுத்துகிறது மற்றும் சாத்தியமான மாற்றுகளுக்கான தேடலைத் தூண்டுகிறது. AI அமைப்புகளின் துல்லியம் மற்றும் பாதுகாப்பை சமரசம் செய்யாமல், அதிக தரவுகளை கண்டுபிடிப்பதில் மட்டும் தீர்வு இல்லை, ஆனால் ஏற்கனவே உள்ள வளங்களைப் பயன்படுத்துவதற்கும் புதிய செயற்கைத் தகவல்களை உருவாக்குவதற்கும் சிறந்த, திறமையான வழிகளை உருவாக்குவதில் உள்ளது.

விரைவுபடுத்தப்பட்ட வெற்றியின் முரண்பாடு

2025 ஆம் ஆண்டு, கார்ப்பரேட் சூழலில் செயற்கை நுண்ணறிவை ஒரு தவிர்க்க முடியாத உற்பத்திக் கருவியாக ஒருங்கிணைப்பதற்கான ஒரு மைல்கல்லாக இருந்தது, டைம் இதழின் “ஆண்டின் சிறந்த நபர்” என்று அதன் கட்டிடக் கலைஞர்களை அங்கீகரிப்பதில் உச்சக்கட்டமாக இருந்தது. என்விடியாவின் ஜென்சன் ஹுவாங் மற்றும் ஓபன்ஏஐயின் சாம் ஆல்ட்மேன் போன்ற தலைவர்கள், AI சோதனை முயற்சியில் இருந்து செயல்திறன் மற்றும் புதுமையின் தூணாக மாறிய ஒரு சகாப்தத்தை இயக்கியதற்காக கொண்டாடப்பட்டது. இந்த காலகட்டத்தில், என்விடியா அதன் சிப் உற்பத்தியை நான்கு மடங்காக உயர்த்தியது, அதன் சொந்த செயல்முறைகளை மேம்படுத்த AI கருவிகளை உள்நாட்டில் பயன்படுத்தியது. அதே நேரத்தில், ஆந்த்ரோபிக் நிறுவனத்தில் இருந்து கிளாட் போன்ற மேம்பட்ட மாதிரிகள், தங்கள் சொந்த குறியீட்டில் 90% வரை எழுதும் திறனை நிரூபித்தன, சுயாட்சி மற்றும் திறனில் ஒரு பாய்ச்சலைக் காட்டுகின்றன. இந்த ஏற்றம் மகத்தான முதலீடுகளால் ஆதரிக்கப்பட்டது, அமேசான், மைக்ரோசாப்ட் மற்றும் கூகுள் போன்ற தொழில்நுட்ப ஜாம்பவான்கள் தரவு மைய உள்கட்டமைப்பில் 370 பில்லியன் டாலர்கள் ஒருங்கிணைந்த முதலீட்டை அறிவித்தனர். எவ்வாறாயினும், இந்த பாரிய விரிவாக்கம், தரவுக்கான தேவையை இப்போது எதிர்கால முன்னேற்றத்தையே அச்சுறுத்தும் நிலைக்கு விரைவுபடுத்தியது, வெற்றி அதன் மிகப்பெரிய சவாலை உருவாக்கிய ஒரு சூழ்நிலையை உருவாக்குகிறது.

உயர்தர தரவுகளின் உடனடி பற்றாக்குறை

விரிவான ஆய்வுகள் கவலையளிக்கும் காலவரிசையை சுட்டிக்காட்டுகின்றன. 2026 மற்றும் 2032 க்கு இடையில், அதிநவீன மொழி மாதிரிகளைப் பயிற்றுவிப்பதற்குத் தேவையான உயர்தர மனித நூல்களின் கையிருப்பு, சார்பு அல்லது தவறுகளை அறிமுகப்படுத்தாமல் முற்றிலும் தீர்ந்துவிடும் என்பது கணிப்பு.

[[MVG_PROTECTED_BLOCK_0]

வழங்கலுக்கும் தேவைக்கும் இடையிலான வேறுபாடு நிலைமையை மோசமாக்குகிறது. AI பயிற்சிக்கான தரவுகளின் தேவை ஆண்டுதோறும் இரட்டிப்பாகிறது, இணையத்தில் புதிய தரமான பொது உள்ளடக்கத்தின் வளர்ச்சி வருடத்திற்கு சுமார் 10% என மதிப்பிடப்படும் மிகவும் மெதுவான வேகத்தில் தொடர்கிறது. இந்த இடைவெளியானது தற்போதைய வளர்ச்சி மாதிரியை நடுத்தர காலத்தில் நீடிக்க முடியாததாக ஆக்குகிறது.

குறைந்த-தரமான தரவு நீண்ட காலத்திற்குக் கிடைக்கலாம், ஒருவேளை 2050 வரை, இது குறிப்பிடத்தக்க முன்னேற்றங்களை ஏற்படுத்த போதுமானதாக இல்லை மற்றும் மாதிரியின் செயல்திறனை சமரசம் செய்யலாம். தற்போதைய மதிப்பீடுகள், உயர்தர தரவுகளின் பயனுள்ள ஸ்டாக் சுமார் 300 டிரில்லியன் டோக்கன்கள் என்று குறிப்பிடுகின்றன, இது விரைவாக நுகரப்படுகிறது.

விஷயங்களை மேலும் சிக்கலாக்கும் வகையில், பதிப்புரிமைக் கவலைகள் காரணமாக இயங்குதளங்களும் உள்ளடக்கம் வைத்திருப்பவர்களும் கடுமையான கட்டுப்பாடுகளை விதிக்கின்றனர். இந்த சட்டத் தடையானது பரந்த அளவிலான தகவல் களஞ்சியங்களுக்கான அணுகலைக் கட்டுப்படுத்துகிறது, மேலும் பயிற்சிப் பொருட்களைப் பெறுவதற்கு தொழில்துறை புதிய எல்லைகளைத் தேடுவதை கட்டாயப்படுத்துகிறது.

தகவல் நெருக்கடிக்கு புதுமையான தீர்வுகள்

பாரம்பரிய ஆதாரங்களின் உடனடித் தேய்மானத்தை எதிர்கொள்ளும் வகையில், AI தொழில்துறையானது, முக்கிய தணிப்பு உத்திகளில் ஒன்றாக செயற்கை தரவு உருவாக்கத்திற்கு மாறுகிறது. இந்த அணுகுமுறையானது நிஜ உலகத் தகவலை உருவகப்படுத்தும் புதிய, செயற்கையான தரவுத் தொகுப்புகளை உருவாக்க ஏற்கனவே பயிற்சி பெற்ற AI மாதிரிகளைப் பயன்படுத்துகிறது. மனிதத் தரவைச் சார்ந்து இல்லாமல் மருத்துவ நோயறிதல் அல்லது தன்னாட்சி ஓட்டுதல் போன்ற சிக்கலான பணிகளில் அமைப்புகளைப் பயிற்றுவிப்பதற்காக குறிப்பிட்ட மற்றும் தனிப்பயனாக்கப்பட்ட காட்சிகளை உருவாக்க இந்த நுட்பம் அனுமதிக்கிறது. இருப்பினும், இந்தத் தீர்வுக்கு தீவிர கவனிப்பு தேவைப்படுகிறது, ஏனெனில் மற்ற இயந்திரங்களைப் பயிற்றுவிப்பதற்காக இயந்திரங்களால் உருவாக்கப்பட்ட தரவை அதிகமாகப் பயன்படுத்துவது தரச் சிதைவின் நிகழ்வுக்கு வழிவகுக்கும், அங்கு மாதிரிகள் தங்கள் சொந்த பிழைகள் மற்றும் சார்புகளை மீண்டும் மீண்டும் அதிகரிக்கத் தொடங்குகின்றன, யதார்த்தத்துடன் தொடர்பை இழக்கின்றன.

செயற்கைத் தரவைத் தவிர, பிற அணுகுமுறைகள் ஏற்கனவே உள்ள வளங்களின் பயன்பாட்டை மேம்படுத்த இழுவையைப் பெறுகின்றன. ஸ்மால்-ஷாட் கற்றல் மற்றும் பரிமாற்றக் கற்றல் போன்ற நுட்பங்கள், முன் பயிற்சி பெற்ற அமைப்புகளிலிருந்து ஒருங்கிணைக்கப்பட்ட அறிவின் அடிப்படையில் புதிய மாதிரிகளை உருவாக்க அனுமதிக்கின்றன, இது புதிய தகவல்களின் பரந்த அளவிலான தேவையை வெகுவாகக் குறைக்கிறது. புதுமையின் மற்றொரு முன்னோடி பாடத்திட்டக் கற்றல் ஆகும், இது ஒரு தருக்க வரிசையில் பயிற்சி தரவை, எளிமையானது முதல் மிகவும் சிக்கலானது வரை ஒழுங்கமைக்கிறது, இதனால் மாதிரி மிகவும் திறமையாகவும் புத்திசாலித்தனமாகவும் கற்றுக்கொள்கிறது. இணையாக, உயர்தர தனியார் மற்றும் ஆஃப்லைன் தரவுக் களஞ்சியங்களுக்கான அணுகலைப் பெற ஆராய்ச்சி நிறுவனங்கள் மற்றும் நிறுவனங்களுடன் நெறிமுறை ஒத்துழைப்புகள் மற்றும் கூட்டாண்மைகள் உருவாக்கப்படுகின்றன, இது தொழில்நுட்பத்தின் தொடர்ச்சியான முன்னேற்றத்திற்குத் தேவையான பன்முகத்தன்மை மற்றும் வலுவான தன்மையை உறுதி செய்கிறது.

ஒரு மூலோபாய முன்னுரிமையாக தரம்

AI க்கான போட்டி பல நிறுவனங்களில் ஒரு பாதிப்பை வெளிப்படுத்தியுள்ளது: அவற்றின் உள் தரவுத்தளங்களின் மோசமான தரம். 2025 ஆம் ஆண்டில், பெரிய அளவிலான தகவல்களை வைத்திருப்பது மட்டும் போதாது என்பது தெளிவாகியது. பணிநீக்கம், காலாவதியான தரவு மற்றும் தரநிலைப்படுத்தல் இல்லாமை போன்ற சிக்கல்கள் செயற்கை நுண்ணறிவு தீர்வுகளை திறம்பட செயல்படுத்துவதற்கு பெரும் தடைகளாக உள்ளன.

இந்த உணர்தல் ஒரு கலாச்சார மாற்றத்தை ஏற்படுத்தியது, நிறுவனங்கள் தரவு நிர்வாகம் மற்றும் க்யூரேஷனுக்கு முன்னுரிமை அளிக்கத் தொடங்கின. எந்தவொரு எதிர்கால முன்னேற்றத்திற்கும் ஒரு முன்நிபந்தனையாகக் கருதப்படும் உள் தகவல்களைச் சுத்தம் செய்வதும் ஒழுங்கமைப்பதும் அத்தியாவசியமான செயல்களாகிவிட்டன. தகவல் தொழில்நுட்பம், இணக்கம் மற்றும் தரவு பகுப்பாய்வு துறைகள், மூலத் தரவை மதிப்புமிக்க மூலோபாய சொத்துக்களாக மாற்றுவதற்கு தடையின்றி ஒத்துழைக்கத் தொடங்கியுள்ளன, AI அவர்களின் பயிற்சி ஆதாரங்களின் பலம் மற்றும் பலவீனங்கள் இரண்டையும் பெருக்குகிறது.

கணக்கீட்டுத் திறனை விரிவுபடுத்துதல்

சிறப்பு சில்லுகளின் தொடர்ச்சியான மேம்பாடு மற்றும் மென்பொருள் அல்காரிதம்களின் மேம்படுத்தல் ஆகியவை தரவு வரம்புகளை கடக்க ஒரு முக்கியமான முன்பக்கத்தை பிரதிபலிக்கிறது. இந்த கண்டுபிடிப்புகள் பயிற்சி தகவலின் அளவின் விகிதாசார அதிகரிப்பு இல்லாமல் குறிப்பிடத்தக்க செயல்திறன் ஆதாயங்களை அனுமதித்துள்ளன, ஏற்கனவே உள்ள தரவுகளிலிருந்து அதிகபட்ச அறிவைப் பிரித்தெடுப்பதில் கவனம் செலுத்துகின்றன.

மேம்பட்ட குளிரூட்டும் தீர்வுகள் மற்றும் புதுப்பிக்கத்தக்க ஆதாரங்களின் அதிகரித்து வரும் பயன்பாடு ஆகியவற்றால் ஆதரிக்கப்படும் அதிக ஆற்றல் திறனுடன் நிகழ்நேர தகவலைச் செயலாக்க தரவு மைய உள்கட்டமைப்புகள் மேம்படுத்தப்படுகின்றன. கணக்கீட்டு சக்தி மற்றும் ஆற்றல் நிலைத்தன்மை ஆகியவற்றுக்கு இடையேயான இந்த சமநிலையானது துறையின் புதிய நடைமுறை வரம்புகளை வரையறுக்கிறது.

துறையில் வளர்ந்து வரும் மாற்றுகள்

மூல அளவிடுதல் மாதிரியிலிருந்து சிறந்த, நிலையான அணுகுமுறைக்கு மாறுவது முழு வீச்சில் உள்ளது. பயிற்சி முறைகளைப் பயன்படுத்துவதிலும் வளங்களை மேம்படுத்துவதிலும் உள்ள படைப்பாற்றல் இப்போது தரவைக் குவிப்பதை விட முக்கியமானது என்பதை தொழில்துறை அங்கீகரிக்கிறது.

OpenAI மற்றும் Google இன் நிர்வாகிகள் உட்பட தொழில்துறை தலைவர்கள், பொது இணையத் தரவை நம்புவதற்கு அப்பால் செல்லும் புதிய முன்னுதாரணங்களை ஆராய வேண்டியதன் அவசியத்தை ஏற்கனவே சமிக்ஞை செய்துள்ளனர். மூலோபாய கூட்டாண்மை மூலம் பெறப்பட்ட தனிப்பட்ட தரவுகளுடன் மாதிரிகளைப் பயிற்றுவிப்பதற்கான முயற்சிகள் விரைவாக முன்னேறி வருகின்றன, உடனடி கட்டுப்பாடுகளை எதிர்கொண்டாலும் முன்னேற்றங்களின் வேகத்தைத் தக்கவைக்க முயல்கின்றன.

தற்போதைய செயற்கை நுண்ணறிவு நிலப்பரப்பில் ஸ்மார்ட் உள்கட்டமைப்பு மற்றும் ஒழுக்கமான தரவு மேலாண்மை ஆகியவை முக்கிய போட்டி நன்மையாக மாறியுள்ளன என்ற பார்வையை இந்த முயற்சிகள் வலுப்படுத்துகின்றன.

எதிர்கால பயிற்சியில் சவால்கள்

தொழில்துறையின் கவனம் சோதனைக் கட்டத்தில் இருந்து உலக அளவில் நடைமுறை, நெகிழ்ச்சியான செயலாக்கத்திற்கு மாறுகிறது. வரவிருக்கும் ஆண்டுகளில் AI இன் முதிர்ச்சி அதன் திறனால் மட்டும் வரையறுக்கப்படும், ஆனால் உண்மையான செயல்முறைகளில் அதன் திறமையான மற்றும் குறைந்த விலை ஒருங்கிணைப்பு, ஆளுகை மற்றும் உகந்த செயல்பாட்டின் முக்கியத்துவத்தை வலியுறுத்துகிறது.

கணக்கீட்டு செயல்திறனில் புதுமைகள் மற்றும் செயற்கை மற்றும் க்யூரேட்டட் தரவுகளின் பயன்பாடு ஆகியவை முன்னேற்றத்தை விரிவாக்குவதற்கு முக்கியமாக இருக்கும். செயற்கை நுண்ணறிவின் எதிர்காலம், தரவுகளின் எல்லையற்ற விரிவாக்கம் மற்றும் பெருகிய முறையில் தெளிவான மற்றும் வரையறுக்கப்பட்ட வள எல்லைகளுக்குள் புதுமை மற்றும் செயல்படும் திறனைப் பொறுத்தது.

TagAI இன் எதிர்காலம், செயற்கை நுண்ணறிவு, தரவு சோர்வு, தொழில்நுட்பம், புதுமை