செயற்கை நுண்ணறிவுத் துறை புதிய சிக்கலான மாதிரிகளைப் பயிற்றுவிக்க உடனடி தரவு நெருக்கடியை எதிர்கொள்கிறது

    Categories: News (TA)
inteligência artificial

inteligência artificial - Digineer Station/Shutterstock.com

உலகளாவிய தொழில்நுட்ப நிலப்பரப்பைக் குறித்த செயற்கை நுண்ணறிவின் விரைவான விரிவாக்கம், கண்டுபிடிப்புகளின் வேகத்தை மறுவரையறை செய்யக்கூடிய ஒரு முக்கியமான தடையை நெருங்குகிறது. மேம்பட்ட மொழி மாதிரிகளைப் பயிற்றுவிப்பதற்குத் தேவையான உயர்தர பொதுத் தரவுகளின் அளவு தீர்ந்து வருவதாக தொழில் வல்லுநர்கள் மற்றும் ஆராய்ச்சியாளர்கள் எச்சரிக்கின்றனர். இந்தக் காட்சியானது, புதிய தகவல் மூலங்களைக் கண்டுபிடிப்பதற்கும் மேலும் திறமையான கற்றல் முறைகளை உருவாக்குவதற்கும் நிறுவனங்களுக்கு நேரத்துக்கு எதிரான போட்டியை உருவாக்குகிறது.

தற்போதைய முரண்பாடு என்னவென்றால், பெருகிய முறையில் அதிநவீன அமைப்புகளைப் பயிற்றுவிப்பதற்கான தரவுக்கான தேவை ஆண்டுதோறும் இரட்டிப்பாகிறது, இணையத்தில் புதிய தரமான மனித உள்ளடக்கத்தை உருவாக்குவது மிகவும் மெதுவான விகிதத்தில் வளர்கிறது, இது வருடத்திற்கு சுமார் 10% என மதிப்பிடப்பட்டுள்ளது. இந்த ஏற்றத்தாழ்வு வளர்ச்சியில் ஒரு பீடபூமியை உருவாக்க அச்சுறுத்துகிறது, இது ஒரு முன்னுதாரண மாற்றத்தை கட்டாயப்படுத்துகிறது, இது எளிமையான அளவிலான செயலாக்கம் மற்றும் தகவலின் அளவைத் தாண்டியது.

செயற்கை நுண்ணறிவு – புகைப்படம்: Owlie Productions/ Shutterstock.com

இந்த சவாலை எதிர்கொண்டு, OpenAI, Google மற்றும் Meta போன்ற தொழில்நுட்ப ஜாம்பவான்கள் புதுமையான தீர்வுகளுக்கான தேடலைத் தீவிரப்படுத்தி வருகின்றனர். உத்திகள் செயற்கைத் தரவை உருவாக்குவது முதல் குறைவான எடுத்துக்காட்டுகளிலிருந்து கற்றுக் கொள்ளும் வழிமுறைகளின் வளர்ச்சி வரையிலானது, AI இன் பரிணாம வளர்ச்சியில் ஒரு புதிய கட்டத்தைக் குறிக்கிறது, செயல்திறன் மற்றும் இருக்கும் வளங்களை மேம்படுத்துவதில் கவனம் செலுத்துகிறது.

பயிற்சி தரவு குறைப்பு பற்றிய கணிப்புகள்

இந்த ஆண்டு இறுதி மற்றும் 2032 ஆம் ஆண்டுக்குள் பொதுவில் கிடைக்கும் உயர்தர நூல்கள் மற்றும் படங்களின் இருப்பு தீர்ந்துவிடும் என்ற கணிப்புடன் சமீபத்திய ஆய்வுகள் கவலையளிக்கும் அடிவானத்தை சுட்டிக்காட்டுகின்றன. தற்போதைய மதிப்பீட்டின்படி சுமார் 300 டிரில்லியன் “டோக்கன்கள்” — டெக்ஸ்ட் அல்லது குறியீடு அலகுகள் — தரத்திற்காக சரிசெய்யப்பட்டு, மிக வேகமாக நுகரப்படும் மாதிரி. குறைந்த தரம் வாய்ந்த தரவு இந்த எல்லையை 2050 வரை நீட்டிக்க முடியும் என்றாலும், துல்லியம் மற்றும் சார்பு இல்லாமை ஆகியவற்றைக் கோரும் சுகாதாரம், நிதி மற்றும் பொறியியல் போன்ற சிக்கலான பகுதிகளில் குறிப்பிடத்தக்க முன்னேற்றங்களை ஏற்படுத்த இது போதுமானதாக இல்லை. பதிப்புரிமை காரணமாக உள்ளடக்கத்திற்கான அணுகல் அதிகரிப்பு சிக்கலை மேலும் மோசமாக்குகிறது, இந்த தொழில்நுட்பங்களைப் பயிற்றுவிக்க சட்டப்பூர்வமாகப் பயன்படுத்தப்படும் தகவல்களின் பிரபஞ்சத்தை கட்டுப்படுத்துகிறது.

உள்கட்டமைப்பு மற்றும் வன்பொருளில் பாரிய முதலீடுகள்

வளர்ந்து வரும் கம்ப்யூட்டிங் தேவைக்கு பதிலளிக்கும் விதமாக, அமேசான், மைக்ரோசாப்ட் மற்றும் கூகிள் உள்ளிட்ட முக்கிய சந்தை வீரர்கள், தரவு மைய உள்கட்டமைப்பில் $370 பில்லியனுக்கும் அதிகமான முதலீடுகளை அறிவித்துள்ளனர். இந்த மகத்தான விரிவாக்கமானது செயலாக்க திறனை அதிகரிப்பது மட்டுமல்லாமல், காற்று மற்றும் நீர் மின்சாரம் போன்ற புதுப்பிக்கத்தக்க எரிசக்தி ஆதாரங்களை அணுகக்கூடிய பிராந்தியங்களில் புதிய வசதிகளை உருவாக்குவதன் மூலம் ஆற்றல் செயல்திறனை மேம்படுத்துவதையும் நோக்கமாகக் கொண்டுள்ளது. முக்கிய பயன்பாடுகளுக்கான தேவையான உண்மையான நேரத்தில் தரவுகளின் தொகுதிகளை செயலாக்குவதை ஆதரிப்பதே இதன் நோக்கம்.

இணையாக, ஜென்சன் ஹுவாங் தலைமையிலான என்விடியா போன்ற நிறுவனங்கள், வடிவமைப்பு மற்றும் உற்பத்தியை விரைவுபடுத்த தங்கள் சொந்த AI கருவிகளைப் பயன்படுத்தி சிறப்பு சில்லுகளின் உற்பத்தியை நான்கு மடங்கு அதிகரித்துள்ளன. வன்பொருளின் இந்த முன்னேற்றங்கள் மாதிரிகள் மிகவும் திறமையானதாக மாறுவதற்கு அடிப்படையானவை, தரவு மற்றும் ஆற்றலின் விகிதாச்சாரத்தில் குறைந்த நுகர்வு மூலம் சிறந்த முடிவுகளைப் பெறுகின்றன. அல்காரிதமிக் ஆப்டிமைசேஷன் மற்றும் சிறந்த கம்ப்யூட்டிங் கட்டமைப்புகளின் மேம்பாடு ஆகியவை இந்த முயற்சிகளை நிறைவு செய்கின்றன.

ஒருங்கிணைந்த முன்னேற்றங்கள் மற்றும் AI இன் முதிர்ச்சி

நடைமுறை மற்றும் வணிக பயன்பாடுகளில் செயற்கை நுண்ணறிவின் முதிர்ச்சிக்கு கடந்த ஆண்டு ஒரு மைல்கல்லாக இருந்தது. குறியீட்டு முறை, சிக்கலான தரவு பகுப்பாய்வு மற்றும் செயல்முறை ஆட்டோமேஷன், பல்வேறு தொழில்களில் உற்பத்தித்திறனை அதிகரிப்பது போன்ற பணிகளில் உருவாக்கும் கருவிகள் இன்றியமையாத உதவியாளர்களாக மாறிவிட்டன. AI மாதிரிகள், Anthropic’s Claude போன்றவை, ஏற்கனவே 90% வரை தங்கள் சொந்த குறியீட்டை எழுதும் திறன் கொண்டவை, இது மென்பொருள் மேம்பாட்டு சுழற்சியை துரிதப்படுத்தும் சுயாட்சியின் அளவை நிரூபிக்கிறது.

ஸ்மார்ட்ஃபோன்கள் மற்றும் பெர்சனல் கம்ப்யூட்டர்கள் போன்ற எட்ஜ் கம்ப்யூட்டிங் சாதனங்களில் நேரடியாக AI மாடல்களை இயக்கும் திறன் மற்றொரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கிறது. இந்த அணுகுமுறை மறுமொழி வேகத்தை மேம்படுத்துகிறது மற்றும் முக்கியமாக, மேகக்கணிக்கு அனுப்ப வேண்டிய அவசியமின்றி முக்கியமான தகவலைச் செயலாக்குவதன் மூலம் தனியுரிமை மற்றும் பாதுகாப்பை அதிகரிக்கிறது. தங்கள் உள் தரவின் ஒழுக்கமான நிர்வாகத்தை ஏற்றுக்கொண்ட நிறுவனங்கள் மிகவும் பயனடைந்தன, AI தீர்வுகளை அவற்றின் குறிப்பிட்ட தேவைகளுக்கு ஏற்றவாறு சிறந்த முடிவுகளுடன் செயல்படுத்த நிர்வகிக்கின்றன.

தரவு தடையை சமாளிப்பதற்கான உத்திகள்

அதிகரித்து வரும் தகவல் பற்றாக்குறையை சமாளிக்க, தொழில்துறை பல மாற்று உத்திகளை தீவிரமாக ஆராய்ந்து வருகிறது. செயற்கைத் தரவைப் பயன்படுத்துவது முக்கியமானது, இது நிஜ உலகக் காட்சிகளை உருவகப்படுத்த மற்ற AI களால் செயற்கையாக உருவாக்கப்பட்ட தகவல் ஆகும். இந்த நுட்பம் தனிப்பயனாக்கப்பட்ட மற்றும் மாறுபட்ட பயிற்சித் தொகுப்புகளை உருவாக்க உங்களை அனுமதிக்கிறது, இருப்பினும் “மாடல் சிதைவை” தவிர்க்க கடுமையான கவனிப்பு தேவைப்படுகிறது, அங்கு AI அதன் சொந்த தவறுகளிலிருந்து ஒரு தீய சுழற்சியில் கற்றுக்கொள்கிறது.

மற்றொரு நம்பிக்கைக்குரிய அணுகுமுறை சில ஷாட் கற்றல் ஆகும், இது மிகச் சிறிய எண்ணிக்கையிலான எடுத்துக்காட்டுகளிலிருந்து அறிவைப் பொதுமைப்படுத்த மாதிரிகளைப் பயிற்றுவிக்கிறது. இந்த நுட்பம் பரிமாற்ற கற்றல் மூலம் பூர்த்தி செய்யப்படுகிறது, அங்கு ஒரு பெரிய அளவிலான தரவுகளில் முன் பயிற்சி பெற்ற மாதிரியானது சிறிய தரவுத் தொகுப்புடன் ஒரு குறிப்பிட்ட பணிக்காக மாற்றியமைக்கப்படுகிறது.

பாடத்திட்டக் கற்றலும் இடம் பெறுகிறது. இந்த முறையில், பயிற்சி தரவு மாதிரிக்கு தர்க்கரீதியான வரிசையில் வழங்கப்படுகிறது, எளிமையானது முதல் மிகவும் சிக்கலானது, மனித கற்றல் செயல்முறையைப் பிரதிபலிக்கிறது மற்றும் AI க்கு சிறந்த, வலுவான இணைப்புகளை உருவாக்க உதவுகிறது.

இறுதியாக, உயர்தர தனியார், ஆஃப்லைன் தரவு களஞ்சியங்களை அணுக ஆராய்ச்சி நிறுவனங்கள் மற்றும் நிறுவனங்களுடன் நெறிமுறை கூட்டாண்மைகள் உருவாக்கப்படுகின்றன. இணையத்தில் பொதுவில் கிடைக்காத இந்தத் தொகுப்புகள், க்யூரேட்டட் மற்றும் பிரத்யேகத் தகவல்களின் மதிப்புமிக்க ஆதாரத்தைக் குறிக்கின்றன.

புதிய முன்னுரிமையாக அளவை விட தரம்

அதிக தரவுகளுக்கான போட்டி பல நிறுவனங்களில் ஒரு முக்கியமான குறைபாட்டை வெளிப்படுத்தியுள்ளது: அவற்றின் உள் தரவுத்தளங்களின் மோசமான தரம். கடந்த ஆண்டில், பல நிறுவனங்கள் தங்கள் களஞ்சியங்கள் தேவையற்ற, காலாவதியான அல்லது மோசமாக வடிவமைக்கப்பட்ட தகவல்களால் நிரம்பியுள்ளன என்பதைக் கண்டறிந்துள்ளன. ஒழுங்கற்ற தரவுகளில் இருக்கும் குறைபாடுகளை AI பெருக்குகிறது என்பதை உணர்தல், ஒரு கலாச்சார மாற்றத்தை கட்டாயப்படுத்தியது, தரவு நிர்வாகத்திற்கு முன்னுரிமை அளிக்கிறது மற்றும் ஒரு மூலோபாய தூணாக சுத்தப்படுத்துகிறது.

AI இன் வயதில் போட்டித்தன்மையுடன் இருக்க விரும்பும் எந்தவொரு நிறுவனத்திற்கும் தரநிலைப்படுத்தல் மற்றும் தகவல்களைக் கட்டுப்படுத்துவது அவசியமாகிவிட்டது. தகவல் தொழில்நுட்பம், இணக்கம் மற்றும் தரவு பகுப்பாய்வுத் துறைகள் இப்போது ஒருங்கிணைந்த முறையில் மூலத் தகவலை மதிப்புமிக்க மூலோபாய சொத்துக்களாக மாற்றும் வகையில் செயல்படுகின்றன, மாடல்களை திறம்பட மற்றும் பாதுகாப்பாக உணவளிக்க முடியும்.

மாதிரி பயிற்சிக்கான எதிர்கால சவால்கள்

பரிசோதனையில் இருந்து அளவிடப்பட்ட செயலாக்கத்திற்கு மாறும்போது, ​​தொழில்துறையின் கவனம் தரவு நிர்வாகம், குறைந்த விலை செயல்பாடு மற்றும் நிஜ-உலகப் பணிப்பாய்வுகளில் AI இன் நெகிழ்ச்சியான ஒருங்கிணைப்பு ஆகியவற்றிற்கு மாறுகிறது. துறையின் முதிர்ச்சியானது, புதிய தரவுகளின் பாரிய அளவைக் குவிக்கும் திறனைப் பொறுத்து குறைவாக இருக்கும் மற்றும் ஏற்கனவே உள்ள வளங்களை அறிவார்ந்த மற்றும் ஆக்கப்பூர்வமாகப் பயன்படுத்தும் திறனைப் பொறுத்தது.

தொழில்நுட்பத் துறையில் வளர்ந்து வரும் மாற்றுகள்

கணக்கீட்டு மற்றும் அல்காரிதம் செயல்திறனில் உள்ள கண்டுபிடிப்புகள், புதிய மனித தரவுகளின் மீது பிரத்யேக நம்பிக்கை இல்லாமல் AI முன்னேற்றத்தை விரிவாக்குவதற்கு தொடர்ந்து முக்கியமானதாக இருக்கும். ஓபன்ஏஐயின் சாம் ஆல்ட்மேன் போன்ற தொழில்துறை தலைவர்கள், பாரம்பரிய அளவிடுதலுக்கு அப்பாற்பட்ட புதிய முன்னுதாரணங்களை ஆராய்வதன் அவசியத்தை ஏற்கனவே சமிக்ஞை செய்துள்ளனர். தனிப்பட்ட தரவுகளின் சுரண்டல் மற்றும் அறிவார்ந்த உள்கட்டமைப்புகளை உருவாக்குதல் ஆகியவை அடுத்த போட்டி நன்மைகளாகக் கருதப்படுகின்றன, இது செயற்கை நுண்ணறிவின் முன்னேற்றம் நீண்ட காலத்திற்கு நிலையானதாக இருப்பதை உறுதி செய்கிறது.