கேப்சூல் நியூரல் நெட்வொர்க்குகள் - உள்ளமை நரம்பியல் அடுக்குகளின் தொகுப்பு

கேப்சூல் நெட்வொர்க்குகள் - இந்த வலைப்பதிவு கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகளின் வரம்புகள் மற்றும் கேப்சூல் நியூரல் நெட்வொர்க்குகள் அந்த வரம்புகளை எவ்வாறு தீர்க்கின்றன என்பதைப் பற்றி பேசுகிறது.

கேப்சூல் நெட்வொர்க்குகள்:

கேப்சூல் நெட்வொர்க்குகள் என்றால் என்ன? இது அடிப்படையில், உள்ளமை நரம்பியல் அடுக்குகளின் தொகுப்பாகும்.

கீழேயுள்ள வலைப்பதிவுகள் வழியாகவும் செல்ல நான் பரிந்துரைக்கிறேன்:





நான் கருதுகிறேன், உங்களுக்கு கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகள் (சி.என்.என்) தெரியும். இங்கே, சி.என்.என்-களின் வரம்புகளைப் பற்றி விவாதிக்க நான் ஒரு சிறிய அறிமுகத்தை உங்களுக்கு தருகிறேன்.

கன்வல்யூஷனல் நியூரல் நெட்வொர்க்கில் கீழேயுள்ள வீடியோவையும் நீங்கள் பார்க்கலாம்.



கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகள் (சி.என்.என்)

கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகள், அடிப்படையில் கணினி பார்வைக்கு பயன்படுத்தப்படும் செயற்கை நியூரான்களின் பல்வேறு அடுக்குகளின் அடுக்காகும். கீழே, நான் அந்த அடுக்குகளை குறிப்பிட்டுள்ளேன்:

கன்வல்யூஷனல் நியூரல் நெட்வொர்க் - கேப்சூல் நியூரல் நெட்வொர்க் - எடுரேகா

மாற்றும் அடுக்கு: பட வகைப்பாட்டிற்காக நாங்கள் ஃபீட்ஃபோர்டு நியூரல் நெட்வொர்க்குகளை (மல்டி லேயர் பெர்செப்டிரான்) பயன்படுத்தும்போது, ​​அதில் பல சவால்கள் உள்ளன. மிகவும் வெறுப்பூட்டும் சவால் என்னவென்றால், இது நிறைய அளவுருக்களை அறிமுகப்படுத்துகிறது, சி.என்.என் இல் வீடியோ டுடோரியலைக் கவனியுங்கள்.



இந்த சவாலை சமாளிக்க கன்வல்யூஷன் லேயர் அறிமுகப்படுத்தப்பட்டது. படத்தின் எதிர் மூலைகளில் உள்ளதை விட, ஆர்வத்துடன் ஒரு குறிப்பிட்ட அம்சத்தை உருவாக்குவதற்கு இடஞ்சார்ந்த நெருக்கமான பிக்சல்கள் “ஒத்துழைக்கும்” என்று கருதப்படுகிறது. மேலும், ஒரு படத்தின் லேபிளை வரையறுக்கும்போது ஒரு குறிப்பிட்ட (சிறிய) அம்சம் மிகவும் முக்கியத்துவம் வாய்ந்ததாகக் கண்டறியப்பட்டால், இருப்பிடத்தைப் பொருட்படுத்தாமல், இந்த அம்சம் படத்திற்குள் எங்கும் காணப்பட்டால், அது சமமாக முக்கியமானதாக இருக்கும்.

ரெலு அடுக்கு: உள்ளீடு ஒரு குறிப்பிட்ட அளவுக்கு மேல் இருந்தால் மட்டுமே திருத்தப்பட்ட நேரியல் அலகு (ReLU) உருமாற்ற செயல்பாடு ஒரு முனையை செயல்படுத்துகிறது, உள்ளீடு பூஜ்ஜியத்திற்கு கீழே இருக்கும்போது, ​​வெளியீடு பூஜ்ஜியமாக இருக்கும், ஆனால் உள்ளீடு ஒரு குறிப்பிட்ட வாசலுக்கு மேலே உயரும்போது, ​​அது ஒரு நேரியல் உறவைக் கொண்டுள்ளது சார்பு மாறி.

  • இந்த அடுக்கில் வடிகட்டப்பட்ட படங்களிலிருந்து ஒவ்வொரு எதிர்மறை மதிப்புகளையும் அகற்றி அதை பூஜ்ஜியத்துடன் மாற்றுவோம்
  • மதிப்புகள் பூஜ்ஜியம் வரை தொகுப்பதைத் தவிர்க்க இது செய்யப்படுகிறது

பூலிங் லேயர்: இது குறைவான செயல்திறனைச் செய்யப் பயன்படுகிறது, இது படத்தின் சிறிய மற்றும் (வழக்கமாக) ஒத்திசைவற்ற பகுதிகளை உட்கொண்டு அவற்றை ஒரு மதிப்பாக ஒருங்கிணைக்கிறது. திரட்டுவதற்கு பல சாத்தியமான திட்டங்கள் உள்ளன - மிகவும் பிரபலமானவை மேக்ஸ்-பூலிங் , ஒவ்வொரு துண்டிலும் அதிகபட்ச பிக்சல் மதிப்பு எடுக்கப்படுகிறது. இது உள்ளீட்டு படத்தில் சிறிய மாற்றங்கள், சிதைவுகள் மற்றும் மொழிபெயர்ப்புகளுக்கு பிணையத்தை மாற்றியமைக்கிறது (உள்ளீட்டில் ஒரு சிறிய விலகல் பூலிங் வெளியீட்டை மாற்றாது - உள்ளூர் சுற்றுப்புறத்தில் அதிகபட்ச / சராசரி மதிப்பை நாங்கள் எடுத்துக்கொள்வதால்).

முழுமையாக இணைக்கப்பட்ட அடுக்கு: இந்த அடுக்கு வகுப்பு மதிப்பெண்களைக் கணக்கிடும், அங்கு ஒவ்வொரு எண்களும் வகுப்பு மதிப்பெண்ணுடன் ஒத்திருக்கும். சாதாரண நியூரல் நெட்வொர்க்குகளைப் போலவே, பெயர் குறிப்பிடுவது போல, இந்த அடுக்கில் உள்ள ஒவ்வொரு நியூரானும் முந்தைய தொகுதியில் உள்ள அனைத்து நியூரான்களுடன் இணைக்கப்படும். சுருக்கமாக, இது இறுதி வகைப்பாட்டை செய்கிறது.

இந்த வழியில், ConvNets அசல் பட அடுக்கை அசல் பிக்சல் மதிப்புகளிலிருந்து இறுதி வகுப்பு மதிப்பெண்களாக மாற்றுகிறது.

இது கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகளுக்கு மிகச் சிறிய அறிமுகமாகும், இந்த இடுகையில் நான் உட்பொதித்த சிஎன்என் வீடியோவைப் பார்க்க நான் இன்னும் பரிந்துரைக்கிறேன்.

இந்த கேப்சூல் நெட்வொர்க்குகள் வலைப்பதிவில், கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகளின் சில வரம்புகளை நான் இப்போது விவாதிப்பேன்

மாற்றத்தக்க நரம்பியல் நெட்வொர்க்குகளின் வரம்புகள்:

சரி, இதை ஒரு ஒப்புமை மூலம் விளக்குகிறேன்.

ஒரு மனிதன் இருக்கிறான் என்று வைத்துக்கொள்வோம், அதன் கண்களால் பல்வேறு படங்களின் அம்சங்களைக் கண்டறிய முடியும். ஒரு மனிதனின் முகத்தை ஒரு உதாரணமாக கருதுவோம். எனவே, இந்த துரதிர்ஷ்டவசமான பையன், கண்கள், மூக்கு போன்ற பல்வேறு அம்சங்களை அடையாளம் காண முடியும், ஆனால், அம்சங்களுக்கிடையேயான இடஞ்சார்ந்த உறவுகளை (முன்னோக்கு, அளவு, நோக்குநிலை) அடையாளம் காண முடியவில்லை. உதாரணமாக, பின்வரும் படம் ஒரு மனித முகத்தின் நல்ல ஓவியமாக வகைப்படுத்துவதில் அந்த நபரை முட்டாளாக்கக்கூடும்.

கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகளிலும் இதுதான் பிரச்சினை. சி.என்.என் அம்சங்களைக் கண்டறிவதில் சிறந்தது, ஆனால் முகத்தைக் கண்டறிவதற்கான நியூரானை தவறாக செயல்படுத்தும். அம்சங்களுக்கிடையிலான இடஞ்சார்ந்த உறவுகளை ஆராய்வதில் இது குறைவான செயல்திறன் கொண்டது என்பதே இதற்குக் காரணம்.

ஒரு எளிய சி.என்.என் மாதிரி மூக்கு, கண்கள் மற்றும் வாய்க்கான அம்சங்களை சரியாகப் பிரித்தெடுக்க முடியும், ஆனால் முகத்தைக் கண்டறிவதற்கான நியூரானை தவறாக செயல்படுத்தும். இடஞ்சார்ந்த நோக்குநிலை மற்றும் அளவு ஆகியவற்றில் தவறான பொருத்தத்தை உணராமல், முகத்தைக் கண்டறிவதற்கான செயல்படுத்தல் மிக அதிகமாக இருக்கும்.

சரி, இந்த வரம்பு மேக்ஸ் பூலிங் லேயரின் காரணமாகும்.

சி.என்.என் இல் அதிகபட்ச பூலிங் மொழிபெயர்ப்பு மாறுபாட்டைக் கையாளுகிறது. ஒரு அம்சம் கூட சற்று நகர்த்தப்பட்டது, அது இன்னும் பூலிங் சாளரத்திற்குள் இருந்தால், அதைக் கண்டறிய முடியும். ஆயினும்கூட, இந்த அணுகுமுறை அதிகபட்ச அம்சத்தை மட்டுமே (மிகவும் ஆதிக்கம் செலுத்துகிறது) மற்றவர்களை தூக்கி எறியும்.

எனவே, மேலே காட்டப்பட்டுள்ள முகப் படம் சாதாரண முகமாக வகைப்படுத்தப்படும். பூலிங் லேயரும் இந்த வகை மாற்றத்தை சேர்க்கிறது.

இது ஒருபோதும் பூலிங் லேயரின் நோக்கமாக இருக்கவில்லை. பூலிங் என்ன செய்ய வேண்டும் என்பது நிலை, நோக்குநிலை, விகிதாசார மாற்றங்களை அறிமுகப்படுத்துவதாகும்.

உண்மையில், இந்த பூலிங் லேயர் அனைத்து வகையான நிலை மாற்றங்களையும் சேர்க்கிறது. மேலே உள்ள வரைபடத்திலும் நீங்கள் காணக்கூடியது போல, இது முகத்தை சரியாகக் கண்டுபிடிக்கும் குழப்பத்திற்கு வழிவகுக்கிறது.

முன்மொழியப்பட்ட தீர்வு என்ன என்று பார்ப்போம் ஜெஃப்ரி ஹிண்டன் .

இந்த சிக்கலை எவ்வாறு தீர்ப்பது?

இப்போது, ​​ஒவ்வொரு நியூரானிலும் சாத்தியக்கூறுகள் மற்றும் அம்சங்களின் பண்புகள் உள்ளன என்று கற்பனை செய்கிறோம். எடுத்துக்காட்டாக, இது [சாத்தியக்கூறு, நோக்குநிலை, அளவு] கொண்ட ஒரு திசையனை வெளியிடுகிறது. இந்த இடஞ்சார்ந்த தகவலின் மூலம், மூக்கு, கண்கள் மற்றும் காது அம்சங்களுக்கிடையேயான நோக்குநிலை மற்றும் அளவிலான நிலைத்தன்மையை நாம் கண்டறிய முடியும், எனவே முகத்தைக் கண்டறிவதற்கு மிகக் குறைந்த செயல்பாட்டை வெளியிடுகிறது.

வெளியிட்ட தாளில் ஜெஃப்ரி ஹிண்டன் , இந்த வகையான நியூரான்கள் காப்ஸ்யூல்கள் என்று அழைக்கப்படுகின்றன. இந்த காப்ஸ்யூல்கள் ஒற்றை அளவிடல் மதிப்புக்கு பதிலாக ஒரு திசையனை வெளியிடுகின்றன.

கேப்சூல் நெட்வொர்க்குகள் என்றால் என்ன என்பதில் சில விளக்குகள் வைக்கிறேன்.

கேப்சூல் நெட்வொர்க்குகள் என்றால் என்ன?

காப்ஸ்யூல் அடிப்படையில், உள்ளமை நரம்பியல் அடுக்குகளின் தொகுப்பு. ஒரு காப்ஸ்யூலுக்குள் உள்ள நியூரான்களின் நிலை ஒரு உருவத்தின் உள்ளே ஒரு நிறுவனத்தின் போஸ் (நிலை, அளவு, நோக்குநிலை), சிதைப்பது, வேகம், அமைப்பு போன்ற பல்வேறு பண்புகளைப் பிடிக்கிறது.

ஒரு குறிப்பிட்ட மாறுபாட்டைக் கொண்டு ஒரு அம்சத்தைக் கைப்பற்றுவதற்குப் பதிலாக, ஒரு அம்சத்தின் விருப்பத்தையும் அதன் மாறுபாட்டையும் பிடிக்க ஒரு காப்ஸ்யூல் பயிற்சி அளிக்கப்படுகிறது. எனவே, காப்ஸ்யூலின் நோக்கம் ஒரு அம்சத்தைக் கண்டறிவது மட்டுமல்லாமல், மாறுபாட்டைக் கற்றுக்கொள்ள மாதிரியைப் பயிற்றுவிப்பதும் ஆகும்.

ஒரே காப்ஸ்யூல் ஒரே பொருள் வகுப்பை வெவ்வேறு நோக்குநிலைகளுடன் கண்டறிய முடியும் (எடுத்துக்காட்டாக, கடிகார திசையில் சுழற்று):

இது மாறுபாடு அல்ல, சமநிலையில் செயல்படுகிறது என்று நாம் கூறலாம்.

மாறுபாடு: மாறுபாடுகளைப் பொருட்படுத்தாமல் அம்சங்களைக் கண்டறிதல் ஆகும். எடுத்துக்காட்டாக, நோக்கு பொருட்படுத்தாமல் ஒரு மூக்கு-கண்டறிதல் நியூரான் ஒரு மூக்கைக் கண்டறிகிறது.

சமநிலை: ஒருவருக்கொருவர் மாற்றக்கூடிய பொருள்களைக் கண்டறிதல் (எடுத்துக்காட்டாக, வெவ்வேறு நோக்குநிலைகளைக் கொண்ட முகங்களைக் கண்டறிதல்). உள்ளுணர்வாக, காப்ஸ்யூல் நெட்வொர்க் முகம் 31 ° (சமநிலை) வலதுபுறமாக சுழற்றப்படுவதைக் கண்டறிந்து, முகம் 31 ated சுழற்றப்பட்ட ஒரு மாறுபாட்டோடு பொருந்துகிறது என்பதை உணரவில்லை. ஒரு காப்ஸ்யூலில் அம்ச மாறுபாட்டைக் கற்றுக்கொள்ள மாதிரியை கட்டாயப்படுத்துவதன் மூலம், குறைவான பயிற்சி தரவைக் கொண்டு சாத்தியமான மாறுபாடுகளை நாங்கள் திறம்பட விரிவுபடுத்தலாம். கூடுதலாக, எதிரிகளை நாங்கள் மிகவும் திறம்பட நிராகரிக்கலாம்.

ஒரு காப்ஸ்யூல் ஒரு திசையனை வெளியிடுகிறது. திசையனின் நோக்குநிலை நிறுவனத்தின் பண்புகளை குறிக்கிறது.

நரம்பியல் வலையமைப்பில் சாத்தியமான அனைத்து பெற்றோர்களுக்கும் திசையன் அனுப்பப்படுகிறது. சாத்தியமான ஒவ்வொரு பெற்றோருக்கும், ஒரு காப்ஸ்யூல் ஒரு முன்கணிப்பு திசையன் கண்டுபிடிக்க முடியும். முன்கணிப்பு திசையன் அதன் சொந்த எடை மற்றும் எடை மேட்ரிக்ஸைப் பெருக்கி கணக்கிடப்படுகிறது. எந்த பெற்றோருக்கு மிகப்பெரிய அளவிலான கணிப்பு திசையன் தயாரிப்பு உள்ளது, காப்ஸ்யூல் பிணைப்பை அதிகரிக்கிறது. மீதமுள்ள பெற்றோர்கள் தங்கள் பிணைப்பைக் குறைக்கிறார்கள். இது என அழைக்கப்படுகிறது ஒப்பந்தத்தின் மூலம் ரூட்டிங் .

இது நிச்சயமாக ஒரு சிறந்த அணுகுமுறையாகும், பின்னர் அதிகபட்சமாக பூலிங் செய்யப்படுகிறது, இதில் ரூட்டிங் கீழ் அடுக்கில் கண்டறியப்பட்ட வலுவான அம்சத்தை அடிப்படையாகக் கொண்டது.

ஜாவாவில் ஆட்டோபாக்ஸிங் என்றால் என்ன

இதற்குப் பிறகு ஒரு ஸ்குவாஷிங் செயல்பாடு சேர்க்கப்படுகிறது. நேரியல் அல்லாத தன்மையை அறிமுகப்படுத்த இது செய்யப்படுகிறது. இந்த ஸ்குவாஷிங் செயல்பாடு ஒவ்வொரு காப்ஸ்யூலின் திசையன் வெளியீட்டிலும் பயன்படுத்தப்படுகிறது.

கேப்சூல் நெட்வொர்க்குகள் எவ்வாறு செயல்படுகின்றன என்பதை இப்போது சொல்கிறேன்.

கேப்சூல் நெட்வொர்க்குகள் எவ்வாறு செயல்படுகின்றன?

ஒரு படி பின்வாங்குவோம். முழுமையாக இணைக்கப்பட்ட நெட்வொர்க்கில், ஒவ்வொரு நியூரானின் வெளியீடும் உள்ளீடுகளின் எடையுள்ள தொகை ஆகும்.

இப்போது, ​​கேப்சூல் நெட்வொர்க்குகளில் என்ன நடக்கிறது என்று பார்ப்போம்.

கேப்சூல் நியூரல் நெட்வொர்க்:

ஒரு காப்ஸ்யூல் நியூரல் நெட்வொர்க்கைக் கருத்தில் கொள்வோம், அங்கு ‘uநான்‘காப்ஸ்யூலுக்கான செயல்பாட்டு திசையன் என்பது‘நான்'கீழே உள்ள அடுக்கில்.

படி - 1: உருமாற்ற அணியைப் பயன்படுத்துங்கள்INijகாப்ஸ்யூல் வெளியீட்டிற்கு uநான் முந்தைய அடுக்கின். எடுத்துக்காட்டாக, m × k மேட்ரிக்ஸுடன், நாங்கள் ஒரு k-D ஐ மாற்றுகிறோம்uநான் ஒரு m-D க்குu ^j | நான். ((m × k) × (k × 1) = m × 1).

இது கணிப்பு ( வாக்களியுங்கள் ) மேலே உள்ள ‘j’ காப்ஸ்யூலின் வெளியீட்டில் ‘i’ காப்ஸ்யூலில் இருந்து. ‘விj‘காப்ஸ்யூலுக்கான செயல்பாட்டு திசையன் என்பது‘j ’மேலே அடுக்கில்

படி - 2: எடையுள்ள தொகையை கணக்கிடுங்கள்jஎடையுடன்சிij.சிijஇணைப்பு குணகம். இந்த குணகங்களின் தொகை ஒன்றுக்கு சமம். இது நாம் முன்னர் பேசிய காப்ஸ்யூல்களின் குழுவின் உறவில் செயல்படும் உண்மையான அளவுருவாகும்.

படி - 3: கன்வல்யூஷனல் நியூரல் நெட்வொர்க்குகளில் நாங்கள் ரெலு செயல்பாட்டைப் பயன்படுத்தினோம். இங்கே, திசையனை 0 மற்றும் அலகு நீளத்திற்கு இடையில் அளவிட ஒரு ஸ்குவாஷிங் செயல்பாட்டைப் பயன்படுத்துவோம். இது சிறிய திசையன்களை பூஜ்ஜியமாகவும், நீண்ட திசையன்களை அலகு திசையன்களாகவும் சுருக்குகிறது. எனவே ஒவ்வொரு காப்ஸ்யூலின் சாத்தியமும் பூஜ்ஜியத்திற்கும் ஒன்றுக்கும் இடையில் உள்ளது.

இது கணிப்பு ( வாக்களியுங்கள் ) மேலே உள்ள ‘j’ காப்ஸ்யூலின் வெளியீட்டில் ‘i’ காப்ஸ்யூலில் இருந்து. செயல்பாட்டு திசையன் முன்கணிப்பு திசையனுடன் நெருங்கிய ஒற்றுமையைக் கொண்டிருந்தால், அந்த காப்ஸ்யூல் ‘நான்'காப்ஸ்யூலுடன் மிகவும் தொடர்புடையது ‘j ’. (எடுத்துக்காட்டாக, மூக்கு காப்ஸ்யூல் முகம் காப்ஸ்யூலுடன் மிகவும் தொடர்புடையது.) இத்தகைய ஒற்றுமை கணிப்பு மற்றும் செயல்பாட்டு திசையனின் அளவிடுதல் தயாரிப்பைப் பயன்படுத்தி அளவிடப்படுகிறது. எனவே, ஒற்றுமை விருப்பம் மற்றும் அம்ச பண்புகள் இரண்டையும் கணக்கில் எடுத்துக்கொள்கிறது. (நியூரான்களில் வெறும் விருப்பத்திற்கு பதிலாக).

படி - 4: பொருந்தக்கூடிய மதிப்பெண் கணக்கிடு ‘பிij‘. இது செயல்பாட்டு திசையன் மற்றும் முன்கணிப்பு திசையன் ஆகியவற்றின் புள்ளி தயாரிப்பு ஆகும். இணைத்தல் குணகம்சிநான்jஇன் மென்பொருளாக கணக்கிடப்படுகிறதுbநான்j:

இணைத்தல் குணகம் cijb இன் மென்பொருளாக கணக்கிடப்படுகிறதுij.

இந்த ஆijபல மறு செய்கைகளில் மீண்டும் புதுப்பிக்கப்படுகிறது.

இது என அழைக்கப்படுகிறது ஒப்பந்தத்தின் மூலம் ரூட்டிங் .

வரைபடத்திற்கு கீழே ஒரு எடுத்துக்காட்டு:

கேப்சூல் நெட்வொர்க்குகளில் இந்த வலைப்பதிவுக்குப் பிறகு, டென்சர்ஃப்ளோவைப் பயன்படுத்தி கேப்சூல் நியூரல் நெட்வொர்க் செயல்படுத்தல் குறித்த வலைப்பதிவைக் கொண்டு வருவேன்.

காப்ஸ்யூல் நெட்வொர்க்குகளில் இந்த வலைப்பதிவைப் படித்து மகிழ்ந்தீர்கள் என்று நம்புகிறேன், பாருங்கள் உலகெங்கிலும் பரவியுள்ள 250,000 க்கும் மேற்பட்ட திருப்தியான கற்றவர்களின் வலைப்பின்னலுடன் நம்பகமான ஆன்லைன் கற்றல் நிறுவனமான எடுரேகாவால். டென்சர்ஃப்ளோ சான்றிதழ் பயிற்சி வகுப்போடு எடூரெகா ஆழமான கற்றல், சாஃப்ட்மேக்ஸ் செயல்பாடு, ஆட்டோ-குறியாக்கி நியூரல் நெட்வொர்க்குகள், கட்டுப்படுத்தப்பட்ட போல்ட்ஜ்மேன் இயந்திரம் (ஆர்.பி.எம்) போன்ற கருத்தாக்கங்களுடன் நிகழ்நேர திட்டங்கள் மற்றும் பணிகளைப் பயன்படுத்தி அடிப்படை மற்றும் மாற்றக்கூடிய நரம்பியல் வலைப்பின்னல்களைப் பயிற்றுவிப்பதில் நிபுணத்துவம் பெற உதவுகிறது.

எங்களுக்கு ஒரு கேள்வி கிடைத்ததா? கருத்துகள் பிரிவில் இதைக் குறிப்பிடவும், நாங்கள் உங்களைத் தொடர்புகொள்வோம்.