பைஸ்பார்க் டுடோரியல் - பைத்தானைப் பயன்படுத்தி அப்பாச்சி தீப்பொறியைக் கற்றுக்கொள்ளுங்கள்

பைஸ்பார்க் டுடோரியலில் உள்ள இந்த வலைப்பதிவில், பைதான் புரோகிராமிங் மொழியைப் பயன்படுத்தி அப்பாச்சி ஸ்பார்க்குடன் பணியாற்றப் பயன்படும் பிஸ்பார்க் ஏபிஐ பற்றி நீங்கள் அறிந்து கொள்வீர்கள்.

அத்தகைய ஆபத்தான விகிதத்தில் தரவு உருவாக்கப்படும் உலகில், சரியான நேரத்தில் அந்த தரவின் சரியான பகுப்பாய்வு மிகவும் பயனுள்ளதாக இருக்கும். நிகழ்நேரத்தில் பெரிய தரவைக் கையாள்வதற்கும் பகுப்பாய்வு செய்வதற்கும் மிக அற்புதமான கட்டமைப்பில் ஒன்று அப்பாச்சி ஸ்பார்க்.ஒன்றாக, அல்லது பைஸ்பார்க் மிகவும் விரும்பப்படும் சான்றிதழ் படிப்புகளில் ஒன்றாகும், இது ஸ்காலாவுக்கான ஸ்கலாவை அதன் பணத்திற்கு ஓடுகிறது. எனவே இதில் பைஸ்பார்க் பயிற்சி வலைப்பதிவு, நான் பின்வரும் தலைப்புகளைப் பற்றி விவாதிப்பேன்:





பைஸ்பார்க் பயிற்சி: பைஸ்பார்க் என்றால் என்ன?

அப்பாச்சி ஸ்பார்க் என்பது வேகமான கிளஸ்டர் கம்ப்யூட்டிங் கட்டமைப்பாகும், இது பெரிய தரவை செயலாக்குவதற்கும் வினவுவதற்கும் பகுப்பாய்வு செய்வதற்கும் பயன்படுத்தப்படுகிறது. இன்-மெமரி கணக்கீட்டை அடிப்படையாகக் கொண்டிருப்பதால், இது பல பெரிய தரவு கட்டமைப்புகளை விட ஒரு நன்மையைக் கொண்டுள்ளது.

பைஸ்பார்க் அம்சங்கள் - பைஸ்பார்க் பயிற்சி - எடுரேகா



முதலில் ஸ்கலா புரோகிராமிங் மொழியில் எழுதப்பட்ட, திறந்த மூல சமூகம் அப்பாச்சி தீப்பொறிக்கான பைத்தானை ஆதரிக்க ஒரு அற்புதமான கருவியை உருவாக்கியுள்ளது. பிசாஸ்பார்க் அதன் நூலகத்தின் மூலம் அப்பாச்சி ஸ்பார்க் மற்றும் பைத்தானில் உள்ள ஆர்.டி.டி களுடன் தரவு விஞ்ஞானிகள் இடைமுகத்திற்கு உதவுகிறது பை 4 ஜே. பைஸ்பாக்கை மற்றவர்களை விட சிறந்த கட்டமைப்பாக மாற்றும் பல அம்சங்கள் உள்ளன:

  • வேகம்: இது பாரம்பரிய பெரிய அளவிலான தரவு செயலாக்க கட்டமைப்பை விட 100 மடங்கு வேகமாக உள்ளது
  • சக்திவாய்ந்த கேச்சிங்: எளிய நிரலாக்க அடுக்கு சக்திவாய்ந்த கேச்சிங் மற்றும் வட்டு நிலைத்தன்மையின் திறன்களை வழங்குகிறது
  • வரிசைப்படுத்தல்: மெசோஸ், நூல் வழியாக ஹடூப் அல்லது ஸ்பார்க்கின் சொந்த கிளஸ்டர் மேலாளர் வழியாக பயன்படுத்தப்படலாம்
  • நிகழ் நேரம்: நினைவக கணக்கீடு காரணமாக நிகழ்நேர கணக்கீடு மற்றும் குறைந்த தாமதம்
  • பாலிகிளாட்: ஸ்கலா, ஜாவா, பைதான் மற்றும் ஆர் ஆகியவற்றில் நிரலாக்கத்தை ஆதரிக்கிறது

எங்கள் பைஸ்பார்க் டுடோரியல் வலைப்பதிவுடன் முன்னேறி, தொழிலில் ஸ்பார்க் எங்கே பயன்படுத்தப்படுகிறது என்பதைப் பார்ப்போம்.

தொழிலில் பைஸ்பார்க்

ஒவ்வொரு தொழிற்துறையும் பெரிய தரவைச் சுற்றி வருகிறது, மேலும் பெரிய தரவு இருக்கும் இடத்தில் பகுப்பாய்வு சம்பந்தப்பட்டுள்ளது. எனவே அப்பாச்சி தீப்பொறி பயன்படுத்தப்படும் பல்வேறு தொழில்களைப் பார்ப்போம்.



பாதி ஆன்லைன் ஸ்ட்ரீமிங்கை நோக்கி வளர்ந்து வரும் மிகப்பெரிய தொழில் ஒன்றாகும். நெட்ஃபிக்ஸ் அதன் வாடிக்கையாளர்களுக்கு தனிப்பயனாக்கப்பட்ட ஆன்லைன் பரிந்துரைகளை வழங்க நிகழ்நேர ஸ்ட்ரீம் செயலாக்கத்திற்கு அப்பாச்சி ஸ்பார்க்கைப் பயன்படுத்துகிறது. இது செயலாக்குகிறது 450 பில்லியன் ஒரு நாளைக்கு நிகழ்வுகள் சேவையக பக்க பயன்பாடுகளுக்கு பாய்கின்றன.

நிதி அப்பாச்சி ஸ்பார்க்கின் நிகழ்நேர செயலாக்கம் முக்கிய பங்கு வகிக்கும் மற்றொரு துறை. சமூக ஊடக சுயவிவரங்களை அணுகவும் பகுப்பாய்வு செய்யவும், சரியான வணிக முடிவுகளை எடுக்க உதவும் நுண்ணறிவுகளைப் பெற வங்கிகள் ஸ்பார்க்கைப் பயன்படுத்துகின்றன கடன் ஆபத்து மதிப்பீடு , இலக்கு விளம்பரங்கள் மற்றும் வாடிக்கையாளர் பிரிவு. வாடிக்கையாளர் சர்ன் தீப்பொறியைப் பயன்படுத்தி குறைக்கப்படுகிறது. மோசடி கண்டறிதல் இயந்திரக் கற்றலில் பரவலாகப் பயன்படுத்தப்படும் பகுதிகளில் ஒன்று ஸ்பார்க் ஈடுபட்டுள்ளது.

உடல்நலம் வழங்குநர்கள் அப்பாச்சி தீப்பொறியைப் பயன்படுத்துகின்றனர் நோயாளியின் பதிவுகளை பகுப்பாய்வு செய்யுங்கள் கிளினிக்கிலிருந்து வெளியேற்றப்பட்ட பின்னர் எந்த நோயாளிகள் சுகாதார பிரச்சினைகளை சந்திக்க நேரிடும் என்பதை அடையாளம் காண கடந்தகால மருத்துவ தரவுகளுடன். அப்பாச்சி தீப்பொறி பயன்படுத்தப்படுகிறது மரபணு வரிசைமுறை மரபணு தரவை செயலாக்க தேவையான நேரத்தை குறைக்க.

சில்லறை மற்றும் மின் வணிகம் பகுப்பாய்வு மற்றும் இலக்கு விளம்பரம் ஆகியவற்றைப் பயன்படுத்தாமல் இயங்குவதை ஒருவர் கற்பனை செய்ய முடியாத ஒரு தொழில். இன்று மிகப்பெரிய ஈ-காமர்ஸ் தளங்களில் ஒன்று அலிபாபா பெட்டாபைட் தரவை பகுப்பாய்வு செய்வதற்காக உலகின் மிகப்பெரிய ஸ்பார்க் வேலைகளில் சிலவற்றை இயக்குகிறது. அலிபாபா நிகழ்த்துகிறார் அம்சம் பிரித்தெடுத்தல் படத் தரவில். ஈபே வழங்க அப்பாச்சி தீப்பொறியைப் பயன்படுத்துகிறது இலக்கு சலுகைகள் , வாடிக்கையாளர் அனுபவத்தை மேம்படுத்துதல் மற்றும் ஒட்டுமொத்த செயல்திறனை மேம்படுத்துதல்.

பயணம் தொழில்களும் அப்பாச்சி தீப்பொறியைப் பயன்படுத்துகின்றன. டிரிப் அட்வைசர் , சரியான பயணத்தைத் திட்டமிட பயனர்களுக்கு உதவும் ஒரு முன்னணி பயண வலைத்தளம், அப்பாச்சி ஸ்பார்க்கை விரைவுபடுத்த பயன்படுத்துகிறது தனிப்பயனாக்கப்பட்ட வாடிக்கையாளர் பரிந்துரைகள் டிரிப் அட்வைசர் மில்லியன் கணக்கான பயணிகளுக்கு ஆலோசனைகளை வழங்க அப்பாச்சி தீப்பொறியைப் பயன்படுத்துகிறது நூற்றுக்கணக்கான வலைத்தளங்களை ஒப்பிடுகிறது அதன் வாடிக்கையாளர்களுக்கு சிறந்த ஹோட்டல் விலைகளைக் கண்டறிய.

இந்த பைஸ்பார்க் டுடோரியலின் ஒரு முக்கிய அம்சம், நாம் ஏன் பைத்தானுக்கு செல்ல வேண்டும் என்பதைப் புரிந்துகொள்வது? ஏன் ஜாவா, ஸ்கலா அல்லது ஆர்?

புதிய புதுப்பிப்புகளைப் பெற எங்கள் யூடியூப் சேனலுக்கு குழுசேரவும் ..!


பைத்தானுக்கு ஏன் செல்ல வேண்டும்?

கற்றுக்கொள்வது எளிது: புரோகிராமர்களுக்கு பைதான் அதன் தொடரியல் மற்றும் நிலையான நூலகங்கள் இருப்பதால் கற்றுக்கொள்வது ஒப்பீட்டளவில் எளிதானது. மேலும், இது மாறும் தட்டச்சு செய்யப்பட்ட மொழியாகும், அதாவது RDD க்கள் பல வகையான பொருட்களை வைத்திருக்க முடியும்.

நூலகங்களின் பரந்த தொகுப்பு: இயந்திர கற்றல் மற்றும் இயற்கை மொழி செயலாக்கத்திற்கான போதுமான தரவு அறிவியல் கருவிகள் மற்றும் பைதான் போன்ற நூலகங்கள் ஸ்கலாவில் இல்லை. மேலும், ஸ்கலாவில் நல்ல காட்சிப்படுத்தல் மற்றும் உள்ளூர் தரவு மாற்றங்கள் இல்லை.

மிகப்பெரிய சமூக ஆதரவு: ஆயிரக்கணக்கான மெய்நிகர் மற்றும் ப physical தீக இருப்பிடங்களில் ஆன்லைனிலும் ஆஃப்லைனிலும் தொடர்பு கொள்ளும் மில்லியன் கணக்கான டெவலப்பர்களுடன் பைதான் உலகளாவிய சமூகத்தைக் கொண்டுள்ளது.

இந்த பைஸ்பார்க் டுடோரியலில் மிக முக்கியமான தலைப்புகளில் ஒன்று RDD களின் பயன்பாடு ஆகும். RDD கள் என்றால் என்ன என்பதைப் புரிந்துகொள்வோம்

தீப்பொறி ஆர்.டி.டிக்கள்

மறுபயன்பாட்டு விநியோகிக்கப்பட்ட கம்ப்யூட்டிங் என்று வரும்போது, ​​அதாவது கணக்கீடுகளில் பல வேலைகளுக்கு மேல் தரவை செயலாக்குவது, பல வேலைகளில் தரவை மீண்டும் பயன்படுத்த வேண்டும் அல்லது பகிர வேண்டும். ஹடூப் போன்ற முந்தைய கட்டமைப்புகள் பல செயல்பாடுகள் / வேலைகள் போன்றவற்றைக் கையாளும் போது சிக்கல்களைக் கொண்டிருந்தன

  • HDFS போன்ற இடைநிலை சேமிப்பகத்தில் தரவை சேமித்தல்
  • பல I / O வேலைகள் கணக்கீடுகளை மெதுவாக்குகின்றன
  • பிரதிகளும் சீரியலைசேஷன்களும் செயல்முறையை இன்னும் மெதுவாக்குகின்றன

RDD கள் தவறு-சகிப்புத்தன்மையுடன் விநியோகிக்கப்பட்ட நினைவக கணக்கீடுகளை இயக்குவதன் மூலம் அனைத்து சிக்கல்களையும் தீர்க்க முயற்சிக்கின்றன. RDD குறுகியது நெகிழக்கூடிய விநியோகிக்கப்பட்ட தரவுத்தொகுப்புகள். ஆர்.டி.டி என்பது விநியோகிக்கப்பட்ட நினைவக சுருக்கமாகும், இது புரோகிராமர்கள் பெரிய கிளஸ்டர்களில் நினைவக கணக்கீடுகளை தவறு-சகிப்புத்தன்மையுடன் செய்ய அனுமதிக்கிறது. அவர்கள் பொருள்களின் படிக்க மட்டும் சேகரிப்பு ஒரு பகிர்வு இழந்தால் மீண்டும் உருவாக்கக்கூடிய எந்திரங்களின் தொகுப்பில் பகிர்வு செய்யப்பட்டது. RDD களில் பல செயல்பாடுகள் செய்யப்படுகின்றன:

  • மாற்றங்கள்: மாற்றங்கள் ஏற்கனவே இருக்கும் ஒன்றிலிருந்து புதிய தரவுத்தொகுப்பை உருவாக்குகின்றன. சோம்பேறி மதிப்பீடு
  • செயல்கள்: RDD களில் செயல்களைச் செய்யும்போது மட்டுமே மரணதண்டனைக்கான கணக்கீடுகளை ஸ்பார்க் கட்டாயப்படுத்துகிறது

சில மாற்றங்கள், செயல்கள் மற்றும் செயல்பாடுகளைப் புரிந்துகொள்வோம்

ஒரு கோப்பைப் படித்தல் மற்றும் சிறந்த n கூறுகளைக் காண்பித்தல்:

rdd = sc.textFile ('கோப்பு: /// home / edureka / Desktop / Sample') rdd.take (n)

வெளியீடு:

[u'Deforestation முக்கிய சுற்றுச்சூழல் மற்றும் சமூக பிரச்சினையாக எழுகிறது, இது இப்போது ஒரு சக்திவாய்ந்த அரக்கனை விட அதிகமாக உள்ளது. ', காடழிப்பு காரணமாக எழும் சிக்கல்களைத் தீர்ப்பதற்கான காரணங்கள், விளைவுகள் மற்றும் வழிகளைப் பற்றி நாம் அறிந்திருக்க வேண்டும். ', உங்கள் குழந்தைகள் மற்றும் குழந்தைகள் பிரச்சினையைப் பற்றி அறிந்துகொள்ள உதவுவதற்கும், பள்ளியிலோ அல்லது பள்ளிக்கு வெளியேயோ கட்டுரை எழுதுதல் போட்டியில் பங்கேற்க உதவுவதற்காக நாங்கள் பல பத்திகள், காடழிப்பு பற்றிய நீண்ட மற்றும் குறுகிய கட்டுரைகளை வழங்கியுள்ளோம். ', u' வர்க்கத் தரத்தின்படி கீழே கொடுக்கப்பட்டுள்ள எந்த காடழிப்பு கட்டுரையையும் நீங்கள் தேர்ந்தெடுக்கலாம். ', u'Deforestation என்பது சமூகத்திற்கும் சுற்றுச்சூழலுக்கும் ஒரு பெரிய உலகளாவிய பிரச்சினையாக எழுகிறது.']

சிற்றெழுத்து மற்றும் பிரித்தல்: (கீழ் மற்றும் பிளவு)

def Func (கோடுகள்): கோடுகள் = lines.lower () கோடுகள் = lines.split () திரும்பும் கோடுகள் rdd1 = rdd.map (Func) rdd1.take (5)

வெளியீடு:

[[u'deforestation ', u'is', u'arising ', u'as', u'the ', u'main', u'en Environmental ', u'and', u'social ', u'issue ', u'which', u'has ', u'now', u'taken ', ...... . . ]

நிறுத்த வார்த்தைகளை நீக்குதல்: (வடிகட்டி)

stop_words = ['a', 'all', 'the', 'as', 'is', 'am', 'an', 'and', 'be', 'been', 'from', 'had' , 'நான்', 'நான்', 'ஏன்', 'உடன்'] rdd2 = rdd1.filter (lambda z: z stop_words இல் இல்லை) rdd2.take (10)

வெளியீடு:

[u'deforestation ', u'arising', u'main ', u'en Environmental', u'social ', u'issue', u'which ', u'has', u'now ', u'taken' ]

எண்களின் தொகை 1 முதல் 500 வரை: (குறைத்தல்)

sum_rdd = sc.parallelize (வரம்பு (1,500%)) sum_rdd.reduce (lambda x, y: x + y)

வெளியீடு:

124750

பைஸ்பார்க்குடன் இயந்திர கற்றல்

எங்கள் பைஸ்பார்க் டுடோரியல் வலைப்பதிவைத் தொடர்ந்து, சில கூடைப்பந்து தரவை பகுப்பாய்வு செய்து எதிர்கால கணிப்பைச் செய்வோம். எனவே, இங்கே நாம் NBA இன் அனைத்து வீரர்களின் கூடைப்பந்து தரவைப் பயன்படுத்தப் போகிறோம் 1980 [3 சுட்டிகள் அறிமுகப்படுத்தப்பட்ட ஆண்டு].

தரவு ஏற்றுகிறது:

df = spark.read.option ('header', 'true') .option ('inferSchema', 'true') .csv ('file: ///home/edureka/Downloads/season_totals.csv')

அச்சிடும் நெடுவரிசைகள்:

அச்சு (df.columns)

வெளியீடு:

['_c0', 'பிளேயர்', 'pos', 'வயது', 'team_id', 'g', 'gs', 'mp', 'fg', 'fga', 'fg_pct', 'fg3', ' fg3a ',' fg3_pct ',' fg2 ',' fg2a ',' fg2_pct ',' efg_pct ',' ft ',' fta ',' ft_pct ',' orb ',' drb ',' trb ',' ast ' , 'stl', 'blk', 'tov', 'pf', 'pts', 'yr']

வரிசைப்படுத்தும் வீரர்கள் (ஆர்டர் பை) மற்றும் பாண்டாஸ்:

இங்கே நாம் ஒரு பருவத்தில் அடித்த புள்ளியின் அடிப்படையில் வீரர்களை வரிசைப்படுத்துகிறோம்.

df.orderBy ('pts', ascending = False). வரம்பு (10) .toPandas () [['yr', 'player', 'age', 'pts', 'fg3']]

வெளியீடு:

டி.எஸ்.எல் மற்றும் மேட்லோட்லிப் பயன்படுத்துதல்:

இங்கே நாம் சராசரி எண்ணிக்கையை பகுப்பாய்வு செய்கிறோம் 3 புள்ளி முயற்சிகள் ஒவ்வொரு பருவத்திற்கும் ஒரு கால எல்லைக்கு 36 நிமிடம் [போதுமான ஓய்வு கொண்ட தோராயமான முழு NBA விளையாட்டுடன் தொடர்புடைய இடைவெளி]. இந்த மெட்ரிக்கை 3-புள்ளி புல இலக்கு முயற்சிகள் (fg3a) மற்றும் விளையாடிய நிமிடங்கள் (mp) ஆகியவற்றைப் பயன்படுத்தி கணக்கிடுகிறோம், பின்னர் முடிவைப் பயன்படுத்தி சதி செய்கிறோம் matlplotlib .

pyspark.sql.functions இலிருந்து இறக்குமதி col fga_py = df.groupBy ('yr') .agg (m 'mp': 'sum', 'fg3a': 'sum'}) .தேர் (col ('yr'), ( 36 * col ('sum (fg3a)') / col ('sum (mp)')). மாற்றுப்பெயர் ('fg3a_p36m')) .மாட்லோட்லிப் இறக்குமதி பைப்ளாட்டில் இருந்து ஆர்டர் பை ('yr') .use ('ஐந்தாவது வயது') _df = fga_py.toPandas () plt.plot (_df.yr, _df.fg3a_p36m, color = '# CD5C5C') plt.xlabel ('ஆண்டு') _ = plt.title ('பிளேயர் சராசரி 3-புள்ளி முயற்சிகள் (36 நிமிடங்களுக்கு) ') plt.annotate (' 3 சுட்டிக்காட்டி அறிமுகப்படுத்தப்பட்டது ', xy = (1980, .5), xytext = (1981, 1.1), fontsize = 9, arrowprops = dict (facecolor =' grey ', சுருங்கு = 0, வரி அகலம் = 2)) plt.annotate (' NBA 3-புள்ளி வரிசையில் நகர்த்தப்பட்டது ', xy = (1996, 2.4), xytext = (1991.5, 2.7), எழுத்துரு = 9, அம்புக்குறி = டிக் (முக வண்ணம் = 'சாம்பல்', சுருக்கம் = 0, வரி அகலம் = 2)) plt.annotate ('NBA 3-புள்ளி கோட்டை பின்னுக்கு நகர்த்தியது', xy = (1998, 2.), xytext = (1998.5, 2.4), எழுத்துரு = 9, அம்புக்குறிகள் = dict (facecolor = 'grey', சுருங்கு = 0, வரி அகலம் = 2%)

வெளியீடு:

நேரியல் பின்னடைவு மற்றும் திசையன்அசெம்ப்ளர்:

அடுத்த 5 ஆண்டுகளுக்கான ஷாட் முயற்சிகளின் எண்ணிக்கையை மாதிரியாக மாற்ற இந்த வளைவுக்கு ஒரு நேரியல் பின்னடைவு மாதிரியை நாம் பொருத்தலாம். வெக்டர்அசெம்ப்ளர் செயல்பாட்டைப் பயன்படுத்தி எங்கள் தரவை ஒரு நெடுவரிசைக்கு மாற்ற வேண்டும். இது ஒரு தேவை MLlib இல் உள்ள நேரியல் பின்னடைவு API க்கு.

pyspark.ml.feature import VectorAssembler t = VectorAssembler (inputCols = ['yr'], outputCol = 'features') training = t.transform (fga_py) .WithColumn ('yr', fga_py.yr) .withColumn ('label) ', fga_py.fg3a_p36m) training.toPandas (). தலை ()

வெளியீடு:

கட்டிட மாதிரி:

எங்கள் மாற்றப்பட்ட தரவைப் பயன்படுத்தி எங்கள் நேரியல் பின்னடைவு மாதிரி பொருளை உருவாக்குகிறோம்.

pyspark.ml.regression import இலிருந்து LinearRegress lr = LinearRegress (maxIter = 10) model = lr.fit (training)

தரவுத்தொகுப்பில் பயிற்சி பெற்ற மாதிரியைப் பயன்படுத்துதல்:

எங்கள் பயிற்சியளிக்கப்பட்ட மாதிரி பொருள் மாதிரியை எங்கள் அசல் பயிற்சி தொகுப்பிற்கு 5 வருட எதிர்கால தரவுகளுடன் பயன்படுத்துகிறோம்

சி ++ இல் ஃபைபோனச்சி தொடர்
pyspark.sql.types இறக்குமதி 1979-80 சீசனுக்கான 2020-21 சீசன் பயிற்சி_யர்ஸ் = பயிற்சி.தேர்வு ('yr'). Rdd.map (lambda x: x [0]). சேகரித்தல் () பயிற்சி_ = training.select ('fg3a_p36m'). rdd.map (lambda x: x [0]). சேகரித்தல் () prediction_yrs = [2017, 2018, 2019, 2020, 2021] all_yrs = training_yrs + prediction_yrs # கட்டப்பட்ட சோதனை DataFrame test_rdd = sc.parallelize (all_yrs) row = Row ('yr') & ampamplt all_years_features = t.transform (test_rdd.map (row) .toDF ()) # நேரியல் பின்னடைவு மாதிரியைப் பயன்படுத்துங்கள் df_results = model.transform (all_years_features) .toPandas ()

இறுதி கணிப்பைத் திட்டமிடுதல்:

நாங்கள் எங்கள் முடிவுகளைத் திட்டமிடலாம் மற்றும் வரைபடத்தை ஒரு குறிப்பிட்ட இடத்தில் சேமிக்கலாம்.

plt.plot (df_results.yr, df_results.prediction, linewidth = 2, linestyle = '-', color = '# 224df7', label = 'L2 Fit') plt.plot (training_yrs, training_y, color = '# f08080 ', லேபிள் = எதுவுமில்லை) plt.xlabel (' ஆண்டு ') plt.ylabel (' முயற்சிகளின் எண்ணிக்கை ') plt.legend (loc = 4) _ = plt.title (' வீரர் சராசரி 3-புள்ளி முயற்சிகள் (36 நிமிடங்களுக்கு) ') plt.tight_layout () plt.savefig (' / home / edureka / Downloads / Images / REGRESSION.png ')

வெளியீடு:

இந்த வரைபடத்துடன், இந்த பைஸ்பார்க் டுடோரியல் வலைப்பதிவின் இறுதியில் வருகிறோம்.

எனவே இது தான், நண்பர்களே!

இந்த பைஸ்பார்க் டுடோரியல் வலைப்பதிவில் பைஸ்பார்க் என்றால் என்ன, பைதான் ஏன் ஸ்பார்க், ஆர்.டி.டி மற்றும் பைஸ்பார்க்குடன் இயந்திர கற்றல் பற்றிய ஒரு பார்வைக்கு மிகவும் பொருத்தமானது என்று உங்களுக்கு ஒரு யோசனை வந்துவிட்டது என்று நம்புகிறேன். வாழ்த்துக்கள், நீங்கள் இனி பைஸ்பார்க்கிற்கு ஒரு புதியவர் அல்ல. நீங்கள் பைஸ்பார்க் பற்றி மேலும் அறிய மற்றும் வெவ்வேறு தொழில் பயன்பாட்டு வழக்குகளைப் புரிந்து கொள்ள விரும்பினால், எங்களைப் பாருங்கள் பைத்தானுடன் தீப்பொறி வலைப்பதிவு.

பைஸ்பார்க் என்றால் என்ன என்பதை இப்போது நீங்கள் புரிந்து கொண்டீர்கள், பாருங்கள் உலகெங்கிலும் பரவியுள்ள 250,000 க்கும் மேற்பட்ட திருப்தியான கற்றவர்களின் வலைப்பின்னலுடன் நம்பகமான ஆன்லைன் கற்றல் நிறுவனமான எடுரேகாவால். எடுரேகா பைஸ்பார்க் பயன்படுத்தி பைதான் ஸ்பார்க் சான்றிதழ் பயிற்சி பைத்தானைப் பயன்படுத்தி வெற்றிகரமான ஸ்பார்க் டெவலப்பராக மாறுவதற்கும், கிளவுட்ரா ஹடூப் மற்றும் ஸ்பார்க் டெவலப்பர் சான்றிதழ் தேர்வுக்கு (சி.சி.ஏ .175) உங்களைத் தயாரிப்பதற்கும் தேவையான அறிவு மற்றும் திறன்களை உங்களுக்கு வழங்க வடிவமைக்கப்பட்டுள்ளது.