天才教育網(wǎng)合作機(jī)構(gòu) > 小語種培訓(xùn)機(jī)構(gòu) > 法語培訓(xùn)機(jī)構(gòu) >

全國python學(xué)習(xí)中心

歡迎您!
朋友圈

400-850-8622

全國統(tǒng)一學(xué)習(xí)專線 9:00-21:00

位置:小語種培訓(xùn)資訊 > 法語培訓(xùn)資訊 > python基礎(chǔ)教程數(shù)據(jù)分析,【連載2】:python數(shù)據(jù)分析——python基礎(chǔ)教程掌握

python基礎(chǔ)教程數(shù)據(jù)分析,【連載2】:python數(shù)據(jù)分析——python基礎(chǔ)教程掌握

日期:2021-06-13 13:17:46     瀏覽:93    來源:全國python學(xué)習(xí)中心
核心提示:不管你是待業(yè)還是失業(yè),在這個(gè)被互聯(lián)網(wǎng)圍繞的時(shí)代里,選擇python基礎(chǔ)教程數(shù)據(jù)分析,就多了一項(xiàng)技能,還怕找不到工作?,還怕不好找工作?小編就來告訴你這個(gè)專業(yè)的優(yōu)勢(shì)到底體現(xiàn)在哪里:Python數(shù)據(jù)分析步驟,Pyth

不管你是待業(yè)還是失業(yè),在這個(gè)被互聯(lián)網(wǎng)圍繞的時(shí)代里,選擇python基礎(chǔ)教程數(shù)據(jù)分析,就多了一項(xiàng)技能,還怕找不到工作?,還怕不好找工作?小編就來告訴你這個(gè)專業(yè)的優(yōu)勢(shì)到底體現(xiàn)在哪里:Python數(shù)據(jù)分析步驟,Python數(shù)據(jù)分析學(xué)習(xí)路徑圖(120天Get新技能),【連載2】:python數(shù)據(jù)分析——python基礎(chǔ)教程掌握,利用Python進(jìn)行數(shù)據(jù)分析(附詳細(xì)案例)??。

1.Python數(shù)據(jù)分析步驟

不管是用excel還是用Python, 數(shù)據(jù)分析過程都遵循一樣的套路。在學(xué)習(xí)完P(guān)ython的基礎(chǔ)知識(shí)之后,我把用Python進(jìn)行數(shù)據(jù)分析過程中涉及的函數(shù)都標(biāo)注了出來以方便后來回憶查看。

2.Python數(shù)據(jù)分析學(xué)習(xí)路徑圖(120天Get新技能)

Python是一種面向?qū)ο?、直譯式計(jì)算機(jī)程序設(shè)計(jì)語言,由Guido van Rossum于1989年底發(fā)明。由于他簡單、易學(xué)、免費(fèi)開源、可移植性、可擴(kuò)展性等特點(diǎn),Python又被稱之為膠水語言。下圖為主要程序語言近年來的流行趨勢(shì),Python受歡迎程度扶搖直上。 圖片來源用Python玩轉(zhuǎn)數(shù)據(jù)由于Python擁有非常豐富的庫,使其在數(shù)據(jù)分析領(lǐng)域也有廣泛的應(yīng)用。由于Python本身有十分廣泛的應(yīng)用,本期Python數(shù)據(jù)分析路線圖主要從數(shù)據(jù)分析從業(yè)人員的角度講述Python數(shù)據(jù)分析路線圖。整個(gè)路線圖計(jì)劃分成16周,120天左右。主要學(xué)習(xí)內(nèi)容包括四大部分:1)Python工作環(huán)境及基礎(chǔ)語法知識(shí)了解(包括正則表達(dá)式相關(guān)知識(shí)學(xué)習(xí));2)數(shù)據(jù)采集相關(guān)知識(shí)(python爬蟲相關(guān)知識(shí));3)數(shù)據(jù)分析學(xué)習(xí);4)數(shù)據(jù)可視化學(xué)習(xí)。PYTHON學(xué)習(xí)路徑計(jì)劃圖Python 工作環(huán)境及基礎(chǔ)語法知識(shí)了解對(duì)于Python基礎(chǔ)語法學(xué)習(xí)部分,學(xué)習(xí)周期大概為4周,需要的相關(guān)資源在網(wǎng)絡(luò)上都能找到免費(fèi)的資源,而且質(zhì)量都不錯(cuò)。相關(guān)中文資源如下:1、python工作集成環(huán)境包Python(x,y):下載地址( )如果安裝了上面集成工作包,則下面的包不需要重新安裝了。關(guān)于包的安裝方法在學(xué)習(xí)資源圖書中都有介紹,通常安裝庫采用pip方法,也可以用pip list查詢系統(tǒng)安裝了哪些庫。3、學(xué)習(xí)資源圖書1)Python基礎(chǔ)教程(第2版)[電子版圖書自行百度]2)深入淺出Head First python(中文版)[電子版圖書自行百度]在線教程1)廖雪峰的python教程(

3.【連載2】:python數(shù)據(jù)分析——python基礎(chǔ)教程掌握

目錄1、為什么要學(xué)習(xí)PYTHON2、如何安裝PYTHON3、快速學(xué)會(huì)PYTHON的四個(gè)關(guān)鍵4、什么是模塊5、數(shù)據(jù)結(jié)構(gòu)6、如何學(xué)編程最有效1、為什么要學(xué)習(xí)PYTHON許多大型網(wǎng)站它就是用它來開發(fā)的,例如我們知道的視頻網(wǎng)站又YouTube,還有國內(nèi)的豆瓣,谷歌雅虎,甚至美國航天局都會(huì)大量的使用Python。由于大數(shù)據(jù)人工智能的出現(xiàn),使得數(shù)據(jù)分析的需求非常的火爆,這也是為什么python現(xiàn)在很流行的主要原因2、如何安裝PYTHON網(wǎng)上教程很多,但是要專職數(shù)據(jù)分析,基本的就是python3+jupyter notebook+Anaconda,Anaconda的很多數(shù)據(jù)包已經(jīng)打包好了,基本夠用,如果需要用到新的包,可以用pip方式下載,需要的時(shí)候再說。Anaconda:是包管理器和環(huán)境管理器,Jupyter notebook:可以將數(shù)據(jù)分析的代碼、圖像和文檔全部組合到一個(gè)web文檔中。3、快速學(xué)會(huì)PYTHON的四個(gè)關(guān)鍵數(shù)據(jù)類型、函數(shù)、條件判斷、循環(huán)【3.1】數(shù)據(jù)類型【3.1.1】什么是數(shù)據(jù)我現(xiàn)在看什么數(shù)據(jù)呢?數(shù)據(jù)是非常重要的,可以把數(shù)據(jù)看作是一切程序運(yùn)行所需的原材料,有的數(shù)據(jù)呢,他來自程序本身,有的數(shù)據(jù)來自于用戶的輸入,比如使用程序過程中的輸入,我們使用編程語言來操作數(shù)據(jù),我們可以把程序看作那是一個(gè)大型的數(shù)據(jù)加工廠。其實(shí)微信公眾號(hào)對(duì)于我們來說也是個(gè)程序,如果你在個(gè)人微信公眾號(hào)輸入資料這兩個(gè)字,程序理解了你的輸入命令后,他就會(huì)把數(shù)據(jù)處理結(jié)果返回給你。那么程序中的數(shù)據(jù)是放在哪里的?【3.1.2】用什么存放數(shù)據(jù)在代碼里,我們用變量存放數(shù)據(jù),并用等號(hào)為變量賦值,變量概念,基本上和*代數(shù)的方程變量它是一樣的,只是在計(jì)算機(jī)程序中,變量不僅可以是素?fù)?jù),還可以是任意的數(shù)據(jù)類型,比如,我這里定義了一個(gè)人的姓名叫馬云,把它放在這個(gè)變量,這個(gè)變量取了一個(gè)名字,叫string,他是變量的名稱,右邊的是變量的值,這樣你就可以在代碼的其他地方使用這個(gè)變量,它里面重?fù)Q了就是,請(qǐng)教馬云這個(gè)人的數(shù)據(jù)?!?.1.2】什么是變量?所以呢,變量在代碼中就是用一個(gè)變量名來表示,前半部分名稱,還要能代表數(shù)據(jù)的意義,后半部分名稱呢,它能代表數(shù)據(jù)的類型,這樣當(dāng)我們使用著的時(shí)候,可以方便的通過變量名稱,知道這個(gè)變量里面他是存放了什么數(shù)據(jù),而且還能根據(jù)這個(gè)變量名稱知道這個(gè)變量的類型。就像剛才圖片里name表示人的姓名,那么后面的str是最表示變量的數(shù)據(jù)類型,只要你通過這個(gè)變量名稱就知道俺這個(gè)變量里面他們放的是人的姓名。注意:就是數(shù)字不能作為變量名稱的開頭;同時(shí)我們要注意python,它是對(duì)大小寫敏感的,如果寫出了大小寫程序就會(huì)報(bào)錯(cuò)。如下圖的nameStr:就是變量名稱+數(shù)據(jù)類型【3.1.3】注釋的兩種方法#單行注釋'''多行注釋……………………………………………………….'''【3.1.4】python數(shù)據(jù)類型分類分為字符串、數(shù)字、容器、布爾、none1、字符串*種字符串是:Python中最常見的數(shù)據(jù)類型,我們可以用單引號(hào)或雙引號(hào)來創(chuàng)建字符串,你可以用加號(hào)合并字符串,*個(gè)例子我例舉了你覺得怎樣,合并字符串,合并之后的字符串是馬云有錢?!咀址?s格式化】nameStr='我叫%s,我爹是%s'%('王思聰','王健林') print(nameStr) 我叫王思聰,我爹是王健林注意點(diǎn):print后面的小引號(hào),你竟然打成了‘,中英文環(huán)境一定要注明另外你原本的變量名是money,后面的變量名變味了moneyStr2,要注意前后的問題,否則也會(huì)出現(xiàn)問題3.2、數(shù)字?jǐn)?shù)值類型分為三種:int(整數(shù))、float(浮點(diǎn)數(shù))、complex(復(fù)數(shù)),它們與數(shù)學(xué)中的概念相同,如3.2.1)int(整數(shù))age = 50即年齡為503.2.2)float(浮點(diǎn)數(shù))money = 3.53即錢為3.53元3.3、容器Python中為了存放不同的數(shù)據(jù)有4種容器,分別是列表(List)、元組(Tuple)、集合(Sets)、字典()首先說下:列表、元組、集合、字典的應(yīng)用場景列表和元組有很多相似的地方,操作也差不多。不過列表是可變序列,元組為不可變序列。也就是說列表主要用于對(duì)象長度不可知的情況下,而元組用于對(duì)象長度已知的情況下,而且元組元素一旦創(chuàng)建變就不可修改。例如我們?cè)诖蜷_一個(gè)文本時(shí),并不知道里面有多少行文字,所以用列表來保存。而我們?cè)趦?chǔ)存一個(gè)人的信息(名字,年齡,性別,假定只需要這三種信息,所以對(duì)象長度為3)的時(shí)候,就可以用元組來實(shí)現(xiàn)。字典主要應(yīng)用于需要對(duì)元素進(jìn)行標(biāo)記的對(duì)象,這樣在使用的時(shí)候便不必記住元素列表中或者元組中的位置,只需要利用鍵來進(jìn)行訪問對(duì)象中相應(yīng)的值。集合中的元素不可重復(fù)的特點(diǎn)使它被拿來去重。比如我在爬去糗事百科全站的文章鏈接(存放與列表中)的時(shí)候,不可避免的會(huì)遇到重復(fù)的鏈接。這是我們只需將列表轉(zhuǎn)換為集合便能有效的去除重復(fù)部分。比如上面的例程。id = {'name': 'kyda', 'age': 19, ‘sex': 'man') print(id['age']) # 結(jié)果: # 193.3.1列表(list):列表用 [ ]表示,一看見方括號(hào)[ ]就要知道,哦,這是個(gè)列表,可重復(fù)哦列表的長度,用函數(shù)lenappend從列表*增加函數(shù),不去重del函數(shù)刪除列表中下標(biāo)為1的元素,下標(biāo)是從0開始數(shù)的查詢列表name的*個(gè)元素,也就是列表下標(biāo)為0的元素,記得再次變量name_1首先指定列表name下標(biāo)為2的元素,賦予新值wc,打印輸出修改后的結(jié)果3.3.2元組(tuple):元組使用小括號(hào)(),一看見(),就該知道,哦,這是一個(gè)元組,元組和列表的區(qū)別是元組的元素是不可更改的。查詢?cè)Mname_1的長度查詢?cè)Mname_1中下標(biāo)為3的元素,打印出來3.4、集合用花括號(hào){ }表示,它是不能重復(fù)有重復(fù)元素的容器,一看見花括號(hào){ },哦,這是個(gè)集合上邊的結(jié)合,我在元素中定義了重復(fù)字符串亞馬遜,當(dāng)打印輸出時(shí),它自動(dòng)只輸出*的重復(fù)值首先定義一個(gè)空的集合,往里面添加集合,使用update函數(shù),打印輸出用discard函數(shù)刪除集合daqiye中的阿里元素,需要注意的是要記住不同容器的操作方式,因?yàn)槊總€(gè)容器有不同的性質(zhì),沒有統(tǒng)一的標(biāo)準(zhǔn),只能死記硬背,這樣更扎實(shí)一些查找一個(gè)元素在不在集合里,查完之后返回的是布爾值,true返回的意思,你查的對(duì),它在里面呢先使用.discard函數(shù)刪除集合里面的阿里元素,再使用,update函數(shù)添加新的元素阿里3.4、字典它是存貯映射關(guān)系的容器,如賬號(hào)密碼。用花括號(hào)表示,需要注意的是要和集合區(qū)分來,看里面的元素是否有對(duì)應(yīng)關(guān)系(字典里的映射關(guān)系用 :號(hào)表示),如果有 :,那么這就是,反之為集合,key值必須是*的,value可以。字典中左側(cè)部分為*的值key,右側(cè)可以是重復(fù)的3.5、布爾值用True和Falase 表示 ,要嚴(yán)格區(qū)分大小寫,主要應(yīng)用在條件判斷上。3.6、空值None如圖:它是特殊的空值,就相當(dāng)于占了個(gè)位置,但是它又沒有值,所以用None表示四、條件判斷 if ...:else:...這里就多了個(gè)elif,就是多了個(gè)條件判斷,注意格式,就是冒號(hào):,別忘了,縮進(jìn)已經(jīng)要對(duì)齊,可以用tab鍵進(jìn)行操作,就是縮進(jìn)4個(gè)空格,一定要對(duì)其哦邏輯 and 、or、not的用法五、循環(huán),批量處理數(shù)據(jù),把容器中的每個(gè)數(shù)據(jù)都按照規(guī)則進(jìn)行重復(fù)處理,代碼塊格式:for i in 容器:(轉(zhuǎn)到下一行,縮進(jìn))要做的事情??梢赃@樣理解,i把所有的 eatlist列表里的數(shù)據(jù)都循環(huán)過一遍,簡單的循環(huán)將字典里的key,value轉(zhuǎn)換成大寫的,這在數(shù)據(jù)清洗中很重要,批量同一格式,這里用到了items()方法語法:返回值:返回可遍歷的(鍵, 值) 元組數(shù)組。countine循環(huán)break循環(huán),就是不再執(zhí)行這個(gè)循環(huán)了,退出python中break和continue的區(qū)別 - 人則魚 - 博客園六、函數(shù),函數(shù)就是別人已經(jīng)寫好的工具,可以重復(fù)使用,就是套路。也可以自己編寫函數(shù)自定義函數(shù)使用剛才定義好的add函數(shù),函數(shù)傳遞,一是按照定義的順序如上圖,二是使用參數(shù)名稱如下圖3.7、模塊,在py模塊。注意輸入地址時(shí)要用到雙\\,因?yàn)閜ython導(dǎo)入文件時(shí)將\符號(hào)當(dāng)做Tab鍵輸入導(dǎo)致語法錯(cuò)誤,加入\\就可以解決以上是解決方式的連接八、數(shù)據(jù)結(jié)構(gòu)隊(duì)列(queue)隊(duì)列就像你去餐廳外婆家吃飯排隊(duì),新來的人在隊(duì)列尾部加入,叫做入隊(duì)。取完票的人從隊(duì)列首部離開隊(duì)列,叫做出隊(duì)官網(wǎng)使用操作文檔:介紹Python的包,了解常用的數(shù)據(jù)結(jié)構(gòu)5. Data - Python 2.7.18 使用中daque的函數(shù),相當(dāng)于在隊(duì)列后邊加了個(gè)數(shù)我們可以看見隊(duì)列的001沒有,道理很簡單,在隊(duì)列頭,使用popleft函數(shù)讓頭出去了棧(stack)棧這種數(shù)據(jù)結(jié)構(gòu)有點(diǎn)像像生活中的木桶。你往棧中加入新的元素,就是入棧,新的元素總是放在木桶的最上面排序字典計(jì)數(shù)器Counter

4.利用Python進(jìn)行數(shù)據(jù)分析(附詳細(xì)案例)

一、前期準(zhǔn)備分析要用到兩個(gè)包:NumPy和Pandas,首先確保jupyter中成功安裝了這兩個(gè)包。#導(dǎo)入numpy包 import numpy as np #導(dǎo)入pandas包 import pandas as pd二、基礎(chǔ)知識(shí)2.1 一維數(shù)據(jù)分析:NumPy2.2 一維數(shù)據(jù)結(jié)構(gòu):Pandas2.3 二維數(shù)據(jù)分析:numpy對(duì)應(yīng)array2.4 二維數(shù)據(jù)分析:pandas對(duì)應(yīng)數(shù)據(jù)框DateFrame此處遇到一個(gè)問題:讀取Excel文件報(bào)錯(cuò)。解決方法:1 查看Excel文件存放路徑具體操作:點(diǎn)擊文件名,鼠標(biāo)右鍵,選擇“屬性”,找到下面標(biāo)紅的兩個(gè)地方。2 將上面標(biāo)紅的兩處合成文件的路徑,格式為文件夾\文件名,比如F:\ann\Untitled1.ipynb3 *把路徑中全部的斜杠(/)或者反斜杠(\)替換為雙反斜杠(\\)*的路徑為F:\\ann\\Untitled1.ipynb三、Python具體案例分析:藥店銷售數(shù)據(jù)3.1 提出問題分析指標(biāo):月均消費(fèi)次數(shù)月均消費(fèi)金額客單件消費(fèi)趨勢(shì)3.2 理解數(shù)據(jù)3.3 清洗數(shù)據(jù)3.3.1 選擇子集3.3.2 列名重命名3.3.3 缺失數(shù)據(jù)處理(dropna()函數(shù))Python缺失值有3種:None,NA,NaN。(分析數(shù)據(jù)時(shí),如果遇到什么錯(cuò)誤,比如float錯(cuò)誤,就要考慮是否為缺失值,若是,則需要處理掉)。Python內(nèi)置的None值;pandas中,將缺失值表示 為NA,表示不可用not available;對(duì)應(yīng)數(shù)值數(shù)據(jù),pandas使用浮點(diǎn)值NaN(Not a Number)表示缺失數(shù)據(jù);None和NaN的區(qū)別:None是Python的一種數(shù)據(jù)類型(NoneType),NaN是浮點(diǎn)類型(float),兩個(gè)都用作空值。3.3.4 數(shù)據(jù)類型轉(zhuǎn)換3.3.5 數(shù)據(jù)排序3.3.6 異常值處理3.4 構(gòu)建模型3.4.1 指標(biāo)1:月均消費(fèi)次數(shù)=總消費(fèi)次數(shù)/月份數(shù)3.4.2 指標(biāo)2:月均消費(fèi)金額=總消費(fèi)金額/月份數(shù)3.4.3 指標(biāo)3:客單價(jià)=總消費(fèi)金額/總消費(fèi)次數(shù)客單價(jià)(per customer ):商場(超市)每位顧客平均購買商品的金額,即是平均交易金額。3.4.3 消費(fèi)趨勢(shì)End.

就拿大數(shù)據(jù)說話,優(yōu)勢(shì)一目了然,從事IT行業(yè),打開IT行業(yè)的新大門,找到適合自己的培訓(xùn)機(jī)構(gòu),進(jìn)行專業(yè)和系統(tǒng)的學(xué)習(xí)。

本文由 全國python學(xué)習(xí)中心 整理發(fā)布。更多培訓(xùn)課程,學(xué)習(xí)資訊,課程優(yōu)惠,課程開班,學(xué)校地址等學(xué)校信息,可以留下你的聯(lián)系方式,讓課程老師跟你詳細(xì)解答:
咨詢電話:400-850-8622

如果本頁不是您要找的課程,您也可以百度查找一下: