萬(wàn)事俱備,只欠東風(fēng)。這東風(fēng),就是數(shù)據(jù)處理算法。從統(tǒng)計(jì)理論,到數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí),再到最近幾年提出來(lái)的深度學(xué)習(xí)理論,數(shù)據(jù)科學(xué)正處于百花齊放的時(shí)代。數(shù)據(jù)科學(xué)家們都用什么編程?以下是小編為你整理的python入門之?dāng)?shù)據(jù)處理方法 ?
這是你學(xué)習(xí)之前的*步,一定要清楚的知道,自己為什么要學(xué)習(xí)python,不論是為了達(dá)成某種目的,比如:工作中要用到?對(duì)以后發(fā)展有利?等等方面,絕不是憑空亂想的,一時(shí)興起想要學(xué)習(xí)。
?
做任何事情,都需要有興趣,不然,即便是你天天坐在那兒,埋頭苦學(xué),你的思想也在九霄云外遨游,不知所以。所以,提高學(xué)習(xí)興趣是關(guān)鍵! ?
一定要設(shè)定目標(biāo),比如:我一個(gè)月要掌握基礎(chǔ),第二個(gè)月,也要學(xué)習(xí)框架等等,要給自己做好初期的預(yù)算,不能沒(méi)有目標(biāo),學(xué)到哪兒算哪兒的態(tài)度是不可能學(xué)好東西的!所以,一定要給自己設(shè)定明確的目標(biāo),這樣學(xué)習(xí)就會(huì)有動(dòng)力,就像一只有人催促一樣。 ?
一定要有一個(gè)團(tuán)隊(duì)或者同伴,大家一起干一件事情要比你一個(gè)人孤零零的干快得多,也要有趣的多,可以少走很多的彎路,集體的力量是強(qiáng)大的,當(dāng)你覺(jué)得學(xué)習(xí)越來(lái)越順利的時(shí)候,你就會(huì)有動(dòng)力去繼續(xù)學(xué)習(xí)。 ?
用python運(yùn)算
或許,你覺(jué)得100+300太簡(jiǎn)單了,那我們可以嘗試一個(gè)復(fù)雜的,在>>>后輸入10*(100/2)/3+2,按下回車后,就可以看到結(jié)果了,各種四則運(yùn)算,包括三角函數(shù),python都是可以計(jì)算的 ?
接下來(lái)我們看個(gè)更強(qiáng)大的功能,輸入123456789098765432112345678900987654321834539845094368095486540978045765*123456789098765432112345678900987654321473287438759843579430965460940965940,按下回車,就會(huì)看到結(jié)果了,驚訝嗎,強(qiáng)大吧,你可以打開(kāi)windows自帶的計(jì)算器計(jì)算這個(gè)式子,雖然也能計(jì)算出結(jié)果,但是它的結(jié)果卻是很粗略的,不光是整數(shù),小數(shù)也是可以計(jì)算的,小數(shù)在程序設(shè)計(jì)語(yǔ)言中一般稱為浮點(diǎn)數(shù)。還有因?yàn)闅v史原因,計(jì)算機(jī)中出現(xiàn)的數(shù)學(xué)結(jié)果如e2,是指的10的2次方,這個(gè)和我們學(xué)的數(shù)學(xué)中的e是不一樣了。 ?
接下來(lái)我們嘗試下三角函數(shù)的計(jì)算,我們輸入sin(30),按下回車后,似乎出問(wèn)題了,下面出現(xiàn)了一些紅色的字符,注意遇到紅色字符,就表明我們犯錯(cuò)了。注意有這么一句: ?
NameError: name 'sin' is not defined,意思呢就是python不認(rèn)識(shí)sin,昨天我們用的print則是它認(rèn)識(shí)的,那該怎么辦呢,我們應(yīng)該特別強(qiáng)調(diào)一下,告訴python,sin是數(shù)學(xué)中的三角函數(shù),首先我們敲入import math告訴python我們要用一些數(shù)學(xué)的功能,然后在敲入math.sin(30) ?
看到結(jié)果了,似乎不對(duì)啊,這是怎么回事呢,實(shí)際上在python里面sin這個(gè)函數(shù)要的參數(shù)是以弧度為單位的,而我們給的是角度,如何把角度轉(zhuǎn)換成弧度呢,python也給我們方法了,下來(lái)我們輸入math.sin(math.radians(30)),這回結(jié)果就對(duì)了,其中math.radians就是把角度轉(zhuǎn)換成弧度的 ?
Python的特點(diǎn)
1.易于學(xué)習(xí):Python有相對(duì)較少的關(guān)鍵字,結(jié)構(gòu)簡(jiǎn)單,和一個(gè)明確定義的語(yǔ)法,學(xué)習(xí)起來(lái)更加簡(jiǎn)單。 ?
2.易于閱讀:Python代碼定義的更清晰。 ?
3.易于維護(hù):Python的成功在于它的源代碼是相當(dāng)容易維護(hù)的。 ?
4.一個(gè)廣泛的標(biāo)準(zhǔn)庫(kù):Python的*的優(yōu)勢(shì)之一是豐富的庫(kù),跨平臺(tái)的,在UNIX,Windows和Macintosh兼容很好。 ?
5.互動(dòng)模式:互動(dòng)模式的支持,您可以從終端輸入執(zhí)行代碼并獲得結(jié)果的語(yǔ)言,互動(dòng)的測(cè)試和調(diào)試代碼片斷。
?
6.可移植:基于其開(kāi)放源代碼的特性,Python已經(jīng)被移植(也就是使其工作)到許多平臺(tái)。 ?
7.可擴(kuò)展:如果你需要一段運(yùn)行很快的關(guān)鍵代碼,或者是想要編寫一些不愿開(kāi)放的算法,你可以使用C或C++完成那部分程序,然后從你的Python程序中調(diào)用。 ?
8.數(shù)據(jù)庫(kù):Python提供所有主要的商業(yè)數(shù)據(jù)庫(kù)的接口。 ?
9.GUI編程:Python支持GUI可以創(chuàng)建和移植到許多系統(tǒng)調(diào)用。 ?
10.可嵌入: 你可以將Python嵌入到C/C++程序,讓你的程序的用戶獲得"腳本化"的能力。 ?
python的豐富性
如果是在理論研究領(lǐng)域,R語(yǔ)言也許是最受數(shù)據(jù)科學(xué)家歡迎的,但是R語(yǔ)言的問(wèn)題也很明顯,因?yàn)槭墙y(tǒng)計(jì)學(xué)家們創(chuàng)建了R語(yǔ)言,所以其語(yǔ)法略顯怪異。而且R語(yǔ)言要想實(shí)現(xiàn)大規(guī)模分布式系統(tǒng),還需要很長(zhǎng)一段時(shí)間的工程之路要走。所以很多公司使用R語(yǔ)言做原型試驗(yàn),算法確定之后,再翻譯成工程語(yǔ)言。 ?
Python 也是數(shù)據(jù)科學(xué)家最喜歡的語(yǔ)言之一。和R語(yǔ)言不同,Python 本身就是一門工程性語(yǔ)言,數(shù)據(jù)科學(xué)家用 Python 實(shí)現(xiàn)的算法,可以直接用在產(chǎn)品中,這對(duì)于大數(shù)據(jù)初創(chuàng)公司節(jié)省成本是非常有幫助的。正式因?yàn)閿?shù)據(jù)科學(xué)家對(duì) Python 和R的熱愛(ài),Spark 為了討好數(shù)據(jù)科學(xué)家,對(duì)這兩種語(yǔ)言提供了非常好的支持。 ?
Python 的數(shù)據(jù)處理相關(guān)類庫(kù)非常多。高性能的科學(xué)計(jì)算類庫(kù) NumPy 和 SciPy,給其他高級(jí)算法打了非常好的基礎(chǔ),matploglib 讓 Python 畫圖變得像 Matlab 一樣簡(jiǎn)單。Scikit-learn 和 Milk 實(shí)現(xiàn)了很多機(jī)器學(xué)習(xí)算法,基于這兩個(gè)庫(kù)實(shí)現(xiàn)的 Pylearn2,是深度學(xué)習(xí)領(lǐng)域的重要成員。Theano 利用 GPU 加速,實(shí)現(xiàn)了高性能數(shù)學(xué)符號(hào)計(jì)算和多維矩陣計(jì)算。當(dāng)然,還有 Pandas,一個(gè)在工程領(lǐng)域已經(jīng)廣泛使用的大數(shù)據(jù)處理類庫(kù),其 DataFrame 的設(shè)計(jì)借鑒自R語(yǔ)言,后來(lái)又啟發(fā)了 Spark 項(xiàng)目實(shí)現(xiàn)了類似機(jī)制。 ?
對(duì)了,還有 iPython,這個(gè)工具如此有用,以至于我差點(diǎn)把他當(dāng)成標(biāo)準(zhǔn)庫(kù)而忘了介紹。iPython 是一個(gè)交互式 Python 運(yùn)行環(huán)境,能夠?qū)崟r(shí)看到每一段 Python 代碼的結(jié)果。默認(rèn)情況下,iPython 運(yùn)行在命令行,可以執(zhí)行ipython notebook在網(wǎng)頁(yè)中運(yùn)行。用 matplotlib 繪制的圖可以直接嵌入式的顯示在 iPython Notebook 中。 ?
iPython Notebook 的筆記本文件可以共享給其他人,這樣其他人就可以在自己的環(huán)境中重現(xiàn)你的工作成果;如果對(duì)方?jīng)]有運(yùn)行環(huán)境,還可以直接轉(zhuǎn)換成 HTML 或者 PDF。