大數(shù)據(jù)里面包含很多如大數(shù)據(jù)時(shí)代、大數(shù)據(jù)概念、大數(shù)據(jù)分析、大數(shù)據(jù)營(yíng)銷與開(kāi)發(fā)到底是什么意思呢?所謂大數(shù)據(jù),那到底什么是大數(shù)據(jù),他的來(lái)源在哪里,定義究竟是什么呢?下面小編為您詳細(xì)解答,一起來(lái)看看吧。以下是小編為你整理的從零開(kāi)始學(xué)大數(shù)據(jù) ?
大數(shù)據(jù)的定義。大數(shù)據(jù),又稱巨量資料,指的是所涉及的數(shù)據(jù)資料量規(guī)模巨大到無(wú)法通過(guò)人腦甚至主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。 ?
大數(shù)據(jù)的特點(diǎn)。數(shù)據(jù)量大、數(shù)據(jù)種類多、 要求實(shí)時(shí)性強(qiáng)、數(shù)據(jù)所蘊(yùn)藏的價(jià)值大。在各行各業(yè)均存在大數(shù)據(jù),但是眾多的信息和咨詢是紛繁復(fù)雜的,我們需要搜索、處理、分析、歸納、總結(jié)其深層次的規(guī)律。
?
大數(shù)據(jù)的采集??茖W(xué)技術(shù)及互聯(lián)網(wǎng)的發(fā)展,推動(dòng)著大數(shù)據(jù)時(shí)代的來(lái)臨,各行各業(yè)每天都在產(chǎn)生數(shù)量巨大的數(shù)據(jù)碎片,數(shù)據(jù)計(jì)量單位已從從Byte、KB、MB、GB、TB發(fā)展到PB、EB、ZB、YB甚至BB、NB、DB來(lái)衡量。大數(shù)據(jù)時(shí)代數(shù)據(jù)的采集也不再是技術(shù)問(wèn)題,只是面對(duì)如此眾多的數(shù)據(jù),我們?cè)鯓硬拍苷业狡鋬?nèi)在規(guī)律。 ?
大數(shù)據(jù)的挖掘和處理。大數(shù)據(jù)必然無(wú)法用人腦來(lái)推算、估測(cè),或者用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式計(jì)算架構(gòu),依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)、云存儲(chǔ)和虛擬化技術(shù),因此,大數(shù)據(jù)的挖掘和處理必須用到云技術(shù)。 ?
大數(shù)據(jù)的應(yīng)用。大數(shù)據(jù)可應(yīng)用于各行各業(yè),將人們收集到的龐大數(shù)據(jù)進(jìn)行分析整理,實(shí)現(xiàn)資訊的有效利用。舉個(gè)本專業(yè)的例子,比如在奶?;?qū)用鎸ふ遗c產(chǎn)奶量相關(guān)的主效基因,我們可以首先對(duì)奶牛全基因組進(jìn)行掃描,盡管我們獲得了所有表型信息和基因信息,但是由于數(shù)據(jù)量龐大,這就需要采用大數(shù)據(jù)技術(shù),進(jìn)行分析比對(duì),挖掘主效基因。例子還有很多。 ?
大數(shù)據(jù)的意義和前景。總的來(lái)說(shuō),大數(shù)據(jù)是對(duì)大量、動(dòng)態(tài)、能持續(xù)的數(shù)據(jù),通過(guò)運(yùn)用新系統(tǒng)、新工具、新模型的挖掘,從而獲得具有洞察力和新價(jià)值的東西。以前,面對(duì)龐大的數(shù)據(jù),我們可能會(huì)一葉障目、可見(jiàn)一斑,因此不能了解到事物的真正本質(zhì),從而在科學(xué)工作中得到錯(cuò)誤的推斷,而大數(shù)據(jù)時(shí)代的來(lái)臨,一切真相將會(huì)展現(xiàn)在我么面前。 ?
? ?
如何利用大數(shù)據(jù)做行業(yè)分析 ?
進(jìn)行大數(shù)據(jù)分析,雖說(shuō)各個(gè)行業(yè)都不一定相同,但是基本思路都是一樣的,分析的對(duì)象有:市場(chǎng),用戶,渠道,效果,這幾大類,如果有條件還可以進(jìn)行分支拓展。 ?
對(duì)市場(chǎng)/行業(yè)進(jìn)行大數(shù)據(jù)收集,分析:比如說(shuō),數(shù)據(jù)收集的方向,可以從大方向以及小方向進(jìn)行,大的方向可以從政治,經(jīng)濟(jì),社會(huì),技術(shù)這幾個(gè)入手,小方向可以從產(chǎn)品分析。 ?
對(duì)于用戶的調(diào)查,可以開(kāi)展用戶畫(huà)像,數(shù)據(jù)內(nèi)容包括:身份,行為,居住,交際圈等,往小了分,還有可以分為年齡,性別,學(xué)歷,消費(fèi)情況,興趣愛(ài)好,在哪些圈子等等.... ?
對(duì)產(chǎn)品進(jìn)行數(shù)據(jù)分析,可以從人群——市場(chǎng)——渠道——產(chǎn)品,這四個(gè)輪回,通過(guò)人群,可以得到市場(chǎng),通過(guò)渠道可以得到人群,通過(guò)人群又可以得到產(chǎn)品的使用情況。 ?
要進(jìn)行大數(shù)據(jù)分析,光有上面還是不夠的,還需要進(jìn)行一個(gè)營(yíng)銷效果的分析,分析的方向,包括用戶的行為,渠道的流量變化,以及一個(gè)最終的成本收益,投資回報(bào)率等。 ?
根據(jù)對(duì)營(yíng)銷效果的分析,從而可以分析出不同渠道的一個(gè)流量以及收益情況,從中就可以篩選出渠道的優(yōu)勢(shì)以及劣勢(shì),再集中匯集跟分析報(bào)告,這樣就可以定出方案了。 ?
? ?
什么是大數(shù)據(jù) ?
大數(shù)據(jù),或稱巨量數(shù)據(jù)、海量數(shù)據(jù);是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,是基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式,通過(guò)數(shù)據(jù)的集成共享,交叉復(fù)用形成的智力資源和知識(shí)服務(wù)能力。 ?
僅以互聯(lián)網(wǎng)為例,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿1.68億張DVD,發(fā)出的郵件有2940億封之多。發(fā)出的社區(qū)帖子達(dá)200萬(wàn)個(gè),相當(dāng)于《時(shí)代》雜志770年的文字?jǐn)?shù)量。 ?
截止到2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級(jí)別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級(jí)別。國(guó)際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說(shuō)過(guò)的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過(guò)去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。 ?
大數(shù)據(jù)的精準(zhǔn)營(yíng)銷是指通過(guò)大數(shù)據(jù)獲取對(duì)象的喜好,行為偏好,對(duì)不同對(duì)象進(jìn)行不同營(yíng)銷。大數(shù)據(jù)精準(zhǔn)營(yíng)銷的核心可以概括為幾大關(guān)鍵詞:用戶、需求、識(shí)別、體驗(yàn)客戶營(yíng)銷、客戶管理的公司經(jīng)營(yíng)理念,通過(guò)龐大的消費(fèi)數(shù)據(jù)資源,為客戶提供數(shù)據(jù)驗(yàn)證,精準(zhǔn)營(yíng)銷等數(shù)據(jù)級(jí)服務(wù)。簡(jiǎn)單說(shuō)就是為企業(yè)提供數(shù)據(jù)驗(yàn)證和數(shù)據(jù)篩選業(yè)務(wù)。
?
數(shù)學(xué)家Chris McKinlay是美國(guó)加州*洛杉磯分校在讀PhD,在多次相親后,對(duì)于找到另一半的事情毫無(wú)起色,作為一名數(shù)學(xué)家,他認(rèn)為自己應(yīng)該像一名數(shù)學(xué)家那樣使用交友數(shù)據(jù)。 ?
McKinlay利用自己的天賦,創(chuàng)建了一個(gè)自制的機(jī)器人程序,可利用假冒的OkCupid賬號(hào)從網(wǎng)站上搜集女性大量信息。McKinlay花了三周時(shí)間從美國(guó)2萬(wàn)女性收集到6萬(wàn)問(wèn)題和答案,之后利用自己研發(fā)的改進(jìn)型K-Modes算法將這些女網(wǎng)友分成7個(gè)在系統(tǒng)上存在差異的集群。通過(guò)建立數(shù)學(xué)模型計(jì)算的方式優(yōu)化出兩組女性,然后進(jìn)行約會(huì),在約會(huì)第88個(gè)女網(wǎng)友時(shí),他找到了自己的真愛(ài)。 ?
醫(yī)生根據(jù)病人的基本資料、診斷結(jié)果、處方、醫(yī)療保險(xiǎn)等數(shù)據(jù),將這些不醫(yī)療與大數(shù)據(jù):同數(shù)據(jù)綜合起來(lái),通過(guò)大數(shù)據(jù)決策處理軟件,醫(yī)生將為病人選擇*的醫(yī)療護(hù)理解決方案。 ?
我認(rèn)為,在當(dāng)今社會(huì),企業(yè)直面社會(huì)的劇烈變化,在管理工作中依賴小規(guī)模的“點(diǎn)子”、“好主意”的傳統(tǒng)做法已經(jīng)難以應(yīng)對(duì)市場(chǎng)的激烈競(jìng)爭(zhēng),企業(yè)需要從那些來(lái)自于現(xiàn)場(chǎng)、來(lái)源于客戶、來(lái)源于多個(gè)時(shí)空的全方位的立體信息中找到利潤(rùn)的寶藏,才能獲得持續(xù)增長(zhǎng)的動(dòng)力,從這個(gè)意義上看,駕馭大數(shù)據(jù)是企業(yè)駕馭未來(lái)的必經(jīng)之路。 ?
? ?
如何分析客戶數(shù)據(jù) ?
對(duì)客戶進(jìn)行多維度地分析,以用戶的地域、性別、年齡等人文屬性建立分析維度,把所有的團(tuán)購(gòu)信息進(jìn)行篩選,這樣可以簡(jiǎn)單地把EDM的相關(guān)性大幅提高,起碼用戶收到的郵件是基本在住宅、工作場(chǎng)所附近,和自己的普通屬性相關(guān)的,可能有一些興趣的商品。 ?
對(duì)客戶過(guò)去是否有點(diǎn)擊,是否有購(gòu)買,購(gòu)買的產(chǎn)品價(jià)值,購(gòu)買的頻率,最近一次什么時(shí)候購(gòu)買等屬性進(jìn)行量化,產(chǎn)生客戶價(jià)值的評(píng)分,把客戶分出價(jià)值的高低,對(duì)推薦的接受難易程度作出評(píng)估,依據(jù)這些評(píng)分來(lái)決定多頻繁對(duì)該客戶進(jìn)行EDM操作,以及推薦的商品的細(xì)類,以提高反饋率。 ?
對(duì)購(gòu)買過(guò)商品客戶的購(gòu)買記錄,以及點(diǎn)擊過(guò)的商品記錄進(jìn)行分析,對(duì)團(tuán)購(gòu)的折扣比例,商品原價(jià),折扣金額,團(tuán)購(gòu)時(shí)間長(zhǎng)短,能否退款,是否單人使用,風(fēng)格等等分別打分、統(tǒng)計(jì)、歸類,以對(duì)客戶的可能興趣點(diǎn)進(jìn)行“預(yù)測(cè)”,這是一個(gè)相對(duì)高級(jí)、相對(duì)復(fù)雜的過(guò)程,但是運(yùn)用得好的話會(huì)收到非常良好的效果。 ?
考慮在所有推薦的商品旁邊增加一個(gè)“不喜歡”的按鈕,收集客戶不喜歡的東西對(duì)個(gè)性化推薦來(lái)說(shuō)具有幾乎和喜歡的商品一樣重要的價(jià)值,假設(shè)一個(gè)客戶告訴你他不喜歡一款49元的西餐廳的雙人午餐,可能比他點(diǎn)擊甚至購(gòu)買另外一個(gè)99元日餐雙人套餐給你透露的信息還要多。 ?