IT培訓(xùn)網(wǎng)
IT在線學(xué)習(xí)
四、數(shù)據(jù)分析:
1、數(shù)據(jù)分析具有極廣泛的應(yīng)用,典型的數(shù)據(jù)分析可能包含以下三步:
(1)搜索性數(shù)據(jù)分析:當(dāng)數(shù)據(jù)剛?cè)〉脮r(shí),可能雜亂無章,看不出規(guī)律,通過作圖,造表,用各種形式的方程擬合,計(jì)算某些特征量等手段探尋規(guī)律性的可能形式,即往什么方向和用何種方式去尋找和揭示隱含在數(shù)據(jù)中的規(guī)律性
(2)模型選定分析:在探索性分析的基礎(chǔ)上提出一類或幾類可能的模型,然后通過進(jìn)一步的分析從中挑選一定的模型
(3)推斷分析:通常使用數(shù)理統(tǒng)計(jì)方法對所定模型或估計(jì)的可靠程度和精確程度作出推斷
2、數(shù)據(jù)分析主要包括:
(1)簡單的數(shù)學(xué)運(yùn)算(Simple Math)
(2)統(tǒng)計(jì)(Statistics)
(3)快速傅里葉變換(FFT)
(4)平滑和濾波(Smoothing and Filtering)
(5)基線和峰值分析(Baseline and Peak Analysis)
3、scatter():散點(diǎn)圖
k-means算法/k均值算法(聚類算法中典型算法)
k-means算法也稱為k均值算法。K-means算法以k為參數(shù),把n個(gè)對象分成k個(gè)簇,使簇內(nèi)具有較高的相似度,而簇間的相似度較低。
(1)隨機(jī)選取k個(gè)聚類中心 k=3(分為幾類:)可以隨機(jī)產(chǎn)生三個(gè)坐標(biāo) 聚類公式(歐式定理)d=(x1-x2)*(x1-x2)+(y1-y2)*(y1-y2)開根號
(2)做分類
因?yàn)椋篸a1
4、KNN最近鄰算法原理:
(1)計(jì)算已知類別數(shù)據(jù)集中的點(diǎn)與當(dāng)前點(diǎn)之間的距離;
(2)按照距離遞增次序排序;
(3)選擇與當(dāng)前距離最小的K個(gè)點(diǎn);
(4)確定前k個(gè)點(diǎn)所在類別的出現(xiàn)概率;
(5)返回前k個(gè)點(diǎn)出現(xiàn)頻率最高的類別作為當(dāng)前點(diǎn)的預(yù)測分類;
五、python面向?qū)ο笤O(shè)計(jì)
概括知識點(diǎn)如下:
(1)初始化將需要的屬性賦予它;
(2)在python中,構(gòu)造函數(shù)稱為初始化函數(shù)。
(3)簡易網(wǎng)絡(luò)爬蟲原理與設(shè)計(jì)
相關(guān)推薦:
>>本文地址:http://www.yceu.cn/dxs/2018/45187.html
聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
1 您的年齡
2 您的學(xué)歷
3 您更想做哪個(gè)方向的工作?