算法得出的三個方框形便是聚類中心質(zhì)點,能夠看到他們消費周期差不多,但是藍色消費金額最高,所以說他那一簇就是超級VIP。綠色則是VIP。
另外還有近鄰算法(KNN),算法的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。該方法在確定分類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。我們的應(yīng)用場景是影片分類,先進行維度的距離求值,然后排序,然后取最近的幾個樣本,頻率最高的類型就是該影片所屬的類型。
算法在處理數(shù)據(jù)時可以讓我們更加便捷,更能夠準確判斷出數(shù)據(jù)給我們的提示。從而做出正確的判斷,在這個大數(shù)據(jù)時代,對數(shù)據(jù)敏感很重要,而這個敏感更多的是需要算法來幫助我們理解數(shù)據(jù)。
最后是網(wǎng)絡(luò)爬蟲,所謂爬蟲,就是通過代碼下載網(wǎng)上我們需要的信息。其實也很簡單,說起來不過就是,打開網(wǎng)頁,讀取數(shù)據(jù),篩選數(shù)據(jù)。但是實現(xiàn)還是需要一定動手能力的,因為網(wǎng)絡(luò)的原因,這次我們還用python提供的WSGI接口供我們開啟本地服務(wù)器,能和真正上網(wǎng)一樣測試我們的爬蟲。但是很遺憾,以為版本問題,我的服務(wù)器使用程序開啟的時候出現(xiàn)了問題,但是在2.x版本時刻一正常運行的。但是我也自學了一個更簡單的爬蟲語句,那就是 you-get ,這句代碼能輕松下載我們需要的視頻信息等。更為簡單方便,除此,還有很多的爬蟲框架我們要可以使用,以后還有機會再去深入研究。
在最后,通過半個月的實習,學到了很多東西,掌握了基本的python語言,主要是發(fā)現(xiàn)這門語言似乎很適合我,激發(fā)了自己極大的興趣,學到了一些算法的思維,以及加強了邏輯思維的學習,學會了如何把問題分割解決等等。也了解到了未來的人工智能發(fā)展,未來是個智慧的城市,我們賦予機器智能,是我們智慧的結(jié)晶。
最后,要感謝師傅和同事在這段時間的幫助,讓我們在這里輕松地實習,在這里學到知識,開闊自己的眼界。
相關(guān)推薦:
>>本文地址:http://www.yceu.cn/dxs/2018/44796.html
聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
1 您的年齡
2 您的學歷
3 您更想做哪個方向的工作?