

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、微博客是繼博客后迅速發(fā)展起來的一種新的社交網(wǎng)絡形式,在信息傳媒領域形成了很大的影響力。對于傳統(tǒng)的社交網(wǎng)絡形式,數(shù)據(jù)的獲取與分析技術(shù)已日趨成熟,但對于微博網(wǎng)絡數(shù)據(jù)的獲取及微博網(wǎng)絡特性的研究,還不夠完善。本文研究了微博的特點及作用,微博數(shù)據(jù)獲取的兩種技術(shù),以新浪微博為例,設計并實現(xiàn)了微博數(shù)據(jù)獲取與分析系統(tǒng),仿真并分析了微博網(wǎng)絡的網(wǎng)絡特性。本文主要的工作目的是在獲取微博數(shù)據(jù)的基礎上,分析微博數(shù)據(jù),由此得出微博網(wǎng)絡的特性。具體的工作如下:
2、> 1、研究了使用網(wǎng)絡頁面爬蟲獲取數(shù)據(jù)的相關技術(shù),包括通用網(wǎng)絡爬蟲,聚焦網(wǎng)絡爬蟲,網(wǎng)頁預處理,文本分類等的基本原理和工作流程。
2、深入研究了利用微博系統(tǒng)的SDK獲取數(shù)據(jù)的工作流程,該技術(shù)通過調(diào)用微博平臺提供的API來獲取用戶數(shù)據(jù),調(diào)用API需通過用戶身份的鑒權(quán),目前主要用到的是OAuth鑒權(quán),該方法步驟簡單,抓取數(shù)據(jù)的準確度和效率高,本文應用該方法獲取微博數(shù)據(jù)。
3、從簡化認證步驟,提高獲取效率,避免重復爬取等方
最新文檔
- 人類睡眠數(shù)據(jù)獲取和分析方法的研究.pdf
- 基于實測數(shù)據(jù)的結(jié)構(gòu)響應獲取與分析方法.pdf
- 糧情檢測系統(tǒng)中數(shù)據(jù)獲取與分析預測方法的研究與實現(xiàn).pdf
- Deep Web數(shù)據(jù)獲取方法研究.pdf
- 面向微博客的數(shù)據(jù)可視化設計與實現(xiàn).pdf
- 微博客中的知識條目發(fā)現(xiàn)方法研究.pdf
- 基于微博客數(shù)據(jù)的互聯(lián)網(wǎng)現(xiàn)實感知研究與實證分析.pdf
- 基于微博客的需求檢測與性格分析的研究.pdf
- gis數(shù)據(jù)動態(tài)獲取方法研究
- 博客與微博客中信息傳播規(guī)律的對比研究.pdf
- gis數(shù)據(jù)動態(tài)獲取方法研究
- 數(shù)學概念的知識獲取與分析方法研究.pdf
- 兼語句的知識分析與獲取方法研究.pdf
- 微博客主題分類的特征擴展方法.pdf
- 微博客話題評論的聚類分析.pdf
- 欠平衡鉆井數(shù)據(jù)獲取方法研究.pdf
- 微博客細粒度情感分析技術(shù)的研究與實現(xiàn).pdf
- 兼語句的知識分析與獲取方法研究
- 不完備數(shù)據(jù)的動態(tài)知識獲取方法研究.pdf
- 博客推廣方法分析
評論
0/150
提交評論