做數據分析,沒有數據,是分析師的硬傷。但不完全是硬傷,沒有數據其實也可以利用邏輯思維能力來分析推斷,這個以后有機會跟大家分享。今天,我要講怎么用代碼獲取數據。
沒辦法很詳細地講,只能大致上講解一下,然后給個實例。
工具:Excel2013(用哪個版本都是可以的)
語言:Visual Basic for Applications(簡稱VBA,集成在Office套件里面的開發程式,有些精簡版或者用戶在安裝的時候取消了VBA套件,就會無法啟動)
我原本學的是硬件開發,只會匯編,寫這類程序不是我擅長的,而且是自學的只有半桶水的狀態。我寫的程序都有很大的優化空間,如果有更高效的方法,請不吝指教。
實例一:獲取淘寶搜索結果頁寶貝信息
如下圖,搜索了關鍵詞“T恤”后,會看到類似這樣的結果,我想把寶貝標題和價格,排名位置等信息給抓取到本地數據庫或者表格里面。
我們右擊一下頁面,點查看源文件
看到的結果如下
這個是網頁源碼,我要介紹的方法,就是通過網頁請求,獲取這里的源碼,然后再對源碼進行解析。
觀察源碼這個步驟很重要,在這里會決定數據要怎么拿。
比如要取出標題
標題是在 title= 后面的一串字符,又以 > 符號結束。把這兩個看成是分隔符的話,那么標題就藏在兩個分隔符的中間。
那么,思路上,只要知道這兩個分割符的位置,那么,就可以取出標題了。
樂發網超市批發網提供超市貨源信息,超市采購進貨渠道。超市進貨網提供成都食品批發,日用百貨批發信息、微信淘寶網店超市采購信息和超市加盟信息.打造國內超市采購商與批發市場供應廠商搭建網上批發市場平臺,是全國批發市場行業中電子商務權威性網站。
本文來源: 技術貼:如何用代碼巧妙爬抓電商數據進行分析