下面為大家詳細介紹淘寶數據采集的方法。
1、淘寶列表頁采集(淘寶奶粉信息采集)
采集內容:搜索”奶粉“關鍵詞后,出現的列表信息
采集字段:名稱,圖鏈接,價格,銷量,店鋪名,產地等。
采集地址:https://s.taobao.com/search?q=%E5%A5%B6%E7%B2%89&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.50862.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170831
第一步:新建任務
進入主頁,選擇“新建任務”輸入需要采集的網址。
第二步:抓取數據
面板中,選擇“分頁設置"按鈕,點擊“自動識別分布",采集器方可自動識別抓取商品列表信息。
第三步:設置
(1)瀏覽器設置:為了提高加載速度,可以設置:攔截廣告,禁用flash,禁止彈窗等
(2)計劃任務:根據個人需要,無需要人工操作,可以按時按量自動采集導出數據。
第四步:數據加載、導出和保存
(1)加載數據
任務列表中:選中任務/點擊開使
即可查看抓取數據的進程,也可以手動暫停停止。
(2)導出數據
選中任務/右擊/導出數據
(3)保存數據
選擇合適的導出方式及編碼
我們選擇excel作為導出為格式,數據導出后如下圖