采集電商平臺中的店鋪、產(chǎn)品屬性,銷量及評價信息,可用于復(fù)制爆款、潛在市場挖掘及輿情分析。
二、具體案例
1、目標網(wǎng)站:以采集淘寶店鋪為例,網(wǎng)址http://www.taobao.com
①在淘寶首頁輸入關(guān)鍵詞進行檢索,對檢索結(jié)果中的店鋪實施采集;
②對店鋪信息以及店鋪內(nèi)相應(yīng)產(chǎn)品的信息實施采集。
①價格、銷量等屬性有時是在js文件中動態(tài)加載的,在網(wǎng)頁源代碼中沒有相應(yīng)的描述,因此通過源代碼解析無法完成采集;
②頻繁訪問頁面有時會出現(xiàn)驗證碼,影響采集實施的效率。
使用火車瀏覽器的xpath采集,可以直接點擊提取頁面上的價格、銷量等;如果出現(xiàn)驗證碼,可以使用自動打碼功能。
可采集電商平臺中的店鋪名稱、產(chǎn)品鏈接、產(chǎn)品名稱、價格、銷量、店鋪地址,店鋪評分等。