一、如何采集信息
以前聽說過采集的,但是沒自己搞過,一直以為采集是一個十分高大上的技術。這段時間在做一個電商項目,需要往數據庫添加數據,一條一條的添加有點蛋疼,誰有這么多時間做這么沒有意義的事情呢,所以就想到了數據采集,采集京東、天貓的數據多好,多省事呀,于是便行動起來。
做采集,我首先想到的是正則表達式,我還復習了一下正則,但是如何匹配多層嵌套的div的呢?

我的目的就是獲取id="plist"的內容,然后獲取li里面的信息
畫了不少時間,用正則方式沒有找到解決辦法,但是找到另外一種方法--phpQuery。phpQuery用來匹配html中的內容比正則簡單太多了,只要會jquery,使用起來幾乎無障礙。
二、采集案例

一瞬間就保存了60張圖片的,厲害吧!