采集思路:
1.先確定你的服務(wù)器是否支持采集
2.尋找響應(yīng)速度快的目標(biāo)網(wǎng)站,當(dāng)然首先要看準(zhǔn)目標(biāo)網(wǎng)站是否防采集的
3.查看源文件,寫正則
4.正則寫好,先預(yù)覽,預(yù)覽正常后再采集
影響采集速度:
1.本身空間的質(zhì)量與速度
2.本身網(wǎng)站的數(shù)據(jù)大小,即數(shù)據(jù)庫的使用情況.
3.目標(biāo)網(wǎng)站的速度及代碼結(jié)構(gòu)
此次教程以新聞系統(tǒng)模型為例,其它的系統(tǒng)模型也是相同的道理,如果有需要再做其它的教程!
有問題可以到論壇去問!我盡量幫大家解答! |