?火車采集器V7.0正式發(fā)布
讓大家久等了。新版本火車采集器經(jīng)過一年的開發(fā),終于和大家見面了。新版本對(duì)程序進(jìn)行了完全的重構(gòu),升級(jí)為全新的采集平臺(tái)。軟件也更名為 火車頭數(shù)據(jù)采集平臺(tái) ?;疖嚥杉魇腔疖囶^數(shù)據(jù)采集平臺(tái)的默認(rèn)擴(kuò)展。以后大家可以在該平臺(tái)上運(yùn)行論壇采集器,微博采集器,站群客戶端,XX采集器。企業(yè)用戶還可以使用我們提供的API,開發(fā)有自己特色的采集器在平臺(tái)上使用。
新版本添加的功能有:
1、無限級(jí)多頁采集,可以實(shí)現(xiàn)無限深度的采集
2、任務(wù)隊(duì)列運(yùn)行管理,支持Cron表達(dá)式
3、無限級(jí)分組任務(wù)管理,任務(wù)回收站功能
4、RSS地址采集功能
5、列表頁分頁采集獲取功能
6、列表頁附加參數(shù)獲取功能
7、列表頁及標(biāo)簽XPath可視化提取功能
8、標(biāo)簽純正則替換功能
9、Http接口管理采集器運(yùn)行
10、導(dǎo)出記錄為單個(gè)或多個(gè)Txt、html 文件
11、標(biāo)簽間自由組合功能
12、針對(duì)標(biāo)簽內(nèi)容繼續(xù)發(fā)送Http請(qǐng)求功能
13、無限級(jí)列表網(wǎng)址采集
14、從Http頭信息中獲取數(shù)據(jù)
15、標(biāo)題內(nèi)容正文提取功能
16、Aspx列表分頁自識(shí)別
17、多網(wǎng)站站群式web發(fā)布
18、導(dǎo)出記錄為Word格式
19、導(dǎo)出所有記錄為Excel格式
20、使用隨機(jī)二級(jí)代理服務(wù)器(支持Socket代理)
21、多擴(kuò)展間數(shù)據(jù)交換功能
22、下載的圖片自動(dòng)加增強(qiáng)型水印功能
23、Ocr識(shí)別(圖片轉(zhuǎn)化為文字)
24、Mongodb數(shù)據(jù)庫保存數(shù)據(jù)
25、主從服務(wù)器分布式采集
26、內(nèi)置瀏覽器Cookie獲取功能增強(qiáng)
27、任務(wù)列表樹支持無限級(jí)分組
28、Web發(fā)布和數(shù)據(jù)庫入庫支持插件功能
29、起始網(wǎng)址支持等差等比數(shù)列
修改的功能和修復(fù)的問題限于篇幅問題就不一一列出了。
安裝使用:下載軟件包解壓后直接運(yùn)行 LocoyPlatform.exe啟動(dòng)軟件,(保證您的電腦安裝有.net2.0框架,vista及win7系統(tǒng)用戶可能會(huì)提示請(qǐng)求管理員權(quán)限,請(qǐng)放行)。
升級(jí):若要從3.2sp5,2008,2009或2010版直接升級(jí)到火車頭數(shù)據(jù)采集平臺(tái)1.0版,請(qǐng)運(yùn)行程序目錄下的 UpdateTo7.0.exe,按提示進(jìn)行升級(jí)即可。升級(jí)程序不會(huì)對(duì)原來的數(shù)據(jù)進(jìn)行任何的修改,但為了防止用戶誤操作,請(qǐng)?jiān)谏?jí)前備份舊版本數(shù)據(jù)和配置。備份方法是將原采集器完整復(fù)制一份。
商業(yè)版:商業(yè)版用戶請(qǐng)從商業(yè)用戶通道,會(huì)員中心,論壇商業(yè)用戶區(qū)版塊下載到統(tǒng)一的商業(yè)版軟件,使用用戶名或密碼登錄軟件,如果您的升級(jí)服務(wù)期限在2012-02-20后,則可以免費(fèi)升級(jí)到V7版并使用。
下載鏈接:
【免費(fèi)版】http://m.pdslego.cn/Down/LocoySpider/LocoySpiderV7.html?
【商業(yè)版】請(qǐng)登錄會(huì)員中心[ http://m.pdslego.cn/member/licencemgr.php?]或在論壇商業(yè)用戶區(qū)下載
?