數據導出

爬山虎采集器支持多個格式的數據導出(發布),包括TXT、CSV、Excel、Access、MySQL、SQLServer、SQLite以及發布到網站接口(Api)。 數據導出

導出方式有2種:

  • 手動導出,通過右擊任務-> 導出任務,或者是在查看數據中導出。
  • 自動導出,在編輯任務的第三步中設置導出。

數據導出 數據導出

在數據導出后,會被標記為已導出,在下次導出時,不會再導出。 如果想要導出全部數據,而不區分已導出,可以在查看數據中選擇導出全部


導出到Excel、CSV、TXT

可以將數據導出到Excel、CSV、TXT文件中,每次導出將會生成新的文件。 軟件支持對導出的文件名設置變量,目前有2種格式變量,按照任務名日期格式

數據導出

導出TXT目前支持一條記錄保存為一個文件。可以根據字段值來定義文件名稱,導出的內容格式也可以自定義模板

數據導出


導出到網站接口(API)

支持主流CMS網站系統,比如Discuz、帝國CMS、Wordpress、DEDE CMS、PHP CMS,官方可以提供接口文件(API)。

對于開發人員,可以自己定義網站API,爬山虎采集器的通過HTTP POST請求將數據發送指定的API,設置對應的POST(application/x-www-form-urlencoded)參數、編碼類型即可

數據導出

POST示例參考

POST http://www.example.com HTTP/1.1 
Content-Type: application/x-www-form-urlencoded;charset=utf-8 

title=example_title&content=example_content&channel=2


導出到數據庫

目前采集器支持導出到MySQL、SQLServer、SQLite、Access四種數據庫,設置好數據庫的連接配置,指定導出的目標表名稱。

同時,可以設置本地的任務字段與目標數據庫字段之間的映射關系(對應關系)

數據導出

數據庫的字段映射設置

數據導出