更新歷史

3.0.2.0

2020/11/13

  • 修復腳本命令單步測試錯誤

3.0.1.9

2020/11/13

  • 新增進程內運行任務,以解決部分網站不能登陸問題
  • 修改對系統設置縮放的兼容
  • 優化任務搜索
  • 修復網址生成的一個bug
  • 修復數據預覽的問題
  • 優化列表識別和分頁識別
  • 修復網站加載慢導致無法采集數據問題

3.0.1.8

2020/10/10

  • 增加起始網址的最大數量
  • 優化編輯器點擊字段列頭卡的問題
  • 增加預覽網址
  • 增加記住窗口大小設置
  • 增加網址生成時間格式
  • 解決網址生成[嵌套的問題
  • 補全圖片地址 增加補全a鏈接
  • 修復其他問題

3.0.1.7

2020/9/7

  • 修復一個下載文件名檢測
  • 識別列表時不過濾表格列
  • 優化數據處理 http post
  • 修復一些網站卡死、打不開問題
  • 修復其他問題

3.0.1.6

2020/8/3

  • 升級 Chrome 內核
  • 程序支持64位,可用內存更大
  • 增加任務查找功能
  • 導出excel、csv時支持追加模式
  • 增加運行歷史記錄功能
  • 優化列表識別、分頁識別算法
  • 豐富采集日志信息
  • 增加備份全部任務、導入備份功能,方便遷移
  • 提升采集速度,修復其他問題

2.5.0.0

2020/4/18

  • 優化測試網址的邏輯
  • 完善csv的寫入轉義
  • 增加補全圖片相對地址功能
  • 修復cookie value逗號問題
  • 修復http請求br編碼問題
  • 增加ctrl+拖動 復制字段功能
  • 修復探測文件名時的問題
  • 修復文件名超長問題

2.4.9.0

2019/11/22

  • 優化網頁表格數據的識別,可按照表格列名自動命名字段
  • 優化時間提取
  • 修復當有自定義字段,沒有匹配到不保存數據的問題
  • 添加時間戳變量
  • 計劃任務,每間隔分鐘增加開始秒

2.4.8.0

2019/10/23

  • 修復運行狀態不顯示采集數量問題
  • 修復程序不正常退出問題
  • 修復導入任務,界面卡死問題
  • 修復一個下載文件名問題

2.4.7.0

2019/10/13

  • 增加任務超時設置,超時任務強制結束
  • 增加程序啟動進度
  • 修改清除HTML標簽功能,添加保留模式
  • 修復計劃任務一個bug
  • 修復瀏覽器模式下的請求重試bug
  • 修復計劃任務分組重名導致添加失敗問題
  • 去除打碼平臺
  • 優化http編碼檢測
  • 優化采集效率

2.4.6.0

2019/9/4

  • 增加刪除全部測試地址菜單
  • 新增數據處理,設置默認值
  • 增加暫停任務時,可修改部分設置功能
  • 增加批量生成網址補零的選項
  • 請求重試中增加暫停任務的選項
  • 對jsonpath增加向上操作符($$.x,類似于XPath的../
  • 修改導出數據窗口的顯示方式,可以同時導出多個任務數據
  • 優化軟件性能,修改其他小問題

2.4.5.0

2019/7/16

  • 主界面增加賬號到期時間
  • 對 [數據處理] -[添加前后綴] 增加變量按鈕
  • 優化圖片識別功能
  • 腳本命令支持批量參數,從網址參數 a=b 中提取
  • 字段jsonpath支持多值
  • 增加代理的用戶名和密碼功能

2.4.4.0

2019/4/25

  • 該版本需要通過下載安裝包安裝,不能從程序內更新
  • 修改導出規則為.pshx后綴格式,并且添加文件關聯
  • 對下載文件重名的自增方式修改
  • 增加FormattedText屬性,可以獲取格式化的文本內容,而非InnerText的混亂文本
  • 修復運行時間長后,磁盤占用太大問題
  • 優化xpath相關

2.4.3.0

2019/3/6

  • 修復iframe問題
  • 優化文件下載功能
  • 完善界面提示
  • 優化偶爾啟動任務時報錯問題
  • 優化正文提取功能

2.4.2.0

2019/1/16

  • 新增數據處理,日期提取功能
  • 修改對任務字段增刪改操作時,不刪除已采集數據
  • 優化列表算法
  • 優化界面操作提示
  • 修改一個下載名自動探測問題
  • 增加下載器線程設置(選項-高級)
  • 在生成xpath窗口,添加設置到字段按鈕
  • 優化計劃任務cron部分,增加提示和測試

2.4.1.0

2018/12/17

  • 增加對onclick鏈接的識別及自動轉換
  • 瀏覽器工具欄按鈕,增加腳本命令、模式切換按鈕
  • json引擎下,添加字段時自動重命名
  • 優化批量生成網址,修復海量網址導致內存溢出
  • 修復無法清空緩存問題
  • 修復自動分頁的一個bug

2.4.0.0

2018/11/5

  • 對瀏覽器內核進行升級(Firefox 52)
  • 修復部分網站的兼容問題
  • 注意:如果之前有安裝過,請先卸載老版本
  • 注意:卸載后不要刪除程序目錄,里面包含規則文件

2.3.0.1

2018/10/24

  • 新增請求重試
  • 新增設置任務運行窗口最大化
  • 增加導出到郵箱
  • 增加https tls1.2選項
  • 優化數據導出界面
  • 修復瀏覽器語言問題,可以在自定義Header中設置
  • 修改規則的發布配置,只保存配置名稱
  • 完善瀏覽器模式的POST
  • 輸入腳本命令支持select option 按照%1索引方式來選擇
  • 修復一個特殊分頁問題
  • 移除路由和adsl撥號功能

2.3.0.0

2018/9/26

  • 在任務運行窗口,新增導出按鈕
  • 新增瀏覽器右擊菜單 XPath生成,生成圖片列表XPath
  • 數據查看器,新增按照導出狀態顯示數據
  • 優化XPath生成算法
  • 優化分頁識別算法
  • 優化選擇列表功能,只需要點擊一次即可識別列表
  • 修改正則匹配忽略大小寫
  • 修復一些插件問題
  • 修復字段拖動切換順序導致無法拖大小
  • json分頁支持組合形式,比如 設置分頁的JSONPath為http://xxx.com/?{$.next}

2.2.0.0

2018/8/30

  • 新增簡易采集,內置主流網址的采集模板
  • 增加打開任務分組文件夾菜單
  • 新增瀏覽器右擊菜單 XPath生成,可按照文本和前綴生成XPath
  • 新增通過拖動字段來調整字段順序
  • 完善圖片下載功能
  • 修復發布的一些問題
  • 定時清空任務運行日志
  • 任務運行日志自動保存到文件
  • 數據處理-字符轉碼-轉換HTML到文本
  • 修改導出數據的選擇字段移到文件類型中
  • 優化瀏覽器引擎下的超時問題
  • 修復部分頁面瀑布流無效問題
  • 優化滾動的腳本命令,可設置滾動頁數(之前是滾動到底部

2.1.8.0

2018/7/21

  • 增加插件功能
  • 增加導出 txt (一條保存為一個文件)
  • 多值連接符支持換行符
  • 修改數據處理的文本映射(支持查找替換)
  • 修復登陸時的DNS問題
  • 修復圖片下載問題
  • 修復 json 一些問題

2.1.7.0

2018/6/25

  • 修復若干 BUG
  • 登陸窗口添加清空 cookie 功能
  • 優化數據導出功能
  • 增加 post 數據粘貼(multipart/form-data
  • 修復 http 引擎下的UA沒生效
  • 修復文件下載問題
  • 修復 http 請求不能指定編碼問題
  • 新增更新模式(二次采集時,如果某唯一字段重復,則其他字段數據 update 到數據庫
  • 新增不檢查分頁地址重復功能
  • 修復滾動命令參數顯示問題
  • 修復計劃任務相關問題
  • 優化 json 提取

2.1.6.0

2018/5/19

  • 優化列表識別算法
  • 修復瀏覽器引擎下設置 Referer 問題
  • 優化執行 C# 代碼功能
  • 優化瀑布流分頁
  • 優化 Excel 導出,大大減少內存消耗
  • 修復文件下載的一些問題
  • 兼容 Iframe 類型網頁
  • 新增設置數據為已導出菜單
  • 修復分頁無數據停止導致不能自動導出數據
  • 優化 Web 發布,增加 Header,自定義標識

2.1.5.0

2018/5/8

  • 新增 POST 方式采集(采集速度更快
  • 新增 數據處理-文本映射功能
  • 數據處理-字符轉碼-ToDate 增加時間戳轉時間
  • 新增采集腳步在分頁執行選項
  • 新增導出數據庫字段映射
  • 新增導出倒序
  • 修復高級過濾的一些問題
  • 修改計劃任務的模式(阻塞導致內存增長
  • 完善 JSON 引擎
  • 完善文件下載功能
  • 修復導出數據的一些問題
  • 優化數據查看查看的體驗
  • 修復若干問題

2.1.4.0

2018/3/14

  • 新增數據處理 - 正文提取
  • 新增數據處理 - HTTP POST 請求
  • 數據數據處理 - 字符轉碼 - 提取時間格式
  • 新增高級過濾 - 按長度過濾
  • 新增數據處理 - 前后綴增加引用字段
  • 新增設置,分頁重復N頁停止采集
  • 新增導出配置管理窗口
  • 新增運行完關閉窗口選項
  • 新增數據查看-ID 倒序
  • 新增請求超時選項
  • 新增從剪切板復制 Http Header 功能
  • 修改正則提取時,直接從 Response 獲取 Html
  • 對 Referer 中可能包含中文進行 UrlEncode
  • 修改導出 MySQL 測試連接可能失敗問題
  • 修復補全網址時,沒用 baseURL 問題
  • 優化清除 HMTL 標簽功能
  • 對字段名稱進行檢查
  • 修改測試網址默認添加5條
  • 優化URL補全功能
  • 當然字段 XPath 為空時,使用RawHTML作為輸入
  • 優化瀑布流分頁的代碼接口
  • 修復配置文件讀取的問題

2.1.3.0

2018/2/27

  • 新增驗證碼識別功能
  • 新增JSON格式采集,使用 JSONPath 提取數據
  • 新增 數據處理-執行 JS
  • 新增 數據處理-執行 C# 代碼
  • 新增 自定義HTTP Header
  • 采集腳本中表單輸入命令,增加變量
  • 修復導出 Excel 時,數字前綴0消失問題
  • 修復計劃任務的更新問題
  • 優化分頁算法
  • 修復下載文件路徑不能更改問題

2.1.2.0

2018/2/7

  • 新增 Html 轉換為 UBB 的數據處理步驟
  • 新增任務的復制、粘貼功能
  • 優化列表識別算法
  • 優化分頁識別算法
  • 優化性能
  • 修復 URL 最后/移除問題
  • 修復字段菜單在滾動條內不能彈出問題

2.1.1.0

2018/1/8

  • 修復分頁的采集優先級
  • 提前檢驗 XPath 和正則的正確性
  • 其他使用了 Inputbox 的驗證修改
  • 增加數據處理-前后綴
  • nsi轉為utf8編碼,修復英文系統下亂碼問題
  • 修復小分辨率下,窗口超過屏幕問題
  • 新增路由撥號和 adsl 撥號功能
  • 對等待命令增加等待某元素
  • 修復 form 的解析
  • 任務列表按時間順序排列
  • 完善探測列表數據(列表就是a元素
  • 修復下載文件無后綴問題
  • 新增高級過濾功能
  • 添加鼠標和鍵盤的模擬操作
  • 增大滾動頁數

2.1.0.0

2017/12/21

  • 優化分頁識別算法
  • 新增導出 txt
  • 新增采集前執行腳本命令
  • 文件下載提升到字段菜單
  • 文件下載新增按照指定變量定義路徑,及替換原地址
  • 修復url #號后帶參數問題
  • 修復一些小bug

2.0.0.5

2017/12/10

  • 修復https的代理證書問題
  • 新增瀑布流分頁
  • 修復widows經典樣式下的界面問題

2.0.0.4

2017/11/30

  • 新增導出、導入和清空數據的右鍵菜單
  • 新增刪除測試網址的菜單
  • 修復保存任務時,計劃任務不生效問題
  • 修復管理員權限重啟任務時參數問題
  • 修復Http引擎下的代理問題
  • 修復編輯器http模式下cookie問題
  • 修復一個xpath含有form無法獲取元素問題
  • 修復多級頁面下Webbrowser無法釋放問題
  • 將瀏覽器模式下的分頁也加入到檢查重復就停止