Cập nhật phần mềm crawl dữ liệu Scan Web Pro 2026

Đánh giá bài viết

Phần mềm crawl dữ liệu Scan Web Pro vừa tung phiên bản 1.1.3.0 với nhiều tính năng mới giúp thu thập dữ liệu web nhanh và chính xác hơn. Bản cập nhật này bổ sung cách nhập link dạng danh sách file HTML, tối ưu tốc độ load cấu hình, và thêm mẫu XPath thông dụng để viết biểu thức dễ dàng hơn.

Nhập link từ danh sách file HTML

Tính năng mới nổi bật nhất là cho phép bạn nhập link dưới dạng danh sách file HTML thay vì chỉ URL đơn lẻ.

Bổ sung cách nhập link là danh sách file HTMLBổ sung cách nhập link là danh sách file HTMLGiao diện nhập link dạng danh sách file HTML trong Scan Web Pro
Chọn ra các file mà nội dung là HTMLChọn ra các file mà nội dung là HTMLChọn các file có nội dung HTML để crawl dữ liệu

Các file này chứa nội dung HTML mà bạn cần trích xuất dữ liệu. Danh sách file có thể xuất ra từ phần mềm khác hoặc lưu thủ công từ trình duyệt.

Lưu thủ công từng trang web ra file HTMLLưu thủ công từng trang web ra file HTMLLưu trang web thành file HTML bằng trình duyệt

Lợi ích thực tế: Khi crawl website bị chặn hoặc cần xử lý offline, bạn lưu trước các trang HTML rồi dùng phần mềm crawl dữ liệu này để trích xuất hàng loạt. Tiết kiệm thời gian hơn nhiều so với crawl trực tiếp từng URL.

Đọc thêm  Cách sửa lỗi không mở được phần mềm HTKK bản mới nhất 2026

Mẫu XPath thông dụng tích hợp sẵn

Phiên bản 1.1.3.0 bổ sung thư viện mẫu XPath giúp bạn viết biểu thức nhanh chóng.

Chọn nhanh mẫu những cụm XPath hay dùngChọn nhanh mẫu những cụm XPath hay dùngThư viện mẫu XPath có sẵn trong phần mềm

Các mẫu XPath cơ bản:

  • contains(): Tìm phần tử chứa chuỗi ký tự trong thuộc tính hoặc text. Ví dụ: //div[contains(@class, 'product')] tìm div có class chứa “product”
  • starts-with(): Tìm phần tử bắt đầu bằng chuỗi ký tự. Ví dụ: //a[starts-with(@href, 'https')] tìm link bắt đầu bằng https
  • not(): Phủ định điều kiện, thường dùng để loại trừ phần tử không có thuộc tính. Ví dụ: //span[not(@class)] tìm span không có class
  • //following-sibling::span: Di chuyển đến phần tử span liền sau phần tử hiện tại cùng cấp
  • /parent::span: Di chuyển đến phần tử span cha

Mẹo: Chọn mẫu XPath gần nhất với cấu trúc HTML bạn cần, sau đó chỉnh sửa nhỏ thay vì viết từ đầu. Giảm 70% thời gian viết biểu thức.

Nhà phát triển sẽ bổ sung thêm nhiều mẫu XPath phức tạp hơn trong các bản cập nhật tiếp theo.

Xóa dòng trống theo cột

Tính năng lọc dữ liệu mới cho phép xóa các dòng có giá trị trống ở cột bạn chọn.

Click phải chuột vào cột Email để xóa dòng trống email

Dữ liệu sau khi xóa những dòng trống emailDữ liệu sau khi xóa những dòng trống emailKết quả sau khi lọc bỏ dòng trống

Ứng dụng: Khi crawl danh sách sản phẩm, một số sản phẩm thiếu giá hoặc email liên hệ. Dùng tính năng này để loại bỏ ngay các dòng không đủ thông tin, tránh phải lọc thủ công trong Excel.

Đọc thêm  Phần mềm kế toán là tài sản gì theo quy định 2026?

Tối ưu tốc độ load cấu hình

Nút “CHỌN WEBSITE” giờ load danh sách cấu hình nhanh hơn 40% so với phiên bản cũ.

Bấm CHỌN WEBSITE sẽ load danh sách cấu hình nhanh hơnBấm CHỌN WEBSITE sẽ load danh sách cấu hình nhanh hơnGiao diện chọn website với tốc độ load được cải thiện

Từ phiên bản này, bạn có thể xem danh sách cấu hình có sẵn tại: https://seoiclick.com/cau-hinh-quet-website

Lưu ý: Nếu crawl website phổ biến như Shopee, Lazada, Facebook, kiểm tra danh sách cấu hình có sẵn trước. Tiết kiệm thời gian viết XPath từ đầu.

Cách nâng cấp lên phiên bản mới

Có 2 cách nâng cấp phần mềm crawl dữ liệu Scan Web Pro:

Cách 1 – Nâng cấp tự động:

  1. Mở phần mềm Scan Web Pro
  2. Bấm nút “UPDATE” trên giao diện chính
  3. Đợi phần mềm tải và cài đặt tự động

Cách 2 – Cài đặt thủ công:

  1. Gỡ phiên bản cũ: Win+R → gõ appwiz.cpl → Enter → Tìm Scan Web Pro → Uninstall
  2. Tải gói cài đặt mới từ trang chủ
  3. Chạy file setup và cài đặt như bình thường

⚠️ Backup dữ liệu trước khi gỡ: Xuất các cấu hình XPath quan trọng ra file trước khi gỡ phần mềm, tránh mất dữ liệu.

Phiên bản 1.1.3.0 của Scan Web Pro mang đến nhiều cải tiến giúp crawl dữ liệu web hiệu quả hơn, đặc biệt với tính năng nhập file HTML và thư viện XPath có sẵn. Nếu cần hỗ trợ thêm, liên hệ nhà phát triển qua trang chủ seoiclick.com.

Đọc thêm  Hướng dẫn cài phần mềm Vietmap cho ô tô bản quyền 2026

Ngày cập nhật gần nhất 11/03/2026 by Thành Tín

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *