19 tháng 9, 2015

Bài 4 : SEARCH Lệnh lấy thông tin trong 1 site

Đây là một lệnh hỗ trợ bạn lấy thông tin ! bạn có thể làm 1 auto get info,...


SEARCH SOURCE=TXT hoặc REGEXP:"Nhận dạng dữ liệu cần lấy" IGNORE_CASE=YES EXTRACT=$1


EXTRACT trong đây đóng vai trò như 1 nơi lưu giữ thông tin tạm thời và $1 chính là thông tin.


Ví dụ:
Mình có 1 địa chỉ profile facebook của 1 bạn và mình cần lấy UID facebook của bạn đấy. Có 1 trang hỗ trợ chuyển URL profile facebook sang UID facebook.
Trang findmyfacebookid.com hỗ trợ làm việc này và mình chỉ cần post URL profile facebook vào và nhấn Find numeric ID là hiển thị UID của URL profile đấy.


Và lệnh SEARCH có vai trò nhận dạng ra vị trí của dãy số UID.


Bạn nhấn view page source ở trang hiển thị UID để xem vị trí nó nằm trong đống code như thế nào. Bạn có thể sử dụng Ctrl + F và paste vào thông tin cần tìm như mã UID hiển thị trang trang.


và mình tìm thấy UID của mình với các dòng code xung quanh
<code>100005640430xxx</code>
Vậy là có thể tìm cách để nhận diện ra vị trí của mã UID facebook rồi


Ta có code sau:


SEARCH SOURCE=REGEXP:"<code>([^><]+)</code>" IGNORE_CASE=YES EXTRACT=$1

([^><]+) có tác dụng là nhận dạng những gì ở giữa 2 <code></code> và lưu vào $1

Lưu ý: Định dạng ([^*]+) Dấu * chứa 2 kí tự bên cạnh ([^*]+).

Bây giờ bạn chạy thử đoạn code này xem UID profile facebook của bạn là gì nhé:


TAB T=1 URL GOTO=http://findmyfbid.com/ TAG POS=1 TYPE=INPUT:TEXT FORM=NAME:NoFormName ATTR=NAME:url CONTENT=(Địa chỉ profile facebook của bạn)
TAG POS=1 TYPE=BUTTON FORM=NAME:NoFormName ATTR=TXT:Find<SP>numeric<SP>ID<SP>→
SEARCH SOURCE=(REGEXP):"<code>([^><]+)</code>" IGNORE_CASE=YES EXTRACT=$1

2 nhận xét:

  1. Code này bị lỗi dòng SEARCH rồi bác ơi, giúp em với : "wrong format of SEARCH command, line 5 (Error code: -910)"

    Trả lờiXóa
    Trả lời
    1. à, đã tìm được lỗi rồi, sửa thành SOURCE=REGEXP nhé. không có dấu "()" :)

      Xóa