😁Sử dụng wget sao chép (mirror) tất cả trang có thể truy cập công khai dưới domain psuedu.org (ok)

Câu này có nghĩa là:

"Hãy sử dụng wget để sao chép (mirror) tất cả các trang có thể truy cập công khai dưới domain psuedu.org về môi trường cục bộ (local)."

Giải thích chi tiết từng phần:

  • use wget → sử dụng công cụ wget (một chương trình dòng lệnh để tải dữ liệu từ web)

  • mirror → sao chép toàn bộ website, giữ nguyên cấu trúc thư mục, giống như bản sao offline

  • all publicly accessible pages → tất cả các trang công khai, không cần đăng nhập

  • under the psuedu.org domain → thuộc domain psuedu.org

  • to a local environment → về máy tính của bạn (localhost, ổ cứng)


Hiểu đơn giản

Mục tiêu là:

👉 Tải toàn bộ website psuedu.org về máy 👉 Sau đó bạn có thể mở và xem offline giống như website thật


Ví dụ lệnh wget thường dùng để mirror website

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://psuedu.org

Ý nghĩa các tham số:

Tham số
Ý nghĩa

--mirror

bật chế độ mirror (recursive + giữ cấu trúc)

--convert-links

sửa link để chạy offline

--adjust-extension

thêm .html nếu cần

--page-requisites

tải CSS, JS, images

--no-parent

không tải thư mục cha


Sau khi chạy

Bạn sẽ có cấu trúc kiểu:

Mở bằng:


Thường dùng trong các trường hợp:

  • backup website

  • clone website để test local

  • pentest / security testing

  • tạo bản offline


Nếu bạn muốn, mình có thể viết lệnh wget chuẩn nhất để clone website và chạy local với Apache / Next.js / Node.js.

Sử dụng wget như nào hướng dẫn tôi cài đặt

Mình sẽ hướng dẫn bạn từ cài đặt → sử dụng wget → mirror website → chạy local, áp dụng cho Windows, Linux và Mac.


1. wget là gì

wget là công cụ dòng lệnh dùng để:

  • tải file từ internet

  • tải toàn bộ website

  • backup website

  • chạy trên Linux, Mac, Windows


2. Cài đặt wget

Windows (cách dễ nhất)

Cách 1 — dùng Winget (khuyên dùng)

Mở Command Prompt hoặc PowerShell:

Sau khi cài xong, kiểm tra:


Cách 2 — tải file exe thủ công

  1. Tải tại:

https://eternallybored.org/misc/wget/arrow-up-right

  1. tải file:

  1. giải nén

  2. copy wget.exe vào:

  1. mở cmd test:


Linux (Ubuntu) – bạn đang dùng Ubuntu nên rất dễ

Kiểm tra:


MacOS


3. Cách sử dụng wget cơ bản

tải file đơn


tải file và đổi tên


tải vào thư mục


4. Mirror toàn bộ website

Ví dụ mirror psuedu.org:


5. Giải thích quan trọng

option
nghĩa

--mirror

clone toàn bộ website

--convert-links

sửa link chạy offline

--page-requisites

tải css, js, image

--adjust-extension

thêm .html

--no-parent

không đi ra ngoài domain


6. Sau khi chạy sẽ có thư mục

mở bằng:


7. Mirror website nhanh và chuẩn nhất (khuyên dùng)


8. Mirror và giới hạn tốc độ (tránh bị block)


9. Mirror và lưu log


10. Mirror vào thư mục riêng

kết quả:


11. Chạy website offline bằng local server (khuyên dùng)

Nếu bạn có Node.js:

hoặc Python:

mở:


12. Ví dụ thực tế hoàn chỉnh


13. Lỗi thường gặp

wget không nhận diện

Windows:

→ chưa cài hoặc chưa add PATH


bị chặn

thêm user agent:


14. Lệnh chuyên nghiệp nhất (khuyên dùng)


Nếu bạn muốn, mình có thể viết lệnh wget tối ưu nhất cho:

  • clone WordPress

  • clone website có login

  • clone website chạy React / Next.js

  • clone website không bị block

Bạn đang dùng Windows hay Ubuntu?

Last updated