许多 Windows 用户已经习惯于将图形界面和 Web 浏览器作为首选的通用工具,以至于忘记了还有许多其他工具可供选择。 Wget 是一个 GNU 命令行实用程序,主要在 Linux 和 Unix 社区中流行,主要用于从 Internet 下载文件。但是,有一个适用于 Windows 的 wget 版本,使用它你可以下载任何你喜欢的东西,从整个网站到电影、音乐、播客和在线任何地方的大文件。
没有多少微软用户知道这个简洁的工具,这就是为什么我写了这个在 Windows 中使用 wget 的初学者指南。我们倾向于使用我们的浏览器来处理所有事情,这很好,但它并不总是实现某些目标的最有效方式。 Wget 只是众多工具中的一种,这些工具已经存在了很长时间,但很少有人知道。
为 Windows 获取 wget
获取 wget 非常容易。按照本指南安装和配置 wget。
- 从这里下载 wget 并安装它。确保它是安装程序而不仅仅是源,否则它将无法工作。
- 安装后,您现在应该可以从命令行窗口访问 wget 命令。以管理员身份打开 CMD 窗口并输入“wget -h”进行测试。如果它有效,你就是黄金,如果你得到“无法识别的命令”,那么你下载了错误的包。再试一次。
- 设置下载目录以保存所有文件。键入“md 目录名称”以创建下载目录。我称我的“downloadz”为可识别的。
安装完成后,您就可以开始工作了。下面我列出了一些流行的 wget 命令,它们可以实现广泛的功能。
下载单个文件
wget //website.com/file.zip
下载单个文件,但将其另存为其他文件
wget ‐‐output-document=newname.html website.com
下载到特定文件夹
wget ‐‐directory-prefix=folder/subfolder website.com/file.zip
恢复中断的下载
wget - 继续 website.com /file.zip
下载较新版本的文件
wget ——继续 ——时间戳 website.com/file.zip
下载多个网页
为此,您需要在记事本或其他文本编辑器中创建一个列表。在单独的行中添加一个新的完整 URL(带 //)。然后将 wget 指向该文件。在本例中,我将文件命名为 Filelist.txt 并将其保存在 wget 文件夹中。
wget - 输入 Filelist.txt
下载整个网站
wget - 执行机器人=关闭 - 递归 - 无父级 - 继续 - 无破坏 //website.com
您可能会发现,正如我经常做的那样,Web 主机会阻止 wget 命令。您可以尝试通过冒充 Googlebot 来欺骗这些块。尝试输入:
wget –user-agent="Googlebot/2.1 (+//www.googlebot.com/bot.html)" -r //website.com
从网站下载特定文件类型
wget --level=1 --recursive --no-parent --accept FILETYPE //website.com / FILETYPE/
例如,将 FILETYPE 更改为 MP3、MP4、.zip 或任何您喜欢的格式。
下载所有网站图片
wget --目录前缀=文件/图片--无目录--递归--无破坏--接受jpg,gif,png,jpeg //website.com/images/
检查网站是否有损坏的链接
wget ‐‐output-file=logfile.txt ‐‐recursive ‐‐spider //website.com
下载文件而不会使网络服务器过载
wget--limit-rate=20k--wait=60--random-wait--mirror //website.com
wget 命令有数百个,如果不是数千个的话,我在这里只向您展示了其中的几个。既然您已经熟悉了该工具及其工作原理,那您就可以使用它了!
你有什么很酷的命令可以创造奇迹吗?在下面与我们分享!