get-article: 网络文章存档工具
简介
将一篇网络文章完整地保存到本地,包括正文及其引用的图片、数学公式、音频和视频。
用户再次打开本地存档时,不需要访问任何网络资源。简单地说这个工具就是一个“网络文章”版的 youtube-dl 。
只支持特定的网站,目前已支持:
- 微信公众号
- 知乎专栏
- 更多网站增加中……
用法
Windows 图形界面
运行下载的“get-article-gui”,会弹出如下界面:
您只需输入文章网址,选择保存目录,即可开始下载。
Windows / Linux 命令行
get-article url [output_dir]
第一个参数是 url 。第二个参数是保存目录,如果不传则默认保存到当前目录。
特性
- 保存格式为一个目录里包含 html 及其引用的所有资源文件
- 下载文章引用的图片、数学公式、音频、视频
- 下载图片和视频时,选择最大尺寸和最高质量
- 修正外链:很多网站在跳转外链时会先进入一个自己的页面。get-article 在保存时会直接保存外链,从而去除这一步骤
下载
get-article 是免费软件(freeware),你可以免费使用。
大部分用户推荐使用 Windows 桌面版:get-article-gui.exe(仅支持 64 位 Windows Vista 及以上)
所有下载(操作系统均要求为 64 位):
操作系统版本要求 | 下载链接 | 安装依赖 |
---|---|---|
Windows 桌面(Vista+) | get-article-gui.exe | |
Windows 命令行(Vista+) | get-article.exe | |
Archlinux | get-article-pacman | pacman -S gcc-libs openssl |
Ubuntu 20+ | get-article-apt | apt install libstdc++6 libssl1.1 |
CentOS 8+ | get-article-yum | CentOS 8: yum install libstdc++ openssl-libs CentOS 9: yum install libstdc++ compat-openssl11 |
文件下载完整性校验:sha256sum.txt
FAQ
“网址”应该填什么,有没有样例?
知乎专栏样例
微信公众号样例
- https://mp.weixin.qq.com/s/dK0w66CcTLHje3gQGyBTjQ
数学公式 - https://mp.weixin.qq.com/s?__biz=MzUxNzY0NjU3Mw==&mid=2247485563&idx=1&sn=1ee60ddf6680488cee7bf7b38677b65f&chksm=f995b9f9cee230efa39ee647ecb725012901211d2deaba9c9695aa2cb94ae8639b6276bf0f73#rd
上文的另一种 url 格式 - https://mp.weixin.qq.com/s/RMlbP76Xj71aAwE7GAbRMw
视频
在手机微信中如何得到一篇文章的网址?
右上角三个点 → 复制链接。然后可以通过“文件传输助手”等方式发回到电脑。
“运行日志”是干什么用的?
会输出运行过程中的一些信息。“ERROR”类可能是用户输入有误或是程序中的 bug ,“WARN”类可能是页面上的出现了一些先前没遇到过的元素,程序不知道该如何处理。如果遇到,可以在 github issues 反馈。
下载完成之后,如何打开保存的文章?
- 找到你选择的保存目录,里面会有一个以文章标题命名的文件夹
- 进入此文件夹,找到“index.html”
- 双击打开 index.html ,会用系统默认浏览器打开
更多
更多介绍、讨论、创作背景可参考我的博客文章:https://blog.henix.info/blog/get-article-archiving-tool-release/
问题反馈、功能建议请发到 github issues:https://github.com/henix/get-article-release
版权声明
版权所有 © 2022-2023 henix 保留所有权利
get-article 是免费软件。
- 作为最终用户,你可以在任何情况下免费使用(包括商业用途)
- 禁止对本软件逆向工程
- 你可以复制、分发、传播本软件,请确保副本是完整的,并保留署名或附上官网链接
- 如果你将本软件包含在自己的软件产品中,你的软件产品不得用于商业目的
更新历史
2023-03-25 v1.0.2
修复了微信文章代码块样式错乱的问题 #1
2022-09-21 v1.0.1
修复了如果标题中包含特殊字符则无法保存的问题
2022-09-18 v1.0
初始版本