henix's software lab

get-article: 网络文章存档工具

简介

将一篇网络文章完整地保存到本地,包括正文及其引用的图片、数学公式、音频和视频。

用户再次打开本地存档时,不需要访问任何网络资源。简单地说这个工具就是一个“网络文章”版的 youtube-dl 。

只支持特定的网站,目前已支持:

用法

Windows 图形界面

运行下载的“get-article-gui”,会弹出如下界面:

您只需输入文章网址,选择保存目录,即可开始下载。

Windows / Linux 命令行

get-article url [output_dir]

第一个参数是 url 。第二个参数是保存目录,如果不传则默认保存到当前目录。

特性

下载

get-article 是免费软件(freeware),你可以免费使用。

大部分用户推荐使用 Windows 桌面版:get-article-gui.exe(仅支持 64 位 Windows Vista 及以上)

所有下载(操作系统均要求为 64 位):

操作系统版本要求 下载链接 安装依赖
Windows 桌面(Vista+) get-article-gui.exe
Windows 命令行(Vista+) get-article.exe
Archlinux get-article-pacman pacman -S gcc-libs openssl
Ubuntu 20+ get-article-apt apt install libstdc++6 libssl1.1
CentOS 8+ get-article-yum CentOS 8: yum install libstdc++ openssl-libs
CentOS 9: yum install libstdc++ compat-openssl11

文件下载完整性校验:sha256sum.txt

历史版本下载

FAQ

“网址”应该填什么,有没有样例?

知乎专栏样例

微信公众号样例

在手机微信中如何得到一篇文章的网址?

右上角三个点 → 复制链接。然后可以通过“文件传输助手”等方式发回到电脑。

“运行日志”是干什么用的?

会输出运行过程中的一些信息。“ERROR”类可能是用户输入有误或是程序中的 bug ,“WARN”类可能是页面上的出现了一些先前没遇到过的元素,程序不知道该如何处理。如果遇到,可以在 github issues 反馈。

下载完成之后,如何打开保存的文章?

  1. 找到你选择的保存目录,里面会有一个以文章标题命名的文件夹
  2. 进入此文件夹,找到“index.html”
  3. 双击打开 index.html ,会用系统默认浏览器打开

更多

更多介绍、讨论、创作背景可参考我的博客文章:https://blog.henix.info/blog/get-article-archiving-tool-release/

问题反馈、功能建议请发到 github issues:https://github.com/henix/get-article-release

版权声明

版权所有 © 2022-2023 henix 保留所有权利

get-article 是免费软件。

更新历史

2023-03-25 v1.0.2

修复了微信文章代码块样式错乱的问题 #1

2022-09-21 v1.0.1

修复了如果标题中包含特殊字符则无法保存的问题

2022-09-18 v1.0

初始版本