# cnblog2md **Repository Path**: schips/cnblog2md ## Basic Information - **Project Name**: cnblog2md - **Description**: 将博客园(cnblog)备份文件(CNBlogs_BlogBackup.xml)转换为单个文件(.md) - **Primary Language**: Shell - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 2 - **Created**: 2022-03-03 - **Last Updated**: 2023-08-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # cnblog_xml_to_md 将博客园xml转换为markdown文件,分3个阶段 | 阶段 | 处理前 | 处理后 | | ------------------------- | ------------ | ---------------------------------------- | | 1、解析xml | 博客园xml | markdown文件(内容保持不变,单纯地解析) | | 2、图片本地化 | markdown文件 | markdown文件&图像目录(图片链接本地化) | | 3、本地图片变为base64编码 | markdown文件 | markdown文件(本地化图片base64化) | 这3个阶段都是一环扣一环的,依次执行 s1,s2,s3 的脚本文件即可(下文有详细说明) > 建议在 Linux 机器上执行。 ## 介绍 ### s1.cnblog2file.py 将博客园xml转换为markdown文件 感谢:https://www.cnblogs.com/Coder-Photographer/p/14221034.html 使用时, 导入 博客园的 xml文件。 执行:`python3 s1.cnblog2file.py [CNBlogs_BlogBackup.xml]` > 第一个参数为 博客园xml;如果不存在,默认寻找当前目录下的 `CNBlogs_BlogBackup.xml` 执行后,会在`parserResult1`下生成有关的文件 ### s2.markdownFileLocalized.sh 遍历markdown目录,将md文件中的图像本地化。 感谢:https://www.jianshu.com/p/801750d5a735 执行:`./s2.markdownFileLocalized.sh [parserResult1]` > 第一个参数为 博客园xml解析后的目录;如果不存在,默认寻找当前目录下的 `parserResult1` 执行后,会在`parserResult2`下生成有关的文件 ### s3.markdownFileLocalized2base64img.sh markdown本身支持:把大段的base64字符串放在文章末尾,再在文章中通过一个id来引用,以达到排版正常。 这个工具就是根据这个特性,把图片链接转换为base64语法,并自动添加到文件的后面。 感谢:https://github.com/HappyFreeAngel/markdown-auto-import-image-as-base64 执行:`./s3.markdownFileLocalized2base64img.sh [parserResult2]` 执行后,会在`parserResult3`下生成有关的文件。