找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 8|回复: 0

把 PDF、PPT、白皮书、方案书、课程资料、长截图这类“视觉文档”,重建成结构可靠的 Markdown

[复制链接]
发表于 昨天 17:00 | 显示全部楼层 |阅读模式
我做了一个 Skill:ky-markdown-rebuilder


专门把 PDF、PPT、白皮书、方案书、课程资料、长截图这类“视觉文档”,重建成结构可靠的 Markdown,因为 AI 读这些源文件会比较差,Markdown 除了可以让 AI 更好地读文件,还能把这些源文件变成可利用可重新构建的资产


微软官方已经有 MarkItDown,但用过的都知道其实很不好用,它更适合做“格式转换”和“文字抽取”


普通 Word、网页、线性 PDF,用 MarkItDown 就够了。
一旦遇到 PPT、销售 deck、图表等等比较复杂的报告,问题会很多:


左右栏会混在一起、时间线会乱序、架构图会变成散字、表格、截图、注释容易挤成一团,AI 后面再读,就会把乱文本当真


ky-markdown-rebuilder 会先抽文本,再把原文件渲染成一页页截图,对照真实版面重新整理 Markdown


它可以做到:


1、按页还原
每一页单独成节,不把相邻页面揉在一起


2、按视觉关系整理
左右栏、卡片、流程图、时间线、对比矩阵、截图说明,会按原来的结构重建


3、适合复杂文档
PPT、PDF 报告、白皮书、课程资料、产品 deck、销售方案书、长截图都能处理


4、支持深度视觉模式
遇到信息密度高的页面,会专门检查布局、图表、模块关系,不只是抽几行文字


5、能继续生成大纲
如果需要 outline,会基于校准后的 Markdown 生成,而不是直接拿乱序文本总结


我用初中化学课本还有今天合作伙伴发的PPT,做出来放了一些效果示例图,看下面图片可以直观地看到效果


一份规整的 Markdown 文档,在使用过程中能够极高地提升效率


我把这个 Skill 放到 Github 了,需要的朋友可以试试!


https://github.com/KyrieCheungYep/ky-markdown-rebuilder


HMSfQqgasAALBqc.jpg
HMSfP2EaUAAbbNW.jpg









回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|腾飞在线 ( 冀ICP备05002530号 )

GMT+8, 2026-7-5 02:01 , Processed in 0.080226 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表