Markdown Converter
2026-03-24
新闻来源:网淘吧
围观:21
电脑广告
手机广告
购买adidas上京东官方旗舰店。
Markdown 转换器
使用以下命令将文件转换为 Markdownuvx markitdown— 无需安装。
基本用法
# 转换并输出到标准输出
uvx markitdown input.pdf
# 保存到文件
uvx markitdown input.pdf -o output.md
uvx markitdown input.docx > output.md
# 从标准输入读取
cat input.pdf | uvx markitdown
支持的格式
- 文档: PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx, .xls)
- 网页/数据: HTML, CSV, JSON, XML
- 媒体: 图像 (EXIF + OCR), 音频 (EXIF + 转录)
- 其他: ZIP (遍历内容), YouTube 链接, EPub
选项
-o 输出文件 # 输出文件
-x 扩展名 # 提示文件扩展名 (用于标准输入)
-m MIME类型 # 提示 MIME 类型
-c 字符集 # 提示字符集 (例如,UTF-8)
-d # 使用 Azure Document Intelligence
-e 端点 # Document Intelligence 端点
--use-plugins # 启用第三方插件
--list-plugins # 显示已安装的插件
示例
# 转换 Word 文档
uvx markitdown report.docx -o report.md
# 转换 Excel 电子表格
uvx markitdown data.xlsx > data.md
# 转换 PowerPoint 演示文稿
uvx markitdown slides.pptx -o slides.md
# 转换时提供文件类型提示 (用于标准输入)
cat document | uvx markitdown -x .pdf > output.md
# 使用 Azure Document Intelligence 以获得更好的 PDF 提取效果
uvx markitdown scan.pdf -d -e "https://your-resource.cognitiveservices.azure.com/"
说明
- 输出保留文档结构:标题、表格、列表、链接
- 首次运行会缓存依赖项;后续运行速度更快
- 对于提取效果不佳的复杂 PDF,请使用
-d配合 Azure Document Intelligence
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Model Usage
下一篇:Gmail


微信扫一扫,打赏作者吧~