文档归纳必备!微软最新开源,4行代码将文档图片音频转Markdown

摘要:日常学习生活中,我们会遇到各种各样不同格式,不同类型的文档、图片、音视频内容,如果想要大而统的来整理归纳这些内容,或者进行全局的一些内容检索摘取时,就会非常麻烦。有没有可能将这些文档变成统一的格式,而且还能轻松检索呢?

日常学习生活中,我们会遇到各种各样不同格式,不同类型的文档、图片、音视频内容,如果想要大而统的来整理归纳这些内容,或者进行全局的一些内容检索摘取时,就会非常麻烦。有没有可能将这些文档变成统一的格式,而且还能轻松检索呢?

这就要说到微软最新开源免费的Python库:MarkItDown了。如其名字一样,Mark it Down。即可以将文本文件(TXT、CSV、JSON、XML等)、Office文档(Word、Excel、PowerPoint等)、PDF文件、网页、截图、音频内容,通过Python强大的转换库,变成标准的Markdown格式文件。实现以不变应万变,统一格式输出。

对于不同的输入文件,都有不同的转换器,比如DocxConverter、Pdfconverter、ImageConverter、MidiaConverter等,转换后的内容不仅实现和格式转换,各为重要的是原来无法直接检索的图片内容、音频数据等都可以直接查询查看了。

对以下场景特别有用:

需要批量处理各种格式文档的场合建立文档索引系统文本分析和数据挖掘项目需要统一文档格式的场景

使用方式非常简单,在电脑上安装好Python环境。然后pip install markitdown, 自动下载好编译依赖包。

# 导入库from markitdown import MarkItDown# 实例化类markitdown = MarkItDown# 提供需要转换的文件result = markitdown.convert("test.pdf")# 一键搞定,这里只是打印,也可直接wirte到文件print(result.text_content)

只要简单四行,即可将原始文件转成markdown输出,用来OCR识别图片内容不要太简单方便哦!

官方还提供了一个使用大模型如OpenAI来进行图片识别分析的例子,不仅能识别,还是帮你快速分析解读图片,同样输出的内容也是markdown格式。有需要的小伙伴赶紧收藏备用哦!

来源:微生活政事儿

相关推荐