百度发布的一个文档理解多模态大模型:PP-DocBee

360影视 国产动漫 2025-03-19 21:37 4

摘要:百度的OCR一直做的非常很不错,PaddleOCR也是业界用的最多的开源模型之一,尤其是中文识别。PP-DocBee 是一款专注于文档理解的多模态大模型,能够识别表格内容,准确提取表格中的信息,如识别奖牌榜表格内各国家的名次、奖牌数量 。对文档中的印刷文字、印

百度的OCR一直做的非常很不错,PaddleOCR也是业界用的最多的开源模型之一,尤其是中文识别。PP-DocBee 是一款专注于文档理解的多模态大模型,能够识别表格内容,准确提取表格中的信息,如识别奖牌榜表格内各国家的名次、奖牌数量 。对文档中的印刷文字、印章、图表等元素也具备理解和分析能力。

体验地址:https://aistudio.baidu.com/application/detail/60135开源地址:https://github.com/PaddlePaddle/PaddleMIX/tree/develop/paddlemix/examples/ppdocbee

来源:AI工具箱

相关推荐