摘要:百度的OCR一直做的非常很不错,PaddleOCR也是业界用的最多的开源模型之一,尤其是中文识别。PP-DocBee 是一款专注于文档理解的多模态大模型,能够识别表格内容,准确提取表格中的信息,如识别奖牌榜表格内各国家的名次、奖牌数量 。对文档中的印刷文字、印
百度的OCR一直做的非常很不错,PaddleOCR也是业界用的最多的开源模型之一,尤其是中文识别。PP-DocBee 是一款专注于文档理解的多模态大模型,能够识别表格内容,准确提取表格中的信息,如识别奖牌榜表格内各国家的名次、奖牌数量 。对文档中的印刷文字、印章、图表等元素也具备理解和分析能力。
体验地址:https://aistudio.baidu.com/application/detail/60135开源地址:https://github.com/PaddlePaddle/PaddleMIX/tree/develop/paddlemix/examples/ppdocbee来源:AI工具箱