摘要:新增公式解析参数formula_level,支持 LaTeX / Text 灵活切换;
TextIn ParseX重要版本更新内容速读:
- 新增公式解析参数formula_level,支持 LaTeX / Text 灵活切换;
- 表格解析优化单元格内换行输出;
- 导出excel时,图片链接放在单元格内;
- 新增电子档pdf去印章功能。
近期,为深度适配教育、金融、医疗、企业办公等场景需求,TextIn ParseX发布一系列功能升级,提升文档处理效率与准确性。下文将对新功能及版本优化进行详细介绍。
新增参数 formula_level,用户可以通过参数控制不同层级的输出,支持自由切换公式输出形式,实现对公式解析的差异化需求。
参数值输出效果图示formula_level=0有行间公式+行内公式 (输出为latex)$V>30m^{3}$formula_level=2type输出为text,markdown中为纯文本Tx核心作用在解析学术论文、国标文件、试卷等文档时,精确识别并保留公式的完整结构(如上下标、积分符号、矩阵等),以便用于学术引用、智能判题使用。示例场景科研人员分析学术论文、研究报告中的复杂公式,进行理论推导和数据验证。示例样本表示;不管 table_flavor 参数是html还是md,都使用同样的换行符;输出结果中:markdown、detail->text、pages->structured->text,均添加
pages->content 仍按行表示,不做修改导出的excel中,用 \n 替换
表示核心作用准确识别并正确展示表格单元格内换行信息,保障数据完整性与易读性,提升处理效率,降低人工核对成本。示例场景国际物流运输中,运单信息包含发货人和收货人的详细地址,这些地址往往包含多行信息,如门牌号、街道、城市、国家等。优化后的单元格内换行功能,能够使地址信息按照实际情况正确换行显示。示例样本
13F., NO.***, SEC.*** *** E. RD.,
*** 11354 US
+86 **** 效果展示-md| TO: | ***物流有限公司 || --- | --- || 发货人SHIPPER | ... || XIAMEN TECHNOLOGY CO.,LTD
**F.NO.**,SEC.*** ZHONGXIAO E. RD.,
BROOMFIELD CO ***
US
+****** |...|
解析表格导出为 Excel 文件时,支持仅保留图片链接,去掉所有markdown或html的标签。
核心作用实现表格数据与图片的精准关联及高效展示。简化数据处理流程,确保数据完整准确。示例场景电商商品管理,借助 Excel 中单元格内的图片链接核对商品信息。示例样本文档解析在线使用:https://cc.co/16YSOT
来源:小田田是90后