dots.ocr 多语言文档布局解析工具 dots.ocr 是一款强大的多语言文档解析工具,它通过单一视觉 - 语言模型实现布局检测和内容识别的统一,同时保持良好的阅读顺序,具有出色的性能和高效的处理速度。
TabPedia 表格理解大模型 TabPedia是一个新型的大型视觉-语言模型,由中国科学技术大学和字节跳动公司联合开发。该模型通过概念协同机制,能够无缝集成多种视觉表格理解(VTU)任务,如表格检测、表格结构识别、表格查询和表格问题回答。