PDF Craft是一个专注于处理扫描书籍PDF的开源工具,能将PDF文件高效转换为Markdown或EPUB格式。 它通过本地AI模型(如DocLayout-YOLO、OnnxOCR)实现文本提取、页眉页脚过滤、跨页文本衔接, 并支持集成LLM(如DeepSeek)进行书籍结构化处理、OCR纠错和注释优化。适合论文、书籍等文档转换, 提供从本地处理到云端LLM协同的多层次解决方案。
将PDF文档转换为Markdown的智能工具,利用先进的视觉语言模型,能够精准识别并提取文本、表格和公式,保留文档格式和层次结构
Marker 是一个高效的工具,能够将 PDF、EPUB 和 MOBI 格式的电子书快速准确地转换为 Markdown、JSON 和 HTML 格式。它基于深度学习模型,特别优化了书籍和科学论文的处理,支持多种语言,并且可以在 GPU、CPU 或 MPS 上运行。Marker 不仅能够去除页眉、页脚等干扰元素,还能将大多数方程式转换为 LaTeX 格式,并格式化代码块和表格。
AI写作助手帮助你创作内容更自信
这是一个基于开源模型的工具,可以交互地连接不同的视觉模型,使用了多种技术,包括ChatGLM、Visual ChatGPT和Stable Diffusion等。它提供了类似于"文心一言"的功能。
这个开源项目可以在浏览器中展示可缩放的动态散点图,可以处理超过10亿个数据点。
这个开源项目是一个自主代理平台,基于LLM技术,并应用了机器学习技术。