handcalcs是一个基于Jupyter Notebook的Python库,能够将Python代码直接渲染成LaTeX格式的公式展示出来。它使得数学计算过程变得像手写公式一样直观清晰,适用于科学研究、工程设计和数据分析。handcalcs通过展示数值替换过程,使得计算更易于手动验证。
Mesa 是一款开源的 Python 库,专门用于基于代理的建模(Agent-based Modeling, ABM),旨在模拟复杂系统并探索涌现行为。它提供了模块化的核心组件(如空间网格和代理调度器),支持基于浏览器的可视化,内置分析工具,并附带丰富的示例模型库。Mesa 的目标是成为 Python 领域的 NetLogo、Repast 或 MASON 的替代品,适用于从学术研究到实际应用的多种场景。
TRL 是一个用于增强训练基础模型的 Python 库,支持监督微调、近端策略优化和直接偏好优化等技术。它与 Hugging Face Transformers 生态系统紧密集成,支持多种模型架构和模态,并支持分布式训练。TRL 提供了多种训练器,如 SFTTrainer、GRPOTrainer、DPOTrainer 和 RewardTrainer,方便用户进行模型微调。此外,TRL 还支持通过 Hugging Face Accelerate 进行高效扩展,并集成了 Hugging Face PEFT 和 Unsloth 来优化训练过程。
wxauto 是一个基于 Python 的 Windows 微信客户端自动化库,旨在帮助用户通过编程方式实现对微信的控制。它基于 UIAutomation 技术,通过模拟用户在微信客户端的操作来实现自动化,支持发送和接收消息、文件等功能。该项目适用于 PC 微信 3.9.11.17 版本,提供了详细的文档和部署指南,方便用户快速上手和使用。
Outlines 是一个功能丰富的 Python 库,专为大型语言模型(LLM)提供结构化生成能力。它集成了多种 LLM,如 OpenAI 和 Hugging Face Transformers,支持使用 Jinja 模板引擎创建复杂提示,并提供快速有效的正则表达式和 JSON 结构化生成技术。通过控制 LLM 的输出,Outlines 使应用程序能够更精确地定制模型生成的内容,提升生成结果的可靠性和一致性。
Ollama Python库是一个开源项目,提供了在Python 3.8+项目中集成Ollama模型的最简单方法。该库使用HTTPX库与Ollama REST API通信,支持同步和异步客户端,允许开发者根据自己的需要选择最合适的通信方法。通过提供直观的函数如`chat()`、`generate()`、`list()`和`embed()`,开发者可以轻松发送请求并接收来自Ollama AI的响应。此外,该库支持流式响应,允许实时接收和处理模型输出,增强了应用程序的功能和用户体验。
Helium是一个用于自动化Chrome和Firefox等浏览器的Python库,旨在简化Web自动化流程。其API比Selenium更高级,允许用户基于可见标签识别网页元素,无需复杂的HTML ID、XPaths或CSS选择器。Helium还简化了iFrames和窗口管理操作,并提供了隐式等待和显式等待的简洁API。Helium实际上是Selenium的封装,用户可以在脚本中自由混合使用Helium和Selenium的API。
LLM 是一个 CLI 实用程序和 Python 库,用于通过远程 API 和可自行安装并运行的模型与大语言模型进行交互。它提供了各种工具和插件,使其成为与大语言模型交互的强大工具。LLM 支持从命令行运行提示、将结果存储在 SQLite 中、生成嵌入等功能。它还支持通过插件访问远程和本地模型,并且可以轻松安装和运行本地模型。
PDFPlumber是一个强大的Python库,专门用于从PDF文件中提取文字和表格数据。它不仅能够提取文本内容,还可以获取PDF文件中每个字符、矩形、线条等详细信息,支持对PDF文件的深入分析。该库广泛应用于数据挖掘、信息提取以及生成PDF文件的详细报告。
Puncc是一个开源的Python库,集成了最先进的置信预测算法及相关技术,适用于回归和分类问题。它可以与任何预测模型结合使用,提供严格的不确定性估计。
pytesseract是一个Python库,封装了Google的Tesseract OCR引擎,使开发者能够在Python中轻松实现光学字符识别(OCR)功能。它支持多种图像格式,允许配置Tesseract参数以定制OCR过程,并可以批量处理多张图像。此外,pytesseract与Python的PIL/Pillow等图像处理库无缝集成,便于在OCR前对图像进行预处理。
Theano_Tutorial是卡内基梅隆大学语言技术研究所(LTI)由Kazuya Kawakami提供的Theano教程。该教程全面介绍了Theano,一个用于深度学习的Python库,内容涵盖基础概念和高级技术,适合初学者和有经验的用户。教程采用Jupyter Notebook形式,提供交互式学习体验,包含大量实际示例和代码片段,帮助用户深入理解Theano的计算图和优化技术,并将其应用于实际机器学习项目中。
Pydoll是一个用于自动化基于Chromium的浏览器的Python库,无需使用WebDriver,从而提供更现实的互动体验。该库支持Python的异步特性,提升了性能,能够捕获事件并进行同时的网页抓取。Pydoll消除了对WebDriver的依赖,提供了更流畅和可靠的自动化体验,并且能够原生绕过Cloudflare Turnstile和reCAPTCHA v3。
fastgradio是一个Python库,旨在帮助用户快速构建和分享基于fastai模型的Gradio界面。它提供了简单易用的工具,使得用户能够轻松地将训练好的fastai模型部署为交互式Web应用,并支持多种模型类型和数据格式。通过fastgradio,用户可以为不同的应用场景定制界面,并快速展示模型的功能。
该项目提供了与Python和语义技术(如RDF、OWL、推理等)相关项目的综合概览,涵盖了RDF相关工具、OWL实现、推理引擎及其Python集成,并重点介绍了语义网络领域的关键库和框架。
Langgraph-bigtool是一个Python库,专为创建能够访问大量工具的LangGraph代理而设计。它帮助代理高效地管理和调用庞大的工具资源,适用于需要处理数百甚至数千种工具的场景。通过LangGraph的持久化层存储工具元数据,并提供自定义工具检索功能,极大提升了工具检索和使用的效率。
PyKEEN是一个用于训练和评估知识图谱嵌入(KGE)模型的Python库,支持多种SOTA算法,广泛应用于知识图谱补全、推荐系统和语义搜索等领域。它提供了丰富的API,支持大模型训练、评估和可视化,适用于学术研究和工业应用。
Instructor 是一个基于 Pydantic 构建的 Python 库,专门用于从大语言模型(LLM)获取结构化数据。它支持验证、重试和流式响应,帮助开发者更高效地处理 LLM 输出。
Patho-Bench 是一个 Python 库,专门用于对病理学领域的基础模型进行基准测试。它提供了标准化的训练-测试分割,支持多种评估框架,并自动化 GPU 负载均衡,以支持大规模实验。
datachain是一款专为处理大量非结构化AI数据设计的工具,支持多模态API调用和本地AI推理并行处理。它能够智能统一管理图片、视频、文本、PDF、JSON、CSV、parquet等多种数据类型,并自动保存处理记录和版本。此外,datachain支持从各种云存储(如谷歌云、亚马逊云)或本地读取数据,无需手动复制,且具备智能搜索和分析功能,能够处理超大数据集并进行并行处理。
LangGraph Multi-Agent Swarm是一个Python库,允许多个AI代理像团队成员一样协同工作。每个代理根据其专业知识自动接管对话,支持动态切换和无缝交接,确保对话的连贯性。该库支持短期和长期记忆,使对话更加连贯,并能记住最后一个活动的代理,即使对话被打断也能继续。此外,它还支持流式处理和人类-AI协作,允许用户自定义专家代理和交接方法。
Unstructured 是一款专为处理复杂文档设计的 Python 库,支持 PDF、PPT、Excel 等 100 多种格式的深度解析,尤其在金融合同信息抽取中准确率高达 96.8%。它结合了智能版面分析和多语言 OCR 技术,能够自动识别表格、公式、流程图等复杂结构,并提取文档的元数据,如作者、创建时间等。
ErisForge是一个Python库,旨在通过对其内部层应用转换来修改大型语言模型(LLMs)。它提供了一种简单而强大的方式,让用户能够定制和优化AI模型的行为,适用于多种应用场景。
Hugging Face Kernels 是一个用于加载计算核心(kernels)的库,这些核心可以直接从 Hugging Face 的 Hub 中动态加载。它支持多个 Python 版本和不同的 PyTorch 构建配置,使 Python 应用能够直接从 Hub 加载计算内核,从而大幅提升性能和灵活性。
LangGraph Supervisor 是一款基于 Python 的库,专为构建分层多智能体系统而设计。它集成了 LangGraph 框架,支持流式处理、记忆功能和人类参与,适用于多智能体协作场景。通过灵活的消息历史管理和多层级架构,用户可以轻松创建和管理复杂的多智能体系统,优化 Agent 间的消息传递和对话流程。
PandaSQL是一款基于AI大模型的自然语言转SQL引擎,支持多种数据库方言,通过上下文学习机制理解业务术语,显著提升查询效率。它在TPC-H基准测试中复杂查询生成准确率达到89%,支持MySQL、PostgreSQL等8种数据库方言,并在金融场景中提升查询效率50%。此外,PandaSQL具备动态语法修正、业务语义映射和查询性能优化等高级功能,适用于非技术人员数据查询、跨数据库迁移和慢查询智能分析等场景。
Duckduckgo_search是一个强大的工具,可以通过DuckDuckGo进行AI聊天和多种类型的搜索,包括文本、图片、视频和新闻。它将DuckDuckGo的搜索能力封装成一个Python库,方便开发者调用,同时支持AI对话功能,完全免费,无需付费API。
Kreuzberg是一个现代化的Python库,专为文档中的文本提取而设计,旨在简化和提高效率。它提供了统一的异步接口,支持从包括PDF、图片、Office文档等在内的多种文件格式中提取文本。
adbutils是一个通过socket与adb server交互的Python实现的adb客户端库,旨在简化与Android设备的交互,避免直接调用adb二进制客户端程序。该库支持多种adb命令,适用于自动化测试和设备管理。
hotpdf是一个快速的PDF解析库,用于提取PDF文档中的文本并查找文本,基于pdfminer.six构建,旨在克服使用pdfquery等库解析大型PDF文件时遇到的困难。