OpenSparseLLMs/Linearization是一个将大型语言模型线性化为门控循环结构的创新项目,旨在通过线性化显著提升模型的计算效率。该项目提出了Liger框架,实现了LLMs的高效线性化,并提供了完整的训练与评估流程,助力模型优化。
FBGEMM(Facebook 通用矩阵乘法)是一个专为服务器端推理优化的低精度、高性能矩阵乘法和卷积库。它支持在CPU上进行高效计算,旨在通过低精度算术减少内存占用并提高速度,特别适用于大规模矩阵计算和深度学习推理任务。
Autodidact是Matthew Johnson开发的一个教学性质的Autograd实现,旨在帮助用户理解和掌握自动微分的核心概念。该项目代码简洁明了,适合学习用途,能够处理基本的数学操作和函数,并深入揭示Autograd的内部工作原理。
Fossil 是 Starknet 的 L1 状态验证器,主要用于验证链上状态。它在链下投票解决方案中得到了广泛应用,例如在 Snapshot X 中作为 L1 投票权重的验证工具。Fossil 提供了高效的状态验证机制,并具有可扩展的架构,能够支持多种区块链应用。
TextMind是一个专为文本理解任务设计的开源框架,为开发者提供构建高效语言分析系统的工具。它通过深度网络提取文本含义,支持实体与关系的精准识别,提供分布式计算加速工具,优化文本分析预测速度,并兼容分类与抽取任务。
TokenOCR是一款面向文档理解的文本图像基础模型,旨在让机器更好地‘读懂’图文内容。它通过首个token级别的图像文本数据集TokenIT,包含2000万图像和18亿token-mask对,提出首个token级别的文本图像基础模型,支持多种下游任务。基于TokenOCR构建的TokenVL模型,在文档视觉问答任务中表现卓越。
ARFS是一个模型无关的特征选择工具,旨在识别所有与预测相关的特征,包括冗余预测变量。它通过三种不同的方法(Leshy、BoostAGroota和GrootCV)实现特征选择,并与scikit-learn兼容,推荐使用lightGBM模型进行优化。
vhAstro-Theme 是一个基于 Astro 构建的优雅的响应式博客主题,设计简洁,动画流畅,页面过渡顺畅。它支持混合使用 React、Vue、Svelte 等主流框架的组件,适合用于搭建个人博客、创建文档站或以内容为主的网站。
HAL是一个致敬HAL和费曼物理学讲义的GitHub项目,可能包含与物理学相关的代码或资源,适用于教育或学习目的,也可能涉及与HAL相关的技术或AI内容。
Pydoll是一个用于自动化基于Chromium的浏览器的Python库,无需使用WebDriver,从而提供更现实的互动体验。该库支持Python的异步特性,提升了性能,能够捕获事件并进行同时的网页抓取。Pydoll消除了对WebDriver的依赖,提供了更流畅和可靠的自动化体验,并且能够原生绕过Cloudflare Turnstile和reCAPTCHA v3。
ComfyUI-MultiGPU是一个实验性工具,旨在在单一ComfyUI工作流中支持多个GPU的使用。它通过非传统方式对内存管理进行补丁,提供模型加载新节点,并允许用户指定每个模型使用的GPU,从而优化资源利用和计算效率。
ShortPATH 是一个简单的工具,用于在 Windows 控制台中创建目录快捷方式。它通过简化命令行界面的导航,提升用户的工作效率,减少输入量。该工具轻量且易于使用,特别适合需要频繁访问特定目录的用户或开发人员。
ir-sim是一个基于Python的轻量级机器人模拟器,旨在为机器人导航、控制和学习算法的开发提供一个简单易用的框架。它支持多种机器人动力学模型,提供丰富的传感器和行为模块,并允许通过YAML文件快速配置场景,无需复杂编码。
BrowserGym 是一个用于 Web 任务自动化的开源项目,它提供了 Chrome 浏览器环境的 Gym 集成,旨在自动化各种网站和应用的任务。该项目易于扩展和定制,特别适用于复杂的 Web 任务自动化场景。
brpc_faiss_server 是一个基于 brpc 和 faiss 的矢量检索框架,结合了 brpc 的高性能通信能力和 faiss 的大规模矢量搜索功能,适用于构建高效的矢量搜索引擎和实时推荐系统。
GIDD(广义插值离散扩散)是一个新颖的框架,专门用于训练离散扩散模型。它通过结合掩码和均匀噪声来提升生成样本的质量,并具备自我纠错功能,能够自动修正生成过程中的错误。此外,GIDD提供了多种预训练模型,用户可以快速上手并进行生成任务。
这是一个基于Keras的分支版本,增加了多项新功能,例如Caffe2Keras转换器和多模态层,旨在扩展Keras的能力,支持更复杂的机器学习任务。
Sarsen是一个专注于合成孔径雷达(SAR)传感器的算法和实用工具的项目。它提供了先进的SAR传感器数据处理算法,包括SAR数据的处理、分析和应用支持。该项目旨在促进SAR技术的研究和开发,支持环境监测、灾害管理和响应等多种应用场景。
SecretFlow(隐语)是一款由蚂蚁开源的企业级隐私计算框架,采用Python语言编写,支持多种主流隐私计算技术,如安全多方计算、联邦学习、差分隐私和同态加密,适用于医疗、金融等领域的数据合作场景。它通过抽象隐私计算技术为密文设备和明文设备,将数据分析和机器学习工作流表示为计算图,支持自动协议转换和插件式集成,提供灵活的编程接口,便于开发者在不了解底层技术细节的情况下进行隐私计算。
gghighlight是一个用于在ggplot2可视化中高亮显示特定数据点和线的R包。它允许用户根据数据属性自定义高亮条件,并支持复杂的数据过滤和条件高亮。该工具与ggplot2工作流无缝集成,适用于多面板图和交互式可视化。
Super-Rag是一个高性能的RAG管道,专为AI应用设计,集成了摘要生成、检索/重排和代码解释器功能,通过简单的API提供服务。它支持多种文档格式和向量数据库,提供可定制的文档分割/分块功能,并允许使用多种模型(包括专有和开源模型)进行数据编码。此外,Super-Rag还内置了代码解释器模式,用于处理复杂的问答场景,并通过唯一ID进行会话管理以实现缓存。
TransMLA是一种将GQA(如LLaMA-3和Qwen-2.5)转化为更强大的MLA(多头潜在注意力)的方法,旨在复制R1能力并探索MoE、MTP、混合精度量化和训练/推理加速等先进技术。
Florence-VL是微软开源的多模态模型,具备强大的图像理解能力,能够从不同角度深入理解图片内容并给出准确回复。其核心在于升级的视觉编码器和深度-广度融合(DBFusion)机制,支持多层次、多方面的视觉特征捕获和融合,超越了传统的CLIP式视觉Transformer模型。
Label Studio是一款功能强大的开源数据标注工具,支持文本、图像、音频、视频等多种数据类型。它结合主动学习策略,能够高效辅助人工完成标注任务,并提供可视化界面,易于使用。此外,Label Studio支持团队协作,提高大规模数据集的标注速度,并可与深度学习模型集成,实现智能标注和自动化数据处理。
face_verification_experiment 是一个基于轻量级卷积神经网络(CNN)的深度学习项目,专为高效的人脸表示和验证任务设计。该项目通过优化网络架构,在保持高精度的同时显著降低了计算复杂度,适用于实时应用场景。其核心目标是为安全系统、移动应用和监控系统等提供准确且高效的人脸识别解决方案。
jsPDF是一个基于JavaScript的库,用于在浏览器中生成PDF文件。它允许开发者通过简单的API调用创建、编辑和保存PDF文档。jsPDF支持多种功能,如设置字体大小、添加文本和图片、自定义布局等,非常适合需要在Web应用中动态生成PDF文件的场景。
该项目利用SpaCy进行命名实体识别(NER),自动从简历中提取关键实体,生成简历摘要,帮助用户快速评估简历内容。它专为高效的简历解析和分析设计,旨在简化招聘流程,减少人工操作。
Tiny-Universe 是一个从原理出发、以“白盒”为导向、围绕大模型全链路的“手搓”大模型指南。该项目旨在帮助有传统深度学习基础的读者从底层原理出发,纯手搓搭建一个清晰、可用的大模型系统,包括大模型本身、RAG 框架、Agent 系统及大模型评估体系。最近新增了从零开始pretrain Llama3部分。
tsai是一个基于Pytorch和fastai的深度学习库,专注于时间序列和序列数据的处理。它提供了多种先进的深度学习模型和预训练工具,支持时间序列分类、回归、预测等任务。tsai易于集成和使用,适合快速实验和模型调优,是处理时间序列数据的理想选择。
Skynet 是一个专为在线游戏服务器设计的轻量级框架,支持高并发和分布式部署。它采用模块化设计,易于扩展和维护,特别适合处理大量玩家请求和实时通信需求。