这是一个基于神经网络的多层感知器n-gram语言模型,支持多种实现方式,包括micrograd、numpy、C和PyTorch。项目旨在探索和训练语言模型,支持多种神经网络架构,设计灵活且可扩展,适用于不同的应用场景。
小濃縮是一款Chrome扩展程序,利用AI API快速生成网页内容和YouTube视频的摘要。它帮助用户高效浏览和处理信息,特别适用于需要快速获取文章或视频核心内容的场景。
document.ai 是一个基于向量数据库与GPT3.5的通用本地知识库方案,旨在提供高效的知识存储与检索能力。通过集成GPT3.5模型,实现智能问答与交互,支持本地化部署,确保数据隐私与安全。项目具有强大的可扩展性,适用于多种知识库场景,如医学、企业知识管理等。此外,它还提供基于默沙东诊疗手册的问诊AI功能,辅助医疗决策。
LinguaPeak IELTS&English 是一个基于人工智能的平台,提供个性化的口语练习、语法纠正和雅思备考服务,旨在提高用户的英语水平和雅思成绩。用户可以通过与AI助手进行口语练习,获得实时反馈,并根据表现访问自适应学习计划。
Atom of Thoughts (AoT) 是一种新的推理框架,通过将复杂问题分解为原子问题来增强大语言模型的推理能力。该框架显著提高了推理效率,支持多种推理场景,如数学问题、选择题和多跳问答,并在 HotpotQA 等基准测试中表现出色,使 GPT-4o-mini 等模型性能提升 3.4%。AoT 还通过将问题分解为有向无环图(DAG)并迭代压缩子问题,简化推理过程,降低计算成本,同时保持解决方案的质量。
Ai Repeater 是一款语言学习工具,允许用户从本地存储或 YouTube 中分割和合并音频/视频文件,以进行有效的语言练习。它提供智能重复、发音比较和内置语音词典等功能,以增强学习效果。
Kaipulla AI 是一个由人工智能驱动的心理健康伴侣,提供24/7的多语言支持,为员工和学生提供情感支持和健康对话。其目标是通过先进的AI技术革新心理健康支持,确保个性化、富有同情心的互动。该平台集成了多语言访问和符合伦理的AI设计,使其成为企业和教育机构可扩展的解决方案。
NOAN是一个专为创业者设计的AI知识系统,旨在帮助他们构建和自动化业务。通过NOAN,用户可以轻松管理多个项目,并与AI助手协作,实现业务的高效增长。
Modulus (Alpha) 是一个基于 PyTorch 的深度学习工具包,专门用于为物理系统开发深度学习模型。它提供了高效的模型训练和推理功能,支持多种物理系统的建模和仿真,帮助用户优化和加速物理系统的计算过程。
Atari 是一个专为 Arcade Learning Environment 设计的强化学习项目,集成了优先经验回放、持续优势学习、引导式双重双 DQN 等先进技术,旨在提升强化学习算法的性能和效率。
Chain of Experts (CoE) 是一种在 Mixture-of-Experts (MoE) 模型中实现专家间通信的技术,显著提升了模型的性能和资源利用效率。通过优化专家之间的协作,CoE 减少了数学验证损失,降低了内存使用,并大幅增加了专家组合的可能性。
该项目是一个关于强化学习增强大语言模型(LLMs)的综述资源库,旨在帮助研究人员快速了解如何通过强化学习技术提升LLMs的性能,解决生成更准确、连贯且符合人类期望的文本问题。资源库涵盖了多种强化学习方法,提供了大量相关论文的引用和深入分析,并展示了多种LLMs的增强案例,为研究人员提供了丰富的理论和实践参考。
All Atom Diffusion Transformers 是一个统一的框架,用于生成分子和材料,为化学和材料科学领域带来革命性突破。它通过打破领域限制,实现了分子和材料的统一生成,并利用 Transformer 架构进行高效生成。该项目开源代码,促进了研究和创新。
该项目是Siyuan Zhao论文《A Memory-Augmented Neural Model for Automated Grading》的源代码,专注于使用记忆增强神经网络模型进行论文的自动评分。该项目结合了深度学习技术,用于自然语言处理,能够基于内容和结构对论文进行自动评分,并在评分准确性上优于传统方法。此外,该项目可扩展性强,适用于大规模学生论文数据集。
该项目是Kaggle TGS Salt Identification Challenge 2018的第四名解决方案,专注于使用先进的深度学习模型进行盐体识别。项目包括数据预处理和增强技术,提供全面的训练和评估流程,并利用集成方法提高性能。此外,项目还提供了详细的文档和代码注释,便于理解和使用。
Jobseeker 是一个帮助用户管理求职申请、通过AI优化简历并最终获得理想工作的平台。它提供了看板工具用于跟踪申请进度、简历分析功能以及文件管理器,确保所有求职材料井井有条。
sparse-coding 是一个专注于超完备稀疏词向量表示的项目,旨在通过稀疏编码算法实现高效的词向量表示。该项目特别适用于大规模词汇表的处理,并且能够轻松集成到现有的自然语言处理流程中。通过提供稀疏编码算法,sparse-coding 能够帮助提高文本分类任务中的特征稀疏性,同时也可用于词义消歧和语义相似度计算。此外,它还可以作为预处理步骤,显著提升机器学习模型的性能。
machina是一个基于PyTorch构建的深度强化学习框架,旨在简化和加速深度强化学习算法的研究和开发。它提供了多种深度强化学习算法的支持,并具备高效的并行计算能力。框架采用模块化设计,便于扩展和定制,同时提供了丰富的文档和示例代码,帮助用户快速上手和深入理解强化学习原理。
Awesome-DragGAN是一个精心整理的列表,包含了与DragGAN相关的论文、教程和代码库。该项目由OpenGVLab维护,确保资源的质量和相关性,旨在为研究、学习和开发DragGAN技术提供全面的参考和支持。
ChatGLM-6B-QLoRA项目利用peft库实现了对chatGLM-6B和chatGLM2-6B模型的4bit QLoRA高效微调,并提供了模型的合并和量化功能。该项目包含了完整的训练和推理流程,以及推理性能测试,旨在优化模型存储和计算资源的使用。
该项目是一个精选论文列表,专注于为多模态大语言模型(MLLM)提供高效的Token合并、减少、重采样和丢弃方法。通过整合多篇相关论文,帮助开发者和研究人员理解和实现高效的Token管理策略,从而优化多模态大语言模型的Token处理效率。
DeepSeek-R1是一个从头开始构建的推理模型,旨在提供高效的推理能力和强大的可扩展性。它支持多种推理任务,并且易于集成到现有系统中,适用于自然语言处理、智能问答、复杂逻辑推理以及知识图谱的推理等场景。
Linkeddit是一个基于AI的平台,通过抓取和分析Reddit上的用户数据,帮助用户寻找潜在客户、人才和导师。该平台能够识别出正在寻找类似产品的用户,实时提供有价值的线索和洞察。
PRefLexOR是一个基于偏好递归语言建模的探索性优化推理项目。它通过迭代推理改进,使模型能够自主学习并提升决策能力。项目结合了ORPO和DPO技术,显著提升了推理质量。PRefLexOR能够动态生成任务和反馈,无需预生成数据集,具有实时适应性强的特点。
LMM-R1 是一个为多模态任务打造的高性能强化学习训练框架,旨在扩展 OpenRLHF 框架,支持 LMM(Large Multimodal Models)强化学习(RL)训练,以复现 DeepSeek-R1 在多模态任务上的表现。该框架集成了多种优化技术,显著提升了训练速度和模型生成效率,并支持大规模模型的训练和扩展。
APIGen 是由 Salesforce 人工智能研究团队设计的一个工作流,用于自动生成高质量数据集,专门用于研究函数调用智能体模型。该项目集合了 21 个类别的 3673 个可执行 API,并通过三层验证(格式检查、实际函数执行和语义验证)确保生成的数据集的可靠性和正确性。使用 APIGen 生成的数据集训练的模型在伯克利函数调用基准测试中表现优越,并且公开了含有 6 万个高质量条目的数据集。
HuggingSnap是一款基于SmolVLM2的iOS应用,用户可以通过手机摄像头快速了解周围的世界。该应用支持文本翻译、图像识别和内容总结等功能,仅需iPhone运行iOS 18即可使用。其基于轻量级多模态模型,性能强劲且适合设备端运行。
Flow Trials是一个基于人工智能的平台,旨在帮助患者快速匹配并注册参与临床试验,同时协助研究人员高效地找到合适的参与者。平台通过智能算法和数据分析,简化了临床试验的搜索和注册流程,为患者和研究人员提供了便捷的解决方案。
QuickWhisper是一款基于OpenAI Whisper技术的转录工具,能够将音频和视频内容转换为文本。所有处理均在本地完成,确保数据隐私。用户只需提交音频或视频的URL,即可快速开始转录。
dejax是一个高性能的体验回放缓冲区实现,专为与JAX框架优化而设计。它提供了高效的内存管理,能够处理大规模数据集,并且与基于JAX的机器学习工作流无缝集成。dejax旨在通过加速数据处理来提升机器学习模型的性能,特别适用于强化学习实验和深度Q学习中的体验回放。