该项目提供系统化的深度学习学习资料,专注于大语言模型的对齐,涵盖多种深度学习技术和方法,适合不同水平的学习者。
这是一个面向中文读者的深度学习教科书,每一小节都是可以运行的 Jupyter 记事本,配套视频,旨在通过实践教授深度学习的基础和进阶知识。学习者可以自由修改代码和参数,获取及时反馈,积累深度学习的实战经验。该项目已被全球70多个国家的500多所大学用于教学。
这是一个精心整理的机器学习工程课程列表,涵盖来自加州理工学院、哥伦比亚大学、伯克利、麻省理工学院和斯坦福大学的公开资源。
该项目是对多模态大语言模型的全面调查,涵盖最新进展、模型比较和评估以及多种应用场景,信息更新频繁,确保时效性。
机器学习的资料汇总,涉及 NLP、深度学习、LLMOps、ML数学等主题,适合不同水平的学习者,集中整理了优质的学习资料。
一个开源的量化金融自动交易框架,包含市场环境、智能体和应用,提供先进的算法核心以辅助连续交易决策。
liteLLM是一个开源库,旨在简化LLM(大语言模型)的完成和嵌入调用。它提供了一个方便易用的接口,使得调用不同的LLM模型变得更加简单。用户只需导入'litellm'库并设置必要的环境变量(如OPENAI_API_KEY和COHERE_API_KEY),即可创建Python函数并使用liteLLM进行LLM完成调用。此外,liteLLM还提供了一个演示平台,用户可以在其中编写Python代码并查看输出,从而比较不同的LLM模型。
这是加州大学圣巴巴拉分校、AI2、华盛顿大学、斯坦福大学、麻省理工学院、多伦多大学等单位联合发布的一项调研,旨在缩小知识差距,倡导开放、负责任、协作的进步,关注大型语言模型在数据选择方面的最佳实践和影响。
这个开源项目是一个响应式聊天应用程序,使用了OpenAI的GPT-4进行动力支持。它具有响应流、代码高亮和各种预设功能,适用于开发人员。这个项目使用了Next.js、React和Joy等技术。
AI Top100是中国排名前100的AI聚合平台,提供各种AI软件、AI比赛、信息、课程和行业峰会,帮助AI爱好者和从业者轻松了解全球AI领域的最新动态。
一个完整的大语言模型(LLM)可解释性研究项目,使用稀疏自编码器(SAE)分析Llama 3.2模型,由纯PyTorch实现且可完全复现。包含从数据采集、SAE训练、特征分析到验证的全套流程,可帮助理解模型内部行为和概念表示
Jsonify是一款利用AI技术,旨在将非结构化的网络和文档数据转化为结构化信息的多功能平台,适用于专业人士和企业,简化数据收集与管理的复杂性,提升效率,节省时间和成本。
该项目利用ChatGPT API,通过反复运行相同的提示,分析大型语言模型如何为下一个词分配概率,从而生成完整的文本。
该项目收录了关于大语言模型持续学习的关键论文,提供最新的研究成果和方法,适合研究人员和开发者参考,包含对比不同方法的分析。
一个关于大语言模型(LLM)幻觉的研究项目,旨在探讨LLM的幻觉现象及其解决方案。项目致力于分析LLM幻觉的根本原因,提供多种解决方案,并建立评估体系以检测幻觉,融合领域知识以提升模型的可靠性。
最小 PyTorch 实现的 GPT-2 和 Llama,旨在简化代码以便更容易理解和使用,并且能够在短时间内训练出性能良好的自然语言生成系统。