lealone-bench 是一个用于性能测试的项目,尤其关注 spsc 链表的性能对比,包含了多种性能测试工具和示例代码。
深度求索发布的开源代码大模型,33B版的性能显着优于现有的开源代码LLM。该项目包含多个规模的代码语言模型,从10亿到330亿标记不等,经过预训练,使用16,000标记的窗口大小和额外的填空任务,支持项目级别的代码补全和填充,在多种编程语言和各种基准测试中取得最先进性能。
Multi-CPR是一个针对中文段落检索的多领域数据集,旨在支持中文处理的研究与应用。该数据集涵盖多个领域,提供了丰富的样本,帮助研究者和开发者高效地训练和评估检索模型。
miniLLMFlow是一个极简的LLM框架,仅用100行代码实现,旨在使大型语言模型能够进行自我编程。该框架提供了简洁易用的接口,并支持高效的模型训练和推理,适合研究和应用开发。
以历史的发展的眼光来看光线追踪技术,1968年至2018年重点论文相关算法复现
本项目为国立台湾大学2023年秋季开设的《深度学习在音乐分析与生成》课程的教学材料,致力于帮助学生掌握深度学习技术在音乐领域的应用。
高级检索增强生成(RAG)技术合集,包含10种先进RAG实现方案的详细教程。从基础的Naive RAG到高级的Adaptive RAG,提供完整的代码实现和评估方法。使用LangChain、Pinecone等主流工具,适合研究人员和开发者学习和实践RAG技术
katakomba是一个专为NetHack游戏设计的数据驱动的基准测试工具,提供超过30个标准化数据集,并支持多种基于循环的离线强化学习基线模型,旨在促进研究和开发中的基准测试。