Taxy AI 是一个开源的浏览器自动化库,利用开放域语言模型 GPT-4 来控制浏览器并执行重复任务,旨在提高工作效率和简化日常操作。
Fluent UI Emoji是微软推出的一个emoji表情库,包含多种3D和2D表情,支持多种格式(包括PNG和SVG),并且基于MIT协议开源,方便开发者在各种应用和网页中集成。该库提供丰富的表情选择,旨在提升用户体验和交互性。
LaMini-LM是一个对多个迷你大语言模型进行微调的项目,旨在提升模型的性能,其中包括经过微调的GPT-2,其性能可与LLaMa的Alpaca-7B相媲美。
这是一个汇集了来自网络的法律自然语言处理(LegalNLP)资源的精选列表,提供了丰富的工具、库、论文和数据集,旨在帮助研究人员和开发者更好地进行法律领域的自然语言处理工作。项目定期更新,以确保包含最新的法律NLP进展,并且得到了法律和NLP领域专家的贡献。
一个集合了 Mojo 语言资源和工具的项目,旨在帮助开发者更好地使用 Mojo 语言。
LangUI是一个开源的Tailwind组件库,专为GPT、生成式AI和大语言模型项目设计,旨在增强AI应用的用户体验。
air-pi-play 是一个利用 Raspberry Pi 作为 AirPlay 服务器的项目,可以在电视、显示器和投影仪上实现屏幕镜像,提供简单的设置和良好的兼容性。
Fakeflix是一个开源项目,旨在模拟Netflix的功能,提供电影播放、搜索、用户注册登录和无限滚动等功能。它使用React构建用户界面,基于Redux进行状态管理,并集成Firebase作为后端服务。同时,它具备响应式设计,适应不同设备,支持多个用户账户和观看历史记录。
OSX-KVM 是一个开源项目,允许用户在 QEMU/KVM 虚拟化环境中运行各种版本的 macOS,提供高性能和易于配置的解决方案。
Paper QA是一个基于GPT-3的开源项目,旨在通过自然语言处理技术帮助用户解读学术论文。用户可以通过提出具体问题,获取对论文内容的深入解读和分析。该项目具有开放性,用户可以根据需要进行修改和扩展,且每次问答的成本相对较低,适合学术研究和学习使用。
一个开源的漫画自动翻译神器,利用 GPT-4 Vison 实现一键自动识别并翻译,支持多种格式和语言之间的互译。
VIMA是一款连接了机械臂的语言模型(LLM),能够接收多模态的指令,支持文字、图片、视频等输入形式。该系统能够逐步感知环境并采取实际动作,支持多模式提示,使任务描述简单灵活,统一多种任务,如视觉目标达到、视频演示模仿、学习新概念和满足安全限制。作为一个开源项目,VIMA提供了代码、预训练模型、数据集和物理模拟基准,无需付费或填写表格,便于用户使用和开发。
DiffSynth Studio是一款开源的Diffusion引擎,重构了包括Text Encoder、UNet、VAE等在内的架构,在增强计算性能的同时保持了与开源社区模型的兼容性。它支持多种生成任务,包括长视频合成、高分辨率图像生成、卡通着色、视频风格化等,并且支持中文模型和多种模型的微调。此外,它还提供了无需本地部署的Colab运行笔记,方便用户一键动漫化视频。
一个精选的与ChatGPT相关的优秀项目列表,帮助用户发现和了解各种有用的资源和工具。该项目定期更新,确保信息的时效性,并提供各类项目的详细信息和链接。
个人博客项目,包含技术文章和教程,尤其关注于Firmadyne的魔改与模拟崩溃修复。
MarkLLM是一个专门用于在大型语言模型(LLM)中实现水印的研究和应用的工具包,旨在提供水印的生成、检测及其对模型性能的研究,助力学术和工业界的相关探索。
mm-cot是亚马逊开源的多模态链式思维(Multi-modal Chain of Thought)模型,旨在提升大语言模型在复杂任务中的表现。它支持多模态输入,包括文本和图像,并通过链式思维增强推理能力,特别针对复杂任务进行了优化的架构设计,方便研究人员和开发者进行二次开发。
微软推出的生成式AI入门课程,包含12至21个系统课程,涵盖从基础到进阶的全方位知识。课程提供Python和TypeScript代码示例,适配Azure OpenAI和OpenAI API,帮助初学者零基础开启AI应用开发之旅。课程内容包括LLM介绍、提示工程基础、构建文本生成/聊天应用等,并提供实践项目、额外学习资源和官方中文翻译版本,学习路径清晰。
Parseltongue 是一款创新的开源浏览器扩展程序,专为高级文本处理和可视化而设计。它为了解大型语言模型 (LLM) 的认知过程提供了独特的视角。
WebCPM是一个专注于提升搜索引擎能力的开源项目,已被ACL 2023接收。
Auto-PPT是一个开源项目,利用GPT-3.5技术自动生成高质量的PPT,支持多种主题和模板,旨在简化演示文稿的制作过程。该项目提供用户友好的界面和可定制的幻灯片布局,适合各种场景的需求。
Hoarder是一款开源的AI书签管理工具,通过浏览器插件一键保存网页,AI自动提取网页信息,并支持链接、笔记、图片和PDF等多种格式的管理,便于用户高效管理和查找信息。
DI-star是一个开源项目,旨在为StarCraft II提供决策人工智能,通过多种决策算法和可扩展的架构,支持自定义代理和策略的开发与实验,提供高效的训练和测试环境。
InternLM 是一个高效的语言模型开源平台,旨在为开发者提供构建高性能模型的便捷工具,支持从研究到应用的完整生命周期。最新版本书生·浦语2.0(InternLM2)经过2.6万亿token高质量语料训练,包含7B及20B两种参数规格,支持超长上下文和优秀的数学推理能力。
Scribble Diffusion是一个开源项目,允许用户通过涂鸦与AI互动生成图像,提供了丰富的功能和易于使用的接口。
RustPython是一个用Rust编写的Python解释器,支持WebAssembly,可以在浏览器中运行Python代码,兼容大部分Python标准库,是一个活跃的开源项目。
这是复旦大学王一老师开源的一个高效GPT实现,经过2.5年的努力,旨在单个GPU上成熟且高度优化。
Superflows是一个开源工具包,用于为SaaS产品构建AI助手,用户可以用自然语言提问,然后助手调用软件API来回答问题。
LLM-Aided OCR 是一个基于大型语言模型(LLM)的开源工具,旨在通过结合光学字符识别(OCR)和LLM的纠错功能,将扫描的PDF文件转换为高准确度、格式正确且易于阅读的Markdown文档。该工具支持多种大语言模型的集成,包括本地LLM和云端API,适用于需要将扫描文档高质量数字化的场景。
该项目汇集了GitHub Copilot、新必应、Perplexity、Snap等多个流行AI工具的泄露提示,旨在帮助用户理解和利用这些提示的潜力。作为一个开源项目,用户可以方便地参与贡献和扩展,获取实用的提示示例和用法。