这个开源项目利用golang和vue3实现了一个聊天AI程序,支持chatgpt和midjourney对话。它是一个具备机器学习功能的开源项目。
OmniParser是微软开源的一款工具,能够准确解析和识别屏幕上的可交互图标,具备优于GPT-4V的解析能力,支持多种用户界面类型,适合用于自动化测试和开发中用户界面的分析与操作。
LlamaV-o1是一个大型多模态模型,能够进行自发推理。在VCR-Bench基准测试中表现优异,超越了多个知名模型,如Gemini-1.5-flash和GPT-4o-mini。该模型结合了课程学习的结构化进展,使用Beam Search提升效率,特别适合复杂的多步视觉推理任务,具备高准确性和高效率。
Phi2-mini-Chinese 是一个从零开始训练自己的Phi2中文小模型的项目,支持加载本地知识库进行检索增强生成(RAG),旨在提供强大的中文对话能力和灵活的训练选项。
Mathberet是一个自托管的数字数学笔记本,使用React和Typescript开发,旨在为需要图形绘制、草图和LaTeX书写的平台的数学学生提供支持。
这是一个基于 OpenAI ChatGPT API 的自制 ChatGPT UI 大列表的开源项目,其中包含了一系列开源的 ChatGPT API 用户界面。该项目可以帮助开发者更加方便地使用 ChatGPT API 进行机器学习方面的工作。
这是一个精心策划的阅读列表,专注于机器心智理论的最新进展,基于EMNLP 2023年关于大语言模型中情境心智理论的论文构建。
autocaption是一个强大的工具,能够将字幕添加到视频中,创造出卡拉ok效果,支持中文字幕,并提供用户友好的界面以及可自定义的字幕样式。
Surya 是一个文档 OCR 工具包,几乎涵盖了完整 OCR 解决方案所需的一切。它支持90多种语言的文本识别,提供行级文本检测、阅读顺序检测和布局分析等功能,适合多种应用场景。
tracing 是一个框架,用于检测 Rust 程序以收集结构化的、基于事件的诊断信息。它支持灵活的事件记录和日志管理,适合异步编程的需求。
这个开源项目是针对Bing使用的ChatGPT API进行反向工程,并提供优化性能的功能。使用该项目需要有试用资格的Bing网站cookie,据说性能比ChatGPT官方网站的要好,跟Pro版本差不多。
这是一个关于几何生成模型(GGM)的教程资料,旨在帮助用户理解和实现各种生成模型。它提供了理论背景、实际应用示例,并支持多种模型的实现,同时包含易于使用的代码示例以及最新的研究进展。
Rocketnotes 是一款基于 Web 的 Markdown 笔记应用,具有 LLM 支持的文本完成、聊天和语义搜索功能。它通过强大的语义搜索和文本自动完成功能,提升用户的笔记管理和写作效率,是现代知识管理的理想工具。
一款开源高性能的可多人协作代码编辑器,结合了 IDE 的强大功能与轻量级编辑器,旨在提供卓越的性能和用户体验。
minRLHF是基于minGPT构建的最小化RLHF实现,包含一个0.8M参数的积极情感推文生成模型HappyGPT和文本摘要项目。该项目简洁易懂,提供完整的训练和推理功能,适合学习和研究RLHF技术。
GPT4Company是一个请求转发器,用户可以通过配置关键词和API地址,以安全地接入OpenAI,防止敏感信息泄露。该工具提供灵活的设置和多种关键词选项,满足不同公司的需求,同时提供警告信息,以提醒用户潜在的泄密风险。
这个开源项目是一个语音聊天应用,名为SpeechGPT。它是免费和开源的,支持100多种语言,具有优秀的隐私保护和语音识别、语音合成功能。它使用机器学习技术,用户可以通过在网页上输入文字或语音与ChatGPT对话。
ReComA旨在通过Agent通信实现推理问题的简化开发,提供了一个灵活的框架,支持多Agent间的通信,易于集成到现有系统中。
rs是一个基于JAX的随机搜索实现,专为运动任务设计,能够高效地利用MuJoCo XLA (MJX)进行训练,支持多种运动环境,便于研究和实验。