这个开源项目的目标是创建一个能够进行24点计算的程序,使用了GPT-4进行代码生成。需要进行debug调试,最终生成的代码链接可以在O网页中找到。生成过程可在history.md文件中查看。
VCoder是一个多功能视觉编码器,旨在提升多模态大语言模型的感知能力,支持图像推理和生成任务,能够识别和计算图像中的物体,同时提供分割和深度图等感知模式,并利用COCO数据集进行训练和评估。
这是一个精心策划的Rust项目集合,涉及神经网络相关内容,旨在补充《我们学到了什么》。
Icônes 是一个强大的图标探索工具,利用 Iconify 实现即时图标搜索,用户可方便地集成多种图标格式,享受友好的界面体验。
该项目研究了prompt在不同下游任务和不同类型、规模的预训练语言模型之间的迁移性,探索其在零样本设定下的有效性、对其他模型的适用性以及对训练速度的提升,并分析了影响迁移性的因素。
面向中小学生的自托管编程学习平台,由LLM提供,旨在帮助教育者创建和学生学习编程教育内容
ml-calibration是一个用于测量校准和绘制可靠性图表的工具包,提供了可视化方法来评估模型的校准程度,并生成可靠性图表以帮助分析模型的可靠性。该工具包支持多种校准方法的比较,易于集成到现有的机器学习工作流中。
ReplaceAnything是一款能够准确保留指定物体,并通过输入提示词,实现超高质量内容替换的工具。它支持多种场景应用,适用于商用场景如AI模特、商品宣传图和艺术写真照。
这个开源项目是由OpenAI开发的语音识别系统,使用AI技术进行语音识别,提供了GitHub代码库和其他开发资源。
ProsePainter 是一个通过文字描述自动生成图像的艺术创作工具,它结合了直接数字绘画与实时引导的机器学习图像优化,为用户提供直观且友好的创作体验。
BingGPT是一个新的必应人工智能聊天桌面应用程序,支持Windows、macOS和Linux,能够进行实时对话,并提供撰写文章等多种功能,用户可以根据个人需求进行设置调整。
DrivingDojo Dataset旨在通过互动驾驶模拟和知识丰富的模型,推进自动驾驶领域的发展,为AI模型的训练和驾驶行为及场景研究提供支持。
TCM-Ancient-Books项目收录了近700项中医药古籍文本,提供了文本的格式化和结构化,支持多种搜索和查询功能,为用户提供中医药相关知识的参考。
Upscayl是一款AI图像无损放大软件,可以将模糊图片变为高清图。它支持常见操作系统,底层模型使用腾讯开源的Real-ESRGAN,效果比Waifu2x好很多。
阿里巴巴云计算推出的大型音频语言模型,能够接受各种音频信号输入,并根据语音指令进行音频分析或直接生成文本回复,为对话系统和音频处理任务提供强大支持。
面向Stretch 3移动机器人的智能行为开发框架,集成了抓取、操控、导航、LLM代理、语音交互等多项功能。
ResuLLMe利用大型语言模型(LLM)定制和优化简历,帮助用户避免求职中的常见错误,就像一个智能职业顾问,能够有效检查和提升简历质量。
该项目专注于在知识蒸馏中弥合不同架构之间的性能差距,通过有效的策略提升模型的表现。
GPT-3是一个由OpenAI开发的自然语言处理模型,具有1750亿个参数,能够生成与人类相似的文本。它凭借强大的文本生成能力和高效的上下文理解,广泛应用于对话、写作、编程等多个领域。