由Hugging Face、Argilla和开源机器学习社区共同合作的项目,旨在赋予开源社区共同构建有影响力的数据集的能力。
Ordinary People Prompts是一个为ChatGPT提供预设计提示的综合数据库,旨在帮助初学者了解AI并有效使用ChatGPT。用户可以通过这个平台获取灵感,创造自己的提示,并参与投票和评论。
Source Prompts是一个集中管理和分享提示的在线平台,灵感来源于PromptBase.com,致力于为用户提供丰富的提示资源,帮助他们更好地利用和生成内容。该平台汇集了各种类型的提示,适用于不同的应用场景,满足用户的多样化需求。
该项目包含了一系列最佳的ChatGPT系统提示,旨在提升与OpenAI开发的对话AI模型的互动质量。
OnePromptADay是一个新闻通讯,旨在每天向用户发送一个AI提示,帮助他们提高撰写AI提示的能力,适用于chatGPT、midjourney、runway ML等多种工具。通过这个项目,用户可以不断练习和改进自己的提示写作技巧,从而提升与AI互动的效果。
EgoExoLearn是一个数据集,旨在将自我中心与外部中心的视角结合,以解析现实世界中的程序活动。该项目关注程序活动的异步数据收集,提供丰富的场景和数据,以便更好地理解人类行为。
Prompt Hunt是一个让用户发现和分享AI提示的在线平台。用户可以浏览其他人的提示、为自己喜欢的提示投票,并查看其他人请求AI执行的内容。这一平台促进了用户之间的互动与灵感交流,帮助用户更好地利用AI技术。
这是一个无需Plus订阅的免费GPT提示集合,提供多种用途的提示,定期更新,界面友好,方便用户使用。
Hugging Face生态(Transformers, Datasets, Tokenizers, and Accelerate等)使用教程,旨在帮助用户掌握各种工具和库,提供实践示例和交互式学习体验,适合不同水平的开发者。
MNBVC(Massive Never-ending BT Vast Chinese corpus)是一个超大规模中文语料集,旨在收集各种形式的纯文本中文数据,包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词等。该数据集不仅涵盖主流文化,还包括各类小众文化及火星文,目标数据量达到40TB,目前进度为19.96%(7984GB),支持社区参与和协作。
本项目研究大型视觉数据集中存在的偏见,旨在为数据集创建者提供洞察,促进数据集的公平性提升。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型