Translatotron 3 是由 Google 研究团队开发的直接语音到语音翻译系统,通过自监督和对抗学习从未标记的语音和文本数据中学习,无需成对数据。系统结合了掩码自编码器、无监督嵌入映射和反向翻译三种技术,实现了无监督语音到语音翻译。其在某些公共数据集上的表现优于基线级联系统,并能保留非语言信息如停顿、语速和说话者身份,展示了无监督翻译的巨大潜力。
self_talk是一个专注于无监督常识问答的项目,通过自对话机制生成和验证答案,旨在提升AI模型的推理和理解能力。该项目利用内部对话来优化决策过程,特别适用于处理模糊或复杂的查询。
《Pen and paper exercises in machine learning》是由爱丁堡大学信息学院的Michael U. Gutmann编写的机器学习练习册。本书包含一系列配有详细解答的习题,旨在通过纸笔练习帮助读者深入理解机器学习的理论和概念。习题内容主要聚焦于无监督方法、推断与学习,适合已熟悉机器学习理论和概念的读者。习题来源于作者在赫尔辛基大学和爱丁堡大学的教学实践。
这是一个基于PyTorch的去噪扩散概率模型系列教程,包含了丰富的示例和教程,适用于生成模型的研究。项目支持多种去噪扩散概率模型的变体,旨在帮助用户深入理解和应用这一前沿技术。
康奈尔大学的Applied Machine Learning课程的执行课程笔记和幻灯片(2024年秋季版),讲授机器学习、数据挖掘和信号处理中的关键概念。
这本书包含了一系列关于机器学习的习题,并附有详细的解答。希望详细程度足以让读者遵循解决方案并理解所使用的技术。
GFlow是一个从单目视频恢复4D世界的框架,旨在在没有相机参数和多视角视频输入的情况下重建动态4D场景。该项目利用2D先验信息(如深度和光流)将视频提升为4D显式表示,并能够在无监督的情况下从场景中分割移动物体,同时提供每帧的相机姿势以支持新视图渲染。
这是一个无监督的词汇和定义提取技术,利用自然语言处理技术自动从给定文本中提取词汇及其定义,适用于各种文本类型。
SquareDev是一个专为开发基于语言模型的应用而设计的平台,支持多种用例,如与数据聊天、生成个性化文本、聊天机器人、语义搜索以及文本和知识提取等功能。
PromptReply是一个基于AI的WhatsApp助手,旨在彻底改变您的沟通体验。它可以提供即时帮助、内容创作、图像生成等功能,所有操作均在WhatsApp内完成。只需打开WhatsApp,搜索'PromptReply',开始与助手聊天,您就可以提问、请求内容创作或生成图像。助手将快速准确地响应,帮助您完成任务和项目。
Autodoc 是一个从文档中提取数据的工具,用户只需用简单的英语定义所需内容,上传文档,即可获得答案并导出到其他工具中。
Promptr是一个提示语存储服务,允许用户注册和分享适用于AI时代的提示语。用户可以创建账户,浏览可用的提示语,搜索特定主题或类别,一旦找到喜欢的提示语,可以将其保存到个人收藏或分享给他人。用户如有反馈或问题,可通过网站的联系表单与我们联系。
WeCLIP是一个强大的语义分割模型,基于冻结的CLIP结构,致力于弱监督学习,通过有效的特征提取提升图像分割的性能,适用于各种计算机视觉任务。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型