Machina 是一个结合了实时物体识别和标签标注的智能监控系统,采用 OpenCV、YOLO 和 LLAVA 技术,能够处理高分辨率视频流并连接 RTSP 流,实现实时物体检测、标注和追踪。该系统适用于安全监控、物体识别等多种场景,提供高效的智能监控解决方案。
SmolVLM2 是一个非常小的视觉模型,提供 256M、500M、2.2B 三个版本,能够识别物体、回答问题和对视频做总结。该模型设计轻巧,适用于移动设备,如 iPhone,能够高效执行多种视觉任务。
IsItAI.com的API是一个强大的工具,使用先进的人工智能算法检测和分类图像,提供准确高效的图像识别,适用于内容审核、物体识别和视觉搜索等多种应用场景。
KEPL AI利用视觉人工智能技术,通过图像分析提供即时洞察和物体识别。用户可以使用KEPL AI相机识别植物、昆虫等各种物品。
该项目提供了用于Google扫描对象数据集的MuJoCo模型,旨在支持物体识别和机器人操作任务。它包含多种真实物体的详细几何数据,并与MuJoCo仿真环境无缝集成,适用于多种物理仿真和机器人研究。
该项目专注于通过同心因果注意机制减轻模型中的物体幻觉问题,旨在提高模型对物体的识别能力,特别是在复杂的视觉语言任务中。
FiT3D项目旨在通过3D感知的微调技术来增强2D特征表示,提升图像理解和识别的能力。该项目结合了深度学习和计算机视觉的前沿技术,致力于在多种视觉任务中实现更高的性能。
在多个粒度上分割和识别物体的通用图像分割模型。团队在SA-1B数据集、通用分割数据集(COCO等)和部件分割数据集(PASCAL Part等)上联合训练模型的首次尝试,并系统研究了在SA-1B上定义的交互分割任务和其他分割任务(如全景分割和部件分割)上多任务联合训练的相互促进作用。
OpenGlass 是一款经济实惠的产品,用户只需 $20 就能将任何普通眼镜转变为 AI 智能眼镜。它支持多项先进的 AI 功能,帮助用户更好地记录生活、识别物体、计算卡路里,并进行实时翻译。
SPIN是一个先进的机器人系统,能够在复杂环境中进行实时感知、交互和导航。它结合了多种技术,如动态避障、物体识别和主动视觉,允许机器人在无需预先创建环境地图的情况下高效地移动和操作。
Jetcounter是一款基于人工智能的物品计数应用,利用计算机视觉软件准确地从照片中计数相似物品。用户可以选择内置的不同类别模板,上传照片或使用设备摄像头,Jetcounter会识别并计数图片中的物体,支持放大查看细节并手动纠正错误。
Logistify AI利用计算机视觉为仓库和工厂提供自动化库存验证,减少因人工计数带来的库存损失,并通过自动化监控降低劳动力成本。该平台可以与现有的ERP系统和监控摄像头集成,自动识别每个SKU并与ERP装载清单进行核对。
QuickCount是一个设计用于帮助用户快速且准确地计数物体的网站。用户只需打开网站,通过点击物体来进行计数,网站会自动统计物体数量并显示结果。用户还可以保存和分享统计结果。
Meteron AI是一个强大且易于使用的工具集,旨在帮助您发展AI业务。它处理负载均衡、订单、存储和限制,让您可以专注于创建更好的模型和吸引更多流量。通过Meteron,您可以快速构建AI产品,管理请求队列,享受无限存储,并获得社区支持。
zipx是一个利用人工智能技术,旨在为中小型企业简化电商运营的工具。通过数据分析,zipx能够提供优化建议,帮助商家提升运营效率,实现与大企业的公平竞争。
CV Maker AI 是一款基于人工智能的网络应用,旨在帮助求职者创建专业的简历和履历。它利用先进的 AI 算法分析职位要求,定制申请材料,提升被选中的可能性。用户可以生成个性化的简历摘要,优化工作经历,识别必要技能,并获得针对所需职位的建议、面试问题及答案。
clone是一个用于从指定的GitHub组织或用户克隆所有仓库的工具,支持在克隆过程中重命名仓库,并允许自定义目标目录,能够高效地管理多个仓库。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型