Coin-CLIP是一个开源的多模态模型,专为美国硬币的检索而设计。它结合了图像和文本数据处理能力,支持高效的硬币识别和分类,适合研究人员和开发者使用。
Coin Snap是一款强大的移动应用,利用AI驱动的图像识别技术,能够在几秒钟内准确识别任何硬币。用户只需打开应用,将硬币对准相机框架并拍摄清晰照片,应用将分析图像并提供硬币的详细信息,包括面值、来源国家及其他相关信息。
DALLE-reproduction项目旨在重现OpenAI的DALLE模型,能够根据文本描述生成高质量图像,支持多种文本输入格式,并提供可扩展的模型架构和可调参数,以优化生成效果。该项目实现了多种训练和推理策略,适用于多种应用场景。
在多个粒度上分割和识别物体的通用图像分割模型。团队在SA-1B数据集、通用分割数据集(COCO等)和部件分割数据集(PASCAL Part等)上联合训练模型的首次尝试,并系统研究了在SA-1B上定义的交互分割任务和其他分割任务(如全景分割和部件分割)上多任务联合训练的相互促进作用。