图像文本识别

ImgChatIO官网 – 图像文本识别及对话应用

ImgChatIO 是一款基于OCR和AI的聊天应用，能够从图像中提取文本并与AI助手进行对话。用户只需上传包含文本的图像，应用便会提取文本，并允许用户与AI助手进行对话。

AI助手对话图像文本识别学习辅助工具

visual-chatgpt开源项目 – zh

visual-chatgpt开源项目 – zh

这个开源项目的功能是支持中文版的 Visual Chatgpt，使用了机器学习的技术。

AI图像工具AI对话工具AI开源项目

TextScan AI官网 – 一款智能文本识别与聊天应用

TextScan AI是一款免费的移动应用程序，允许用户从图像中提取文本并与AI驱动的聊天机器人互动。用户只需安装应用，选择包含文本的图像，应用就会扫描并转换文本。此外，用户还可以与聊天机器人进行对话，享受智能交互体验。

AI聊天机器人图像文本提取手写笔记转录文本识别

Linly-Talker开源项目 – 数字人对话系统，创新人机交互

Linly-Talker开源项目 – 数字人对话系统，创新人机交互

Linly-Talker是一个结合大型语言模型与视觉模型的数字人对话系统，通过集成多种先进技术，如Whisper、Linly、微软语音服务和SadTalker生成系统，创造全新的用户与AI助手的互动体验。该系统允许用户通过图像与AI进行对话，并支持自由对话和内容生成，极大地提升了人机交互的灵活性和趣味性。

AI助手人机交互内容生成图像对话

Google Gemini Pro Chat Bot官网 – 一个免费的文本和图像交互工具

Google Gemini Pro Chat Bot是一个基于Google Gemini Pro API实现的交互工具，允许用户通过输入文本和图像与Gemini进行对话。它支持多模态提示，使用户能够更加灵活地与AI进行交流。

AI交互工具Google Gemini Pro Chat Bot免费对话体验多模态输入

ScreenshotAI官网 – 智能截图助手

Screenshot AI 是一个智能截图助手，利用先进的AI技术分析和提取图像中的相关信息，比如收据和笔记，从而简化截图的搜索和管理。

AI提取文本截图管理工具提醒事项管理智能截图助手

TurnHerToAI官网 – 将你喜欢的网红转化为可聊天的AI

TurnHerToAI是一个创新的平台，允许用户将他们喜爱的社交媒体影响者转化为可以随时通过文本或图像互动的人工智能。用户可以与这些AI进行24/7的对话，体验个性化的互动，感受与影响者的亲密联系。

AI聊天平台个性化AI互动社交媒体影响者AI

ParrotPDF官网 – 让你的PDF文件活过来！

ParrotPDF是一个创新的PDF助手，让用户能够与文档进行对话，提问并获取答案，探索文件内容，极大提升阅读和理解效率。

PDF助手学习辅助工具实时提问与回答文档内容探索

TaskGuru – AI Chat & Photo-智能助手，解决问题

TaskGuru是一个AI助手，能够根据文本输入和图片解决各种问题。无论是数学还是科学作业，只需拍照，助手会提供详细的解题步骤和解释。用户也可以进行一般对话，获得互动交流的体验。

AI助手互动聊天助手数学作业解决工具科学作业解决工具

Macaw-LLM开源项目 – 多模态语言建模的新探索

Macaw-LLM开源项目 – 多模态语言建模的新探索

Macaw-LLM是一项探索性的努力，它通过无缝地结合图像、视频、音频和文本数据，开创了多模态语言建模。

多媒体内容生成多模态语言建模实验性研究开源项目

Gemini AI官网 – AI互动与创新的门户

Gemini AI是一个强大的人工智能平台，提供多种交互方式，用户可以通过动态对话、自由格式提示以及结构化提示与AI进行互动，探索AI的潜力和创新应用。

AI互动AI模型训练动态对话结构化提示

eSearch开源项目 – 一款多功能的截屏和搜索工具

eSearch开源项目 – 一款多功能的截屏和搜索工具

eSearch是一个开源的工具，结合了截屏、OCR、搜索、翻译、贴图、以图搜图和录屏等多种功能，旨在提高用户的工作效率和信息获取能力。

OCR信息搜索录屏软件截屏工具

AiFy官网 – 快速获取GPT响应的应用

AiFy是一款Android应用，通过允许用户选择文本并即时获取响应，增强了GPT的可访问性。用户只需选择想要获取回应的文本，然后按下AiFy按钮，应用会提供即时响应，直接放入用户的输入框中。

AI生成文本响应即时文本处理应用

MacCopilot官网 – 智能化的macOS助手

MacCopilot是一款为macOS用户设计的本地助手应用，能够智能互动屏幕内容，结合先进的AI模型如GPT-4和Gemini，旨在提升用户的生产力和创造力。用户可以灵活捕捉屏幕截图，与AI进行深入对话，并将内容导出为Markdown格式，方便分享和使用。

AI助手macOS应用Markdown导出屏幕截图工具

HuggingChat for macOS开源项目 – 为Mac用户提供AI聊天界面

HuggingChat for macOS开源项目 – 为Mac用户提供AI聊天界面

专为Mac用户设计的聊天界面，利用开源语言模型，将先进的AI对话功能带到您的桌面，提供无缝且直观的体验

AI聊天界面Mac应用程序开源语言模型

QuickVision: Chatgpt Vision forChrome官网 – 为ChatGPT提供即时截图和自定义提示的Chrome扩展

QuickVision是为ChatGPT Plus用户设计的Chrome扩展，允许用户即时捕获和分享屏幕截图，并设置和保存自定义提示，以便更高效地与AI聊天。用户只需安装该扩展，并将其与GPT-4集成，即可轻松使用这些功能。

AI聊天效率提升ChatGPT扩展即时截图自定义提示

Argil官网 – 无代码AI自动化平台

Argil是一个无代码的AI自动化平台，用户可以创建自定义自动化来处理重复任务，利用AI在图像和文本处理方面的能力，每周节省数小时的工作时间。

AI驱动的模板文本和图像处理无代码AI自动化平台社交媒体视频制作

ImagenATexto官网 – 从图像中提取文本

ImagenATexto 是一个在线工具，允许用户通过简单的拖放操作，从图像中提取文本。该工具能够精确地识别和提取图像中的文本，适用于各种应用场景，帮助用户将图像内容转换为可编辑的文本格式。

图像文本提取工具在线文本转换工具高精度文本识别

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3