AI学习网站 | AI-magic

MDocAgent是Adobe推出的多智能体跨模态框架，专注于复杂文档理解与问答。它通过五个协同工作的智能体（通用/关键信息提取/文本/图像/总结智能体）整合文本和图像信息，结合文档预处理、多模态检索、关键信息提取等步骤，在5个基准测试中性能超越现有方法12.1%。支持端到端的文档解析、跨模态检索、多智能体推理和自动化评估流程。

0

关键信息提取多模态文档问答框架文档理解与问答智能文档解析

amazon-nova-samples开源项目 – Amazon Bedrock入门指南

该项目是AWS官方提供的Amazon Bedrock模型使用示例库，包含多个Jupyter Notebook示例，涵盖环境配置、权限设置和代码实践。详细指导用户如何通过AWS IAM配置Bedrock访问权限，并提供不同场景下的模型调用方法。项目遵循MIT-0开源协议，鼓励社区贡献。

0

Amazon Bedrock示例库AWS IAM权限配置生成式AI案例演示

simple-evals开源项目 – 轻量级语言模型评估库

OpenAI开源的轻量级语言模型评估库，主要用于透明化模型性能指标的发布。强调零样本思维链评估方式，提供多个标准化测试基准，支持主流API接口。包含MMLU、MATH等7个核心评估指标，涵盖理解、数学、编程等多维度能力测试。特别包含BrowseComp浏览器智能体专项测试集（1266个高难度问题）。

0

AI性能测试库OpenAI开源项目语言模型评估工具零样本思维链评估

instructlab开源项目 – 利用合成数据微调大型语言模型的工具

InstructLab 是一个开源项目，旨在通过合成数据方法对大型语言模型（LLM）进行对齐和微调。其核心组件 `ilab` 提供了命令行界面，支持模型下载、交互式聊天、生成训练数据、模型训练和评估等功能。项目强调社区协作，允许用户通过贡献知识和技能到 taxonomy 仓库来改进模型。InstructLab 支持多种硬件加速选项（如 Apple Metal、AMD ROCm、NVIDIA CUDA），并提供了完整的端到端工作流程，从数据生成到模型训练和评估。

0

LLM训练框架合成数据生成大型语言模型微调工具开源AI项目

ChatGPT o3官网 – 更强大的推理模型

GPT O3是一个比O1更强大的“推理完整模型”，超长的上下文支持，复杂推理任务，支持超长代码库的生成与调试

0

ChatGPTGPT代码开发低成本AI

DevDocs开源项目 – 智能文档处理开发加速器

DevDocs是由CyberAGI开发的开源文档处理工具，专为开发者设计，能够自动爬取、解析和组织技术文档内容。它通过智能爬虫技术将分散的文档转化为结构化数据，大幅降低技术调研时间。项目内置MCP服务器，支持与Claude等AI工具集成，提供对话式文档查询体验，支持Docker快速部署，适用于企业团队、独立开发者等多种场景。

0

AI集成文档查询开发者工具开源项目技术文档解析

ml-course开源项目 – 开源机器学习课程

girafe-ai提供的机器学习课程第一学期内容，涵盖从基础算法（如kNN、线性回归）到深度学习（如Dropout、Seq2Seq）的完整知识体系。包含每周课程视频、幻灯片、作业及截止日期，提供线性代数复习等补充材料，推荐多本经典教材作为延伸阅读。课程由专业团队开发，包含2023年Yandex ML训练营分支内容，采用Jupyter Notebook形式组织教学资源。

0

Jupyter Notebook教学Yandex ML训练营开源机器学习课程机器学习实践作业

Versatile-OCR-Program开源项目 – 教育场景多模态OCR工具

该项目是一款专为教育材料和机器学习训练优化的多模态OCR系统，支持从复杂文档（如试卷、学术论文）中提取文本、数学公式、表格、图表等多语言内容。采用两阶段处理流程（初始OCR提取+语义解释），结合DocLayout-YOLO、Google Vision API、MathPix等多种技术，输出结构化JSON/Markdown格式数据。在真实学术数据集（如EJU生物学、东大数学题）上达到90-95%准确率，特别擅长处理科学内容密集、公式繁多的复杂排版文档。

0

多模态OCR系统学术论文解析教育材料OCR智能阅卷系统

查找专家混合模型 (Mixture of Lookup Experts, MoLE)论文 – 优化MoE推理效率的查表技术

MoLE是一种针对混合专家模型（MoE）的优化架构，通过查表技术显著提升推理效率并减少显存使用。其核心创新是在推理前将专家网络重新参数化为查找表（LUTs），根据输入ID直接检索预计算结果，同时支持将专家卸载到存储设备。实验表明，在相同计算资源下，MoLE的推理速度可与密集模型媲美，且比传统MoE更快，同时保持模型性能不变。该技术特别适合大型语言模型等需要高参数规模和低延迟的场景。

0

MoE推理加速专家混合模型优化低显存AI推理大型语言模型部署

通义效率官网 – 阿里云推出的智能办公效率工具

通义效率是阿里云基于通义大模型家族开发的AI工具，集成语音识别和自然语言处理技术，提供实时会议转录、多语言翻译、智能总结等功能，覆盖办公、学习、跨国协作等场景。支持PC网页、移动端、小程序等多平台使用，新用户可享20小时免费试用。

0

PPT智能创作会议转录多语言翻译文档摘要

豆包AI全能训练营官网 – AI视频创作与变现课程

这是一个专注于AI视频创作与变现的在线课程，包含120+节视频教程，覆盖从创意生成到动画角色制作的全流程。课程整合了PIKA、RUNWAY等主流AI工具，并详细教授通过短视频、小说创作、微信红包封面等途径实现收益的方法。支持移动端和PC端学习，提供QQ/微信客服支持，适合新手系统学习AI视频商业化。

0

AI商业化课程AI视频创作AI视频变现PIKA视频生成

LLMFactor论文 – 基于大语言模型的股票预测框架

LLMFactor是一种基于大语言模型（LLM）的因子生成框架，专注于股票价格预测。它采用顺序知识引导提示（SKGP）技术，从新闻和社交媒体等非结构化文本中提取可能影响股票价格的关键因素，并为预测提供解释性推理。该框架在美国和中国股票市场的四个基准数据集上进行了评估，表现出优于现有最先进方法的性能。

0

基于大语言模型的股票预测框架股票价格趋势预测量化投资和风险管理金融时间序列预测研究

TOFL.AI官网 – 托福/雅思AI备考工具

TOFL.AI是一款基于AI技术的教育工具，专注于托福和雅思考试的备考。它通过集成GPT等大模型技术，为考生和辅导老师提供智能化的学习支持，包括自动评分、内容修改、个性化反馈等功能。该工具特别适合辅导老师使用，提供AI网校功能，帮助管理学生进度并提供定制化学习方案。

0

AI网校功能AI评分系统个性化学习支持托福雅思AI备考工具

瑞兔随课堂AI教学平台官网 – AI驱动的个性化教学平台

瑞兔随课堂AI教学平台是由北京中科睿途科技有限公司开发的AI教育工具，专注于通过人工智能技术优化教学过程。该平台结合AI大模型能力，为学生提供个性化的学习路径和教学内容，旨在提升教学效果和学习效率。平台适用于教育行业，已在多个领域和城市得到应用。

0

AI教学平台AI辅助教学个性化学习教育技术

雅思Ai口语陪练官网 – AI驱动的英语考试培训平台

学为贵集团推出的AI英语教学平台，主打雅思/托福等考试培训服务。通过AI大模型技术提供24小时在线的口语陪练、写作批改和智能模拟考试功能，支持个性化学习路径定制。平台特别注重还原真实考试场景，并配套国际学校选择小程序，形成从语言培训到留学申请的全链条服务。

0

AI写作批改AI英语口语陪练智能模拟考试系统留学申请规划

极课大数据官网 – K12教育AI精准教学平台

极课大数据是字节跳动旗下大力教育推出的K12教育AI工具，整合大数据与人工智能技术，为中小学提供精准教学支持。平台覆盖3500多所学校，服务570万师生家长，通过数据看板、智能阅卷、学情分析等功能，实现教学管理优化和个性化学习方案生成。

0

K12教育AI精准教学平台个性化学习方案生成学情分析智能阅卷工具

AI小博士智慧教学助手官网 – AI驱动的智能教学辅助工具

由学科网开发的AI教育工具，深度融合AI大模型技术，为教师和学生提供全场景智能化教学支持。其核心目标是通过OCR识别、智能组卷、海量资源库等功能，显著提升备课效率、优化学习路径，并实现教育数据的科学管理。系统支持多终端接入（移动端/PC/小程序），已与多地教育局、硬件厂商达成合作，推动教育数字化转型。

0

AI教育工具OCR识别教育数字化转型智能教学辅助

工学通AI智能教学平台官网 – AI驱动的工学教育平台

由北京课通天下教育科技有限公司开发的AI教育项目，专注于通过人工智能技术提升工学领域的教学效果。平台利用AI大模型提供个性化学习路径和教学内容，旨在帮助学生高效提升工学技能。目前公开信息有限，可能处于早期开发或内部测试阶段。

0

AI教育平台个性化学习路径工学教育工程模拟工具

特范云AI智慧体育项目官网 – AI驱动的体育教育智能化解决方案

该项目由北京特范云科技有限公司开发，专注于体育教育领域的智能化创新。通过整合纳米级知识图谱和智能穿戴设备技术，实现运动数据的精细化采集与分析，旨在为学校、培训机构及个人提供精准化教学和个性化训练方案。目前公开信息有限，推测其技术架构包含实时生物数据监测、运动姿态分析、基于知识图谱的智能反馈系统等模块，可能适用于K12体育教学、专业运动员训练等场景。

0

AI驱动的体育教育解决方案个性化训练计划生成智能穿戴设备数据分析运动表现评估系统

齐鲁AI大模型实训平台官网 – AI驱动的个性化教育平台

该项目是由齐鲁AI大模型生态联盟与齐鲁工业大学（山东省科学院）联合开发的AI教育平台，旨在通过人工智能技术提升教学与培训效果。平台整合大数据、机器学习和知识图谱等技术，构建跨学科知识体系，提供个性化学习路径（"一生一谱"），并支持教师数字化能力提升。作为山东省AI教育改革的一部分，平台覆盖全省高校，可能涉及线上线下混合教学模式，并与产业需求紧密结合。

0

AI助教AI教育平台个性化学习路径教学PPT生成

BLOOMZ模型 – 多语言大模型指令跟随

BLOOMZ是由BigScience和Hugging Face开发的多语言大语言模型系列，通过对BLOOM和mT5预训练模型进行跨语言任务混合（xP3）微调，实现在46种自然语言和13种编程语言中的零样本指令跟随能力。支持从300M到176B的多种参数规模，适用于翻译、内容生成、概念解释等多样化NLP任务。

0

内容生成多语言大模型开源NLP模型指令跟随模型

mT0模型 – 多语言大语言模型

mT0是BLOOMZ & mT0模型家族的一部分，是一种多语言大语言模型，能够零样本学习地遵循人类指令，适用于数十种语言。它通过在多语言任务混合（xP3）上进行微调，实现了跨语言泛化能力，能够在没有特定训练的情况下处理新任务和新语言。mT0支持101种语言，尤其在英语提示下表现良好。模型提供多种参数规模（300M至176B），适合不同计算需求和应用场景。

0

多语言大语言模型多语言翻译文本生成自然语言处理

FLAN论文 – 指令微调提升语言模型泛化能力

FLAN（Fine-tuned LAnguage Net）是一个通过指令微调技术提升语言模型泛化能力的项目，专注于自然语言处理（NLP）领域。它通过在多样化的指令数据集上微调预训练模型（如T5），使模型能够处理未见过的任务，如分类、翻译、问答等，特别适用于零样本和少样本学习场景。项目强调模型规模越大性能越好，且支持多语言任务，但需注意其数据可能存在污染问题。

0

多语言任务处理指令微调技术自然语言处理零样本学习

GPT-3.5 Turbo官网 – OpenAI优化的对话型语言模型

GPT-3.5 Turbo是OpenAI开发的大型语言模型，专为对话接口和文本补全任务优化。作为API中的最新版本（如gpt-3.5-turbo-0125），它具有更低的价格、更高的格式准确性，并修复了非英语功能调用的错误。知识截止日期为2021年9月，适合多种非聊天场景。该模型支持16K上下文窗口，提供可靠的JSON输出，速度优于GPT-4，但复杂任务仍建议使用GPT-4。

0

JSON输出多语言处理对话型语言模型文本生成

PaLM 2官网 – 谷歌下一代多语言AI模型

PaLM 2（Pathways Language Model 2）是谷歌于2023年9月发布的先进语言模型，专注于提升多语言处理、逻辑推理和编程能力。支持超过100种语言，擅长生成多种编程语言代码，并通过高级语言考试达到“精通”水平。模型提供四种尺寸（Gecko/Otter/Bison/Unicorn），适用于从移动端到企业级的多样化场景，驱动包括Bard、Workspace、Med-PaLM 2等25+谷歌产品。训练数据涵盖网页、书籍、代码等多元内容，虽存在未公开细节的数据污染报告，但在多语言和推理任务中表现卓越。

0

代码生成企业级AI解决方案医疗AI多语言AI模型

PaLM官网 – 谷歌多模态大语言模型

PaLM（Pathways Language Model）是Google开发的大型语言模型，首发于2022年4月，最新版本PaLM 2于2023年5月推出。该模型拥有5400亿参数，训练数据涵盖7800亿标记，包含50%社交媒体内容以增强对话能力。其特色在于多语言支持（超100种语言）、强大的推理和编码能力，并驱动Google Bard、Workspace等25+产品。创新性地衍生出医疗专用版Med-PaLM 2（可分析X光片）、安全专用版Sec-PaLM等垂直领域变体。

0

Google Bard企业级AI解决方案医疗AI多模态大语言模型

OpenAI o1官网 – 专注复杂推理的AI模型

OpenAI o1是OpenAI发布的新型推理模型系列，包含o1-preview和o1-mini两个版本，专注于解决科学、编码和数学领域的复杂问题。该模型通过延长思考时间提升推理能力，在物理、化学等学科基准测试中达到博士生水平，并展现出较高的安全性和成本效益。目前提供分级访问权限，未来计划扩展功能覆盖更多用户场景。

0

AI基准测试工具复杂推理AI模型数学解题科学问题解决

松下幸之助再现AI官网 – AI传承松下幸之助管理哲学

该项目由松下控股与PHP研究所联合开发，通过生成式AI技术还原创始人松下幸之助的思维和语言风格，旨在传承其管理哲学。基于3000+段音频、著作及演讲数据，结合东京大学松尾实验室的技术支持，AI能实时生成文本、音频及动态视频回应，模拟其70年代的声音和表情。项目强调伦理使用，需人类监督，目前主要用于松下集团内部员工培训和文化传承。

0

AI传承管理哲学企业培训工具历史人物再现技术多模态AI生成

Code Without Barriers官网 – 微软亚太女性科技赋能计划

微软发起的亚太地区包容性创新项目，通过技术培训、导师指导和社区支持缩小AI/云计算领域的性别差距。覆盖15+国家，提供免费技能培训、黑客马拉松和就业机会，已培训51.78万女性AI人才，使开发者多样性从2021年12%提升至2023年30%。包含750万开发者社区、1000+女性导师网络，并与53+机构合作，兼具技能培养与职业发展支持。

0

AI技能培训云计算培训女性科技赋能计划职业发展支持

思考游戏（The Thinking Game）官网 – DeepMind的AGI探索纪录片

《思考游戏》是一部由Greg Kohs执导的83分钟纪录片，记录Google DeepMind首席执行官Demis Hassabis及其团队五年间在人工通用智能（AGI）领域的突破性研究。影片以AlphaFold解决蛋白质折叠难题为核心，结合Hassabis的个人经历（如国际象棋冠军背景和游戏开发生涯），通过档案片段和动画生动解释复杂科学概念。影片2024年在翠贝卡电影节首映，2025年3月21日起英国影院上映，探讨AI从棋类博弈到癌症治疗的广泛影响。

0

AGI纪录片AI科普教育AlphaFoldDeepMind