基于FastAPI、MLflow和Streamlit的数字识别模型的完整部署实例,提供高性能API、模型管理和交互式界面,支持模型的训练和预测。
BertViz是一个用于可视化各种自然语言处理模型(如BERT、GPT2、BART等)中注意力机制的工具,提供交互式界面,用户可以探索和分析模型的注意力分布,支持自定义输入文本以查看对应的注意力模式。
Thermostat是一个集合,提供多种自然语言处理(NLP)模型的解释及其分析工具,帮助用户深入理解模型的决策过程及性能评估。
一本从机器学习的基础知识开始,一步步地建立您对语言模型的理解的书。官网上可以在线阅读但不能下载。
Notehub.ai是一个便捷的平台,允许用户与同事和朋友分享Jupyter笔记本。用户只需注册账户,创建笔记本,并通过提供笔记本的URL与他人共享。
RE2通过在提示中重复输入问题两次来提高LLM的推理能力,增强对问题的理解,并促进单向解码器 LLM 的双向编码。该方法兼容现有的思想激发提示技术,适用于多种LLM和推理任务,能够有效提高模型的表现。
CodeSquire 是一款专为数据科学家设计的 AI 编程助手,能将评论转化为可执行代码。它通过实时建议和补全功能,简化复杂编码任务,提升生产力,适用于 Google Colab、BigQuery 和 JupyterLab 等平台。
交互式教程,专注于提升提示工程技能,教授如何构建有效的提示来引导人工智能的响应,包含多个Jupyter Notebook文件,涵盖从基础结构到复杂提示构建的各个方面
收录了63个大语言模型(LLM)相关的面试问题及答案,针对2024年机器学习和数据科学面试提供系统化的准备资料。此项目涵盖了LLMs的基本原理、Transformer架构、注意力机制的详细讲解,以及预训练与微调的核心知识点,附带详细解答和代码示例,旨在帮助求职者全面掌握相关知识。
rs是一个基于JAX的随机搜索实现,专为运动任务设计,能够高效地利用MuJoCo XLA (MJX)进行训练,支持多种运动环境,便于研究和实验。
AnyModel是一个工具,允许用户将多个AI模型的输出并排展示。用户可以利用来自多个AI的信息,选择最适合自己需求的模型,从而获得更平衡的视角,并通过比较多个模型的输出,轻松识别'幻觉'现象。
本项目讨论大型语言模型(如GPT-4)在语言相关任务中的表现,并引发关于语言模型是否具备认知能力的哲学争议。重点探讨组合性、语言习得、语义能力等主题,并对人工神经网络作为认知模型的地位进行辩论,同时强调需要进一步的实证研究,以挑战一些长期以来的假设。