llm-viz是一个用于GPT风格大语言模型的三维可视化工具,能够帮助用户深入理解模型的内部结构及其行为。通过交互式的方式,用户可以探索模型的输入、输出以及权重分布,提供多种视角和缩放功能以进行详细分析。
通过 LMSYS 的 Chatbot Arena 数据生成的大语言模型过去一年 ELO 的排名变化对比动画,帮助用户直观了解不同模型的表现和竞争力。
Record 3.0是一个帮助用户通过视觉化沟通问题,提升理解和分析能力的网站。用户可以通过简单的工具创建问题的可视化表示,帮助他们理清思路并探索潜在解决方案。
xLSTM是由LSTM发明者创造的新架构,旨在实现与Transformer类似的规模和性能,同时缩小与现有最先进LLMs的差距。
GraphRAG Visualizer是一个Web工具,用于可视化和探索微软GraphRAG框架生成的数据。它支持2D和3D图形的可视化,数据表格展示以及强大的搜索功能。用户可以上传由GraphRAG索引管道生成的parquet文件,并本地查看和分析数据,包括文档、文本单元、社区、协变量等节点及其关系。
一个完整的大语言模型(LLM)可解释性研究项目,使用稀疏自编码器(SAE)分析Llama 3.2模型,由纯PyTorch实现且可完全复现。包含从数据采集、SAE训练、特征分析到验证的全套流程,可帮助理解模型内部行为和概念表示
VerbaGPT旨在通过大型语言模型简化数据分析过程,同时确保数据隐私不被侵犯。该项目结合了先进的自然语言处理技术,使用户能够更轻松地从数据中提取洞见,而无需担心敏感信息的泄露。
ReALM是苹果发布的一种新模型,通过重构屏幕上的信息为纯文本表示,使大型语言模型能够理解屏幕上的内容。该模型比ChatGPT-4更快、更小,能够理解屏幕上的内容而不需要直接看到图像,通过实体识别和位置记录生成文本化表示,减少模型参数,同时保持与GPT-4相似的性能。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型