方法论

Awesome Amortized Inference开源项目 – 摊销推断的综合资源库

Awesome Amortized Inference开源项目 – 摊销推断的综合资源库

关于摊销推断（Amortized Inference）的社区驱动资源库，提供了包括综述文章、软件工具、方法论论文和应用论文在内的资源列表，旨在为研究人员和开发者提供全面的信息和工具支持。

摊销推断资源库文献查找方法论社区驱动

Awesome-LLM-as-a-judge开源项目 – 大语言模型评判任务资料库

Awesome-LLM-as-a-judge开源项目 – 大语言模型评判任务资料库

一个关于LLM作为评判器的综合资料库，收集整理了大语言模型在评判任务中的应用研究，涵盖了帮助性、无害性、可靠性、相关性、可行性等多个评估维度，以及相关方法论和评估基准

大语言模型评判任务资料库方法论评估基准评估维度

LLM-eval-survey开源项目 – 大型语言模型评估资源集合

LLM-eval-survey开源项目 – 大型语言模型评估资源集合

这是一个与大型语言模型评估相关的论文和资源集合，旨在为研究人员和从业者提供全面的参考资料，定期更新新发现和资源。

大型语言模型评估资源研究人员参考资料评估论文集合

GPQA-高难度的研究生级问答基准

Graduate-Level Google-Proof Q&A Benchmark，是一个评估大型语言模型和可扩展监督机制能力的高难度数据集，包含448道选择题，旨在测试专家的准确率。

大型语言模型评估研究生级测试集高难度问答基准

Awesome-LLM-Survey开源项目 – 汇集大规模语言模型的研究资源

Awesome-LLM-Survey开源项目 – 汇集大规模语言模型的研究资源

这是一个关于大规模语言模型的精彩集合，汇聚了最新的研究成果和资源，包括论文、技术进展以及各种语言模型的比较和评估，支持社区的贡献和反馈。

大规模语言模型研究资源社区贡献与反馈论文和技术进展

PlagiarismCheck官网 – 高效的在线查重工具

PlagiarismCheck 是一款在线查重工具，提供 100% 准确的抄袭检测服务，适用于教育机构和学生，帮助用户高效地识别和避免抄袭问题。

在线查重工具学生论文检测抄袭检测教育机构

Context Length Extension Techniques in Large Language Models-探讨上下文长度扩展的研究进展

本项目对大型语言模型中的上下文长度扩展进行了详细调研，讨论了现有策略、评估复杂性及研究者面临的挑战。

NLP研究上下文长度扩展大型语言模型研究资源

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3