一个关于长上下文大语言模型(LLM)的综述性研究,涵盖了架构、框架、训练和评估四个方面的内容,旨在提供对该领域的全面理解和未来研究的指导。
TESS-2是一款大规模通用扩散语言模型,为自然语言处理任务带来全新视角。它基于创新的扩散模型架构,旨在提升模型的通用性和适应性,支持多种语言任务,如问答、文本生成等。同时,TESS-2提供完整的训练和推理脚本,使得用户可以轻松复现和扩展模型。
Deceive D是一种为有限数据环境下的生成对抗网络(GAN)训练设计的适应性伪增强技术,旨在提高模型的性能和生成输出的多样性。
SkyPilot 是一个托管和调度框架,类似于 k8s,用于大模型的推理框架管理。旨在简化大规模模型的部署与管理,提高推理效率。
FactGraph项目通过语义图表示评估摘要的事实性,旨在提高生成摘要的准确性和可信度。
Savanna是一个用于卷积多混合模型(StripedHyena 2)的预训练基础设施,旨在优化大规模分布式训练的性能,支持多种优化技术,并已成功训练多个大型模型,处理超过9T tokens的数据。
通过高质量合成数据提升多模态多语言嵌入性能的创新项目,支持多种任务和语言,在MMEB基准测试中达到SOTA性能,致力于推动跨模态学习的进步。
TaskWeaver是微软开发的智能数据分析代理,通过自然语言指令自动生成Python代码,在TPC-H基准测试中准确率达89%(较传统BI工具提升42%)。它是一个代码优先的Agent框架,主要用于数据分析领域,将用户需求转换为可执行代码,协调各种插件(以函数形式)来执行数据分析任务。
NVIDIA官方优化的大模型推理框架,在H100显卡上运行Llama3-70B模型达400 tokens/s,较原生PyTorch实现提速8倍,支持INT4量化与动态批处理。
本报告讨论了DeepSeek R1模型,以及它的发布对生成式人工智能领域的更广泛意义。
Creative Fabrica是一个利用生成式AI技术创建全新字体的工具,用户可以下载并安装这些字体,极大地改变了字体设计的方式。我们相信,开放和可及的字体设计为现代创意注入了新活力,任何人都可以根据自己的独特想法和需求定制和调整我们的字体。
MLGym是Meta开源的首个专门用于机器学习任务的Gym环境,旨在通过13个跨领域的开放式任务训练AI掌握从生成想法到实验分析的完整研究能力。它集成了计算机视觉、自然语言处理、强化学习、博弈论等多个领域的任务,提供了轨迹可视化工具和Web UI,支持Docker和Podman容器化部署,便于快速上手和测试AI模型。
专注于开放词汇感知领域的综合资源集合,涵盖了开放词汇感知(包括2D和3D)相关的论文和代码资源,为研究人员提供了该领域最新研究成果的集中索引。该项目持续更新,助力研究人员快速上手,涵盖了3D和2D两大领域,资源丰富,提供了10多篇顶级会议论文及代码链接。
HOVER为机器人运动控制提供高效、灵活的神经网络解决方案,基于强化学习技术,能够实现复杂动作的精准控制,支持多种机器人模型,适配性强,并提供详细的训练和测试流程,易于上手。
Deep Lake AI Knowledge Agent 能够对各种类型、位置和规模的数据进行深度研究,支持多模态检索,利用视觉语言模型进行数据的摄取和检索,能够将存储在任何地方的各种数据(如PDF、图像、视频、结构化数据等)连接到AI。随着时间的推移,它会根据你的查询进行学习,定制结果以适应你的工作需求。
Jsonify是一个AI工具,旨在从网站和文档中浏览和提取数据,自动化数据收集和维护过程。
STARTUPIDEA.AI是一个利用AI生成每日创业点子的网页,旨在激励企业家。生成的点子根据当前市场趋势量身定制,便于快速实施。
RegexMy 提供了一系列 AI 工具,用于文本文件的翻译、摘要生成,以及正则表达式和 XPath 的创建。用户可以通过注册获取各种文件处理功能,轻松构建正则表达式。
Frigo是一款基于用户上传的食材图片生成食谱的网页应用。用户只需拍摄冰箱或储藏室的照片,应用便会利用AI技术为其提供个性化的食谱建议。
Buddler提供利用数据洞察的SEO增长黑客工具,旨在增强来自Google搜索控制台和竞争对手分析的自然流量。
Jurnii AI 是一个洞察平台,通过自动化分析和基准工具,衡量和对比数字体验的质量,帮助品牌提升竞争力。
Howmuchmortgage.xyz是一个基于AI的抵押贷款计算器和房产可视化工具,帮助用户有效地计算抵押贷款、可视化房产并分析投资。
IntoTheBlock是一个AI驱动的金融服务平台,提供面向DeFi的实时加密市场情报,专注于机构投资者。它为比特币和以太坊等加密货币提供洞察、风险管理工具和高级分析。
Deformity是一个基于AI的平台,使用户能够创建引人入胜、创新的客户互动表单,提供多语言支持和多种功能,帮助高效收集信息。
Tarotap是一个在线平台,提供免费的AI塔罗牌解读,用户可以与各种AI塔罗阅读者连接,获取关于爱情、职业等方面的个人见解。用户可以探索不同的阅读风格和塔罗牌阵,以获得对生活道路的指导。
Trade Vector AI是斯洛伐克官方的交易平台,专注于加密货币交易和投资,为新手和经验丰富的交易者提供工具和资源,帮助他们在加密市场中导航,并提供实时更新的支持。
Nexform是一个AI驱动的表单构建工具,用户可以通过简单的文本描述快速创建生产就绪的表单和调查。它具有自动生成二维码、智能验证和动态字段等功能,为用户提供无缝的表单构建体验。
Site Review Desk 是一项 AI 驱动的网站分析服务,提供网站性能的综合报告,包括内容质量、设计有效性和 SEO 潜力的洞察。它利用先进的 AI 技术分析网站的各个方面,并提供优先改进建议。
Doti是一个基于AI的搜索工具,帮助团队快速找到答案和洞察,通过统一平台上的数据,用户可以通过Slack、网络界面或Chrome扩展提问,甚至可以使用Doti Memos添加信息,从而实现无缝的信息检索。
SellMeThisPen是一个销售培训工具,利用AI角色扮演、实时帮助和CRM更新,帮助销售人员提升技能,达成更多交易。