该项目探讨了在不同位精度下的语言模型(LLM)性能比较,尤其是4位和8位精度模型的精度表现。
研究详细分析了多模态模型架构的优缺点,提供了构建和选择合适模型的指导,并首次识别和分类了四种主要的多模态模型架构类型。
MiniCPM-o-2_6是Openbmb发布的一款新的混合模型,结合了多个先进模型,能够处理视觉、语音、视频流和OCR等多种任务,具有强大的功能和灵活的应用场景。
RIO是一个基于优化和点不确定性感知的4D雷达系统雷达-惯性里程计,旨在实现高精度的定位和导航。它通过结合雷达数据和惯性传感器信息,提供可靠的定位解决方案,适用于多种环境和应用场景。
DeepSeek是一家专注于人工智能技术研发的公司,其推出的DeepSeek-R1等模型以低成本、高性能的特点颠覆了传统AI赛道的技术逻辑,打破了对高性能芯片的依赖,展现了强大的语言理解、生成和推理能力。
Nexa SDK是一款全面支持ONNX和GGML模型的工具包,具备文本生成、图像生成、视觉-语言模型(VLM)、自动语音识别(ASR)和文本到语音(TTS)功能,提供OpenAI兼容的API服务器,支持JSON模式调用函数和流媒体,配备用户友好的Streamlit UI,方便开发者使用和集成。