Aegis是一个开源项目,旨在为大型语言模型提供自强化的防火墙功能。其主要目标是保护语言模型免受对抗性攻击,并检测潜在攻击,以避免注入恶意代码、泄露个人信息和使用有害语言。
AI交流(进群备注:aegis)
分析和应用智能在LinkedIn外联的每一步。以简单灵活的方式管理信息。生成个性化的介绍、演示和跟进。您发送的每一条消息都是针对目标受众量身定制的,确保您吸引他们的注意并建立强大的联系。
制作一段视频并针对成千上万的收件人进行个性化处理。可以通过任意渠道进行传送并立即测量结果。您可以通过录制模板,连接数据然后生成个性化视频来实现这一点。
Advanced Literate Machinery (ALM) 是阿里巴巴研究团队开发的一个高级文档智能系统,旨在赋予机器阅读、思考和创造的能力。项目当前专注于从图像和文档中提取信息,未来将探索让机器具备更高层次的智能。项目包含多个子模块,如OmniParser、Platypus、SceneVTG等,涵盖了文本识别、关键信息提取、表格识别、文档解析等多种功能。
GemLite是一个简单且高效的低比特矩阵乘法CUDA库,专为量化权重的GEMV操作设计。它易于阅读和定制,支持多种实现方法和激活类型,并且兼容较旧的GPU硬件。
F5-TTS是一个基于Flow Matching的语音合成项目,旨在生成流畅且高度还原的语音。它通过Diffusion Transformer架构和ConvNeXt V2模块,结合创新的Sway Sampling策略,显著提升了训练和推理速度。项目支持多语言、多风格和多说话者的语音生成,并提供了丰富的工具和接口,如Gradio应用、CLI推理和Docker支持。
基于线性回归和神经网络的空气污染预测系统,利用传感器数据进行实时分析与可视化,帮助用户了解空气质量变化趋势。
由百川智能开发的一个开源可商用的大规模预训练语言模型,支持中英双语,基于Transformer结构,训练于约1.2万亿tokens,具有70亿参数,提供4096的上下文窗口长度,在标准的中文和英文权威benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。
PythonRobotics 是一个开源项目,旨在提供易于理解和使用的机器人算法的Python代码实现。它涵盖了机器人学中的多种算法,包括定位、建图、SLAM、路径规划和路径跟踪等。代码结构清晰,易于阅读和修改,适合机器人学初学者和研究者使用。项目还提供了详细的文档和动画演示,帮助用户更好地理解算法的实现和应用。
camp_zipnerf项目结合了CamP和Zip-NeRF技术,实现了从iPhone捕获的图像中创建高精度的3D空间。该项目通过使用ARKit估计的相机姿势和改进的BARF相机参数化,显著提升了图像质量和3D重建的准确性,达到了最先进的水平。它特别适用于AR/VR应用、NeRF技术研究以及需要高精度3D重建的场景。
HieroLM 是一个基于长短期记忆(LSTM)网络的语言模型,专门用于恢复埃及象形文字。该模型将恢复任务建模为下一词预测问题,利用上下文信息来提高准确性。它能够有效处理严重损坏或完全缺失的象形文字,克服了传统计算机视觉方法的主要局限性。实验显示,即使在数据量有限和上下文信息稀缺的情况下,HieroLM 仍能保持良好的性能,展示了其在考古学领域的应用潜力。
llm_processes 是一个让自然语言驱动的数值预测变得简单高效的项目。它支持多种主流LLM,提供丰富的实验模板,并且易于扩展,只需修改`hf_api.py`即可添加新的LLM。项目涵盖1D合成数据、黑箱优化、多任务回归等多种应用场景,帮助用户通过自然语言轻松实现复杂的数值预测任务。
Probable Motion项目通过预测可能的运动模式,提供了一种无监督的多目标分割方法,能够在视频帧中精准地识别并分离出多个对象。该方法在处理复杂场景时表现出色,尤其适用于动态视频数据的分析和理解。
GPT Runner 是一个用于管理 AI 预设的工具,能够通过与代码文件进行对话,从而简化 AI 的交互过程。它支持多种文件格式,使得用户可以更方便地与代码进行交互和管理不同的 AI 预设。
aiNodes Engine是一个简单易用的基于Python的AI图像和动画生成节点引擎,具备多种强大的功能,支持RIFE和FILM插值等特性,适合图像创作和动画制作的各类应用。
MUG-U是一个强大的多模态大语言模型(MLLM),支持文本、图像、视频等多种输入,能够帮助用户轻松完成复杂的多模态任务。它在多个基准测试中表现卓越,平均准确率高达71.4%,并提供简单易用的API接口,方便快速上手。