NdLinear是一种创新的N维线性变换层,专门设计用于处理多维数据(如图像、体积医学扫描和多变量时间序列),而无需展平数据,从而保留其结构信息。它沿输入张量的每个维度独立操作,捕获标准线性层忽略的轴特定依赖关系。研究表明,NdLinear在参数效率方面表现出色,使用更少的参数即可实现与标准线性层相当或更优的性能。它可以作为神经网络架构中的替换组件,适用于各种网络类型,如卷积、循环和基于变换器的网络。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型