NdLinear是一种创新的N维线性变换层,专门设计用于处理多维数据(如图像、体积医学扫描和多变量时间序列),而无需展平数据,从而保留其结构信息。它沿输入张量的每个维度独立操作,捕获标准线性层忽略的轴特定依赖关系。研究表明,NdLinear在参数效率方面表现出色,使用更少的参数即可实现与标准线性层相当或更优的性能。它可以作为神经网络架构中的替换组件,适用于各种网络类型,如卷积、循环和基于变换器的网络。
TSNet是由哈佛大学研究人员开发的一种神经网络架构,旨在根据输入数据高效地在不同计算路径之间切换。该架构能够动态调整计算流程,适用于处理多种类型的输入数据,并且具有可扩展性,能够应对大规模数据集。TSNet与TensorFlow无缝集成,支持多任务学习场景,为复杂的机器学习项目提供了灵活的解决方案。
RWKV-LM是一种基于RNN的新架构,具有较低的计算复杂度(线性时间而非像Transformer那样的二次方时间)和恒定空间占用(无需KV缓存)。相比Transformer,它在上下文长度增加时内存使用呈线性增长,且计算需求更低。