DIRFA是由新加坡南洋理工大学研究者提出的一种创新AI模型,旨在从音频和单张图片生成逼真的说话人脸动画视频。其核心是通过基于变换器的概率映射网络,将音频信号自回归地转换为人脸动画序列,表征音频条件下的人脸动画分布。该模型无需预训练特定人物模型,生成速度快,资源占用少,能够生成逼真的唇部动作、面部表情和头部姿势。
商汤日日新(SenseNova)是商汤科技推出的大型人工智能模型体系,通过API接口支持多种智能应用,如自然语言处理、图片生成和自动化数据标注等。它特别适合企业客户,用于提升效率和创新,尤其在金融、医疗和营销等领域有广泛应用。