壁仞科技研究院前沿技术文章精选
发布时间:2022-07-04 07:00
预览
在过去半年时间里,多模态模型蓬勃发展,NeRF相关研究依然活跃,更强的算力、更先进的架构、更灵活的软硬协同设计、以及更高效的并行算法也让巨型模型不断突破纪录。本文精选壁仞科技研究院在一些关键领域的文章,希望能够和大家一起学习进步。
2022已经过半,在过去半年时间里,多模态模型蓬勃发展,Text-to-Image模型展现惊人效果,NeRF相关研究依然活跃,更强的算力、更先进的架构、更灵活的软硬协同设计、以及更高效的并行算法也让巨型模型不断突破纪录。
以下是壁仞科技研究院在一些关键领域的文章精选,希望能够和大家一起学习进步。
前沿算法
DALL·E 2和Imagen等优秀的文本-图像生成模型“创作”的图像效果惊人,这一能力的核心是扩散概率模型。我们去年第一次接触扩散概率模型时就认为这是一个很有潜力的研究方向,并对此做过详细的分析。
新兴的神经渲染技术给计算机图形学带来了新的机遇,受到了学界和工业界的广泛关注。在近几年的计算机视觉和图形学顶会上,我们都可以看到各种令人耳目一新的神经渲染应用。神经渲染是以深度学习为基础的新型图形渲染方法,是实现时下热点概念“元宇宙”的关键要素。同时神经渲染也是深度学习的前沿方向,催生了许多新的深度学习方法与计算结构。
推荐系统和语音模型已经得到了广泛应用,我们从算法和架构层面对这些模型的实现进行了详细的分析。
Meta AI开源了OPT-175B,分布式训练框架日益完善,GPU算力日渐增强,模型的规模不断被刷新。为更好地支持“巨型”模型训练,我们一方面关注如何提供更强的算力,另一方面思考如何更高效地利用现有系统。
随着GPU能力的提升,支撑深度学习的软硬件生态得到了快速发展。通过深度学习来解决科学计算问题成了一种趋势,其中用深度学习来求解微分方程的方法也逐渐兴起。尤其引人注意的是一种称为物理导引神经网络的方法,其为科学计算领域注入了新的活力。
• 从数据中获取动态信息:动态模式分解 (DMD) 与物理先验的结合
我们也会持续关注前沿技术的核心组件,整理新颖的方法和观点。
• 基于Object Query的机器视觉新思路: DETR及发展
先进架构
不管是我们已经比较熟悉的算法,还是新出现的算法,如何利用手中的工具去设计软硬件架构,高效地执行这些算法,是我们不断思考的问题,可以说是架构师的日常。当然,这个问题的答案也可能是一个重要决策,大的创新,甚至技术路线的改动。在壁仞研究院,我们会从设计空间的“扩展”和“压缩”这两个不同的方向出发来思考这个问题。
协同设计
自从AI芯片成为热门的研究课题,众多关于AI芯片架构探索的学术文章不断涌现,大家从不同的角度对AI芯片进行架构分析及性能优化。MLIR是谷歌团队推出的开源编译器框架,颇受瞩目,灵活的编译器架构提升了其在众多领域应用的潜力。通过自定义IR的衔接,可以在架构探索和MLIR之间架起一座桥梁,在编译的过程中,自动进行硬件架构的探索和软件的优化编译,甚至生成硬件的代码,实现软硬协同设计。
• 基于IREE HLO项目看MLIR编译器实现的过程及优势
• MLIR编译技术应对硬件设计挑战?——初探CIRCT项目
近期文章