由简入繁探究机器视觉中的数据增强(上)

2022-05-09
本文探讨图像数据增强的两大主流方法各自的优劣势,针对目前图像数据增强面临的挑战及未来思考可研究的技术方向。

Kubric:高效地合成视觉数据集

2022-05-02
随着机器学习的发展,数据集的重要性越来越凸显。然而收集大量带标注的图像或者视频数据成本高昂。而使用合成的数据集则具有成本更低,且由于收集方便,标注信息准确,高度可控,使得其成为一种训练大规模深度学习模型的有效手段。

推荐场景训练加速:大规模混合分布式系统

2022-04-25
推荐场景是互联网服务领域最重要的场景之一,如何加速推荐模型的精度和速度是业界的难点,本文介绍了目前大规模混合分布式系统在加速推荐模型中的应用。

比大更大:Pathways上实现的大语言模型PaLM

2022-04-18
Google最近推出了AI架构Pathways以及基于Pathways训练的第一个大模型PaLM,该模型含有5400亿参数,训练结果在新基线BIG-bench上达到人类平均水平。本文深入剖析PaLM模型,探讨新型AI框架下的大模型训练。

应对大规模训练中的通信挑战:压缩及调度

2022-04-11
随着各领域数据的不断积累和规范化,越来越多的研究者提出或使用大模型,如何更好地应对分布式训练系统的通信问题已成为研究热点。本文从减少通信数据量以及调度通信过程和计算过程两个方面介绍应对通信问题的方法。

卷上加“卷”:特殊卷积的实现

2022-04-04
卷积是现代机器学习算法中最常用的算子,是许多主流AI模型的基础构件。为了更好的适用于不同场景,常规卷积也发展出了各类变形。本文讨论了一些面向特定应用的特殊卷积的实现,分析了各自特点。

用于推荐系统的近存处理器设计

2022-03-28
在最新的ISSCC2022会议上,阿里巴巴和紫光国芯发表了一个用于推荐系统的近存处理器设计,和传统的片外存储系统相比,其拥有x200倍的能效优势,同时,和最好的近存加速器相比,有x2倍的能效优势。本文将对其进行分析和总结。

万物皆可嵌入--embedding在GPU中的实现

2022-03-21
Embedding是广告推荐模型中重要的一项技术实现,衔接了稀疏输入和深度学习,本文将介绍embedding的相关知识及在GPU中的实现。

比你更懂你- 神经网络与推荐系统的深度结合

2022-03-14
推荐系统的主要任务是推荐用户感兴趣的内容,通过揣摩人心来预测用户未来的行为。一个好的推荐系统所能带来的价值是无比巨大的。本文将介绍近期深度学习在推荐系统领域的发展和它们的主要原理,其中特征交叉是所有推荐系统能否成功预测用户行为的一大关键。

“Hello, world!”,说出口没那么容易

2022-03-07
从我们能够记录声音开始,到如今计算机产生的语音已经无处不在,这背后有哪些技术的演进?AI又起到了怎样的作用?我们将从声音的数字化处理和与之对应的语音合成中的关键部件之一——声码器开始,逐步领略数字语音合成背后的奥妙。

联系我们

这是描述信息

招贤纳士

公众号二维码
这是描述信息

 版权所有   ©   上海壁仞科技有限公司   |    沪ICP备19047354号