全球速看:最大CLIP!LAION发布CLIP的扩增定律
2022-12-29 10:40:05


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

热门推荐

文章排行

  1. 2022-12-29全球速看:最大CLIP!LAION发布CLIP的扩增定律
  2. 2022-12-28金蝶荣获2022 年度中国互联网数字化变革TOP雇主奖_即时看
  3. 2022-12-28股价大回调全球亿万富豪身价缩水逾2万亿美元 亚太地区成财富保值“香饽饽”
  4. 2022-12-28投资|山西投资公司49%股权及相关债权转让21BJ-1255
  5. 2022-12-28【环球报资讯】方正证券:积极看好餐饮供应端的底部反转,关注三条主线
  6. 2022-12-27当前消息!申通快递:拟4500万元~5500万元回购股份
  7. 2022-12-27世界快资讯丨百里荒滑雪场游玩攻略(附场次时间)
  8. 2022-12-27足额支付!河北石家庄正定新区大元集团工地所拖欠农民工工资已结清|当前快讯
  9. 2022-12-27当前时讯:多家企业接连发布量产消息 钠电池发展步入产业化前夕
  10. 2022-12-26北京中日友好医院儿科急诊丨医护同心 为了孩子的深夜值守
  11. 2022-12-26焦点要闻:海水稻缘何在离海最远的新疆获得高产?
  12. 2022-12-26动力电池行业2022年强势崛起 用产业链和规模优势打造“护城河”-播资讯
  13. 2022-12-25神反转!大S自曝“雇佣”具俊晔假结婚,震惊娱乐圈:果然,我们都被她骗了_今日快看
  14. 2022-12-24环球动态:真是烦死这些垃圾网站了!
  15. 2022-12-24京东金条逾期15天征信有影响吗
  16. 2022-12-23赛伍技术: 赛伍技术董监高集中竞价减持股份计划公告_全球观点
  17. 2022-12-23西藏粮食产量连续8年稳定在100万吨以上-微头条
  18. 2022-12-23我阳了...
  19. 2022-12-22世界今日报丨北青:津门虎弃赛因无法凑足所需要的足量球员,俱乐部需承担赔偿
  20. 2022-12-22【环球新要闻】新华全媒+|创意漫画:总有一些温暖,伴你度过整个冬天