EVA: Exploring the Limits of Masked Visual Representation Learning at Scale

这是一张学术论文的截图,标题为"EVA: Exploring the Limits of Masked Visual Representation Learning at Scale"。页面包含论文标题、作者列表及其所属机构、代码和模型的GitHub链接、摘要部分,以及一张标为"Figure 1"的示意图。示意图展示了EVA模型的工作流程,包括通过扩大MIM预训练(使用3000万图像数据和150个epochs)从CLIP到EVA(10亿参数)的过程,以及EVA在下游任务的迁移应用,如图像分类、视频动作分类、目标检测等。

文本内容

We launch EVA, a vision-centric foundation model to Explore the limits of Visual representation at scale using only publicly accessible data. EVA is a vanilla ViT pre-trained to reconstruct the masked out image-text aligned vision features conditioned on visible image patches. Via this pretext task, we can efficiently scale up EVA to one billion parameters, and sets new records on a broad range of representative vision downstream tasks, such as image recognition, video action recognition, object detection, instance segmentation and semantic segmentation without heavy supervised training. Moreover, we observe quantitative changes in scaling EVA result in qualitative changes in transfer learning performance that are not present in other models. For instance, EVA takes a great leap in the challenging large vocabulary instance segmentation task: our model achieves...

整体描述

这是一张学术论文的截图,标题为"EVA: Exploring the Limits of Masked Visual Representation Learning at Scale"。页面包含论文标题、作者列表及其所属机构、代码和模型的GitHub链接、摘要部分,以及一张标为"Figure 1"的示意图。示意图展示了EVA模型的工作流程,包括通过扩大MIM预训练(使用3000万图像数据和150个epochs)从CLIP到EVA(10亿参数)的过程,以及EVA在下游任务的迁移应用,如图像分类、视频动作分类、目标检测等。

来源说明

图片内容来自一篇关于计算机视觉和机器学习的学术论文。论文作者来自北京人工智能研究院、华中科技大学、浙江大学和北京理工大学等机构。页面中提供了代码和模型的GitHub链接:https://github.com/baaivision/EVA。这类学术论文通常会在学术会议上发表或在 arXiv 等预印本平台上发布,随后可能会被收录到相关学术期刊中。

相似的梗图

《EVA-02:为新世纪福音战士打造的视觉表征》论文标题页

这是一篇人工智能领域研究论文的标题页,标题将视觉表征模...

物质女权主义者巴拉德的内在互动论学术阐释

这是一段学术研究文本,介绍了一项以人类学家爱布拉姆的语...

DeepSeek-R1终端对话:详解BL轻小说《千恋万花》

这是一张Mac OS终端的交互截图,用户通过Ollam...

终身学习系统学术论文MyGO的arXiv页面截图

这是一张arXiv学术预印本平台的网页截图,展示了一篇...

中山大学王为教授个人学术主页

这是中山大学高能物理领域王为教授的个人学术主页截图,页...

满屏Mathematica计算窗口,高能物理科研人的日常

这是一张电脑屏幕截图,画面中密集排列了16个Wolfr...

从游戏视角看当代劳动解放——以《原神》为例

这是一篇由武汉大学哲学学院马克思主义哲学专业硕士研究生...

‘先人后己’‘为人民服务’对重积分学习的帮助

这是一篇发表在《教育教学论坛》2020年第31期的教学...

V2EX网友分析光猫固件,发现隐私收集插件GXBmonitor和任子行RZX

这是V2EX论坛「宽带症候群」板块的技术分析帖子,楼主...

微波炉烘干宠物引发诉讼,厂商修改说明书的趣味案例

这是一则以纯文字呈现的趣味法律案例段子,内容讲述了上世...

从《西游记》看中国古代微积分思想

这是一张学术论文的截图,标题为《从〈西游记〉看中国古代...

Hopf代数图形化等价推导步骤

这是一组Hopf代数的图形化演算推导图,通过逐步变换弦...

梗图网

梗图网

打开手机 App,找梗更快

下载