ImageNet (数据集)论文 - 专知

会员服务 ·

ImageNet (数据集)

ImageNet (数据集)

ImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像URL被ImageNet手动注释，以指示图片中的对象;在至少一百万个图像中，还提供了边界框。ImageNet包含2万多个类别; [2]一个典型的类别，如“气球”或“草莓”，包含数百个图像。第三方图像URL的注释数据库可以直接从ImageNet免费获得;但是，实际的图像不属于ImageNet。自2010年以来，ImageNet项目每年举办一次软件比赛，即ImageNet大规模视觉识别挑战赛（ILSVRC），软件程序竞相正确分类检测物体和场景。 ImageNet挑战使用了一个“修剪”的1000个非重叠类的列表。2012年在解决ImageNet挑战方面取得了巨大的突破，被广泛认为是2010年的深度学习革命的开始。

VRM: Knowledge Distillation via Virtual Relation Matching

Arxiv

0+阅读 · 4月1日

How far can we go with ImageNet for Text-to-Image generation?

Arxiv

0+阅读 · 2月28日

Simplifying, Stabilizing and Scaling Continuous-Time Consistency Models

Arxiv

0+阅读 · 3月1日

Probabilistic Language-Image Pre-Training

Arxiv

0+阅读 · 3月12日

Cross-Domain Knowledge Transfer for Underwater Acoustic Classification Using Pre-trained Models

Arxiv

0+阅读 · 3月17日

Effective and Efficient Masked Image Generation Models

Arxiv

0+阅读 · 3月10日

FlexVAR: Flexible Visual Autoregressive Modeling without Residual Prediction

Arxiv

0+阅读 · 2月27日

Typographic Attacks in a Multi-Image Setting

Arxiv

0+阅读 · 2月12日

Diversify, Don't Fine-Tune: Scaling Up Visual Recognition Training with Synthetic Images

Arxiv

0+阅读 · 1月21日

Re-assessing ImageNet: How aligned is its single-label assumption with its multi-label nature?

Arxiv

0+阅读 · 2024年12月24日

Scaling 4D Representations

Arxiv

1+阅读 · 2024年12月19日

Comparing ImageNet Pre-training with Digital Pathology Foundation Models for Whole Slide Image-Based Survival Analysis

Arxiv

0+阅读 · 2024年12月6日

Probabilistic Language-Image Pre-Training

Arxiv

0+阅读 · 2024年12月6日

Semantically-Prompted Language Models Improve Visual Descriptions

Arxiv

0+阅读 · 2024年11月22日

HF-Diff: High-Frequency Perceptual Loss and Distribution Matching for One-Step Diffusion-Based Image Super-Resolution

Arxiv

0+阅读 · 2024年11月20日

参考链接

父主题

微信扫码咨询专知VIP会员