参与:魔王、杜伟、小舟
图像领域的 GPT 模型终于来了! OpenAI 推出了用于图像分类的模型 iGPT,该模型生成的特征在多个分类数据集上实现了当前 SOTA 性能,并且实现了良好的图像补全效果。
论文地址:https://cdn.openai.com/papers/Generative_Pretraining_from_Pixels_V2.pdf
GitHub 地址:https://github.com/openai/image-gpt
项目主页:https://openai.com/blog/image-gpt/
方法 1:linear probe,即使用训练好的模型从下游数据集图像中提取特征,然后将 logistic 回归与标签进行拟合;
方法 2:微调,基于下游数据集微调整个模型。
第一阶段:每个位置从周围语境中收集信息,以构建语境化图像特征;
第二阶段:使用语境化特征解决下一像素预测任务。