首页 > 营销学院 > AI智能

Paddle.Hub 初探：快速基于预训练模型实现猫的 12 分类

本文介绍Paddle 2.1.0版本新功能Paddle.Hub API，可快速加载外部扩展模型。以用PaddleClas预训练模型实现猫的12分类为例，演示同步代码、加载模型列表与模型、预处理数据、训练模型及预测的过程，还提及该版本存在的一些问题。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

引入

Paddle 最近更新到了 2.1.0 版本了
其中加入了一个新功能，即 Paddle.Hub API
通过这个新功能，可以快速加载外部的拓展模型，比如加载 PaddleClas 中丰富的分类预训练模型
今天就通过这个项目来体验一下这个功能，使用 PaddleClas 中的预训练模型实现极简版的猫的 12 分类

Paddle.Hub

官方文档：直达链接
API 简介：

API 名称 API 功能

list 查看 Repo 支持的模型列表

help 查看指定模型的文档

load 加载指定模型

API 名称	API 功能
list	查看 Repo 支持的模型列表
help	查看指定模型的文档
load	加载指定模型

使用介绍：
- 简单讲这就是个可以快速调用外部扩展模型的 API
- 只需要将模型的代码托管在 GitHub 或 Gitee 平台上或者存储在本地
- 就可以通过这个 API 进行调用，方便开发者分享模型代码供其他人快速使用

快速使用

因为 GitHub 访问速度比较慢的缘故
暂时使用本地加载的方式来演示，所以需要预先同步 repo 的代码至本地后进行使用

In [ ]

# 同步 PaddleClas 代码!git clone https://gitee.com/PaddlePaddle/PaddleClas -b develop --depth 1

In [ ]

import paddle# 加载 Repo 中的模型列表model_list = paddle.hub.list('PaddleClas', source='local', force_reload=False)print(model_list)# 查看模型帮助文档model_help = paddle.hub.help('PaddleClas', 'mobilenetv3_large_x1_25', source='local', force_reload=False)print(model_help)# 加载模型model = paddle.hub.load('PaddleClas', 'mobilenetv3_large_x1_25', source='local', force_reload=False)# 模型测试data = paddle.rand((1, 3, 224, 224))
out = model(data)print(out.shape) # [1, 1000]

['alexnet', 'densenet121', 'densenet161', 'densenet169', 'densenet201', 'densenet264', 'googlenet', 'inceptionv3', 'inceptionv4', 'mobilenetv1', 'mobilenetv1_x0_25', 'mobilenetv1_x0_5', 'mobilenetv1_x0_75', 'mobilenetv2_x0_25', 'mobilenetv2_x0_5', 'mobilenetv2_x0_75', 'mobilenetv2_x1_5', 'mobilenetv2_x2_0', 'mobilenetv3_large_x0_35', 'mobilenetv3_large_x0_5', 'mobilenetv3_large_x0_75', 'mobilenetv3_large_x1_0', 'mobilenetv3_large_x1_25', 'mobilenetv3_small_x0_35', 'mobilenetv3_small_x0_5', 'mobilenetv3_small_x0_75', 'mobilenetv3_small_x1_0', 'mobilenetv3_small_x1_25', 'resnet101', 'resnet152', 'resnet18', 'resnet34', 'resnet50', 'resnext101_32x4d', 'resnext101_64x4d', 'resnext152_32x4d', 'resnext152_64x4d', 'resnext50_32x4d', 'resnext50_64x4d', 'shufflenetv2_x0_25', 'squeezenet1_0', 'squeezenet1_1', 'vgg11', 'vgg13', 'vgg16', 'vgg19']

    MobileNetV3_large_x1_25
    Args:
        pretrained: bool=False. If `True` load pretrained parameters, `False` otherwise.
        kwargs: 
            class_dim: int=1000. Output dim of last fc layer.
    Returns:
        model: nn.Layer. Specific `MobileNetV3_large_x1_25` model depends on args.
    
[1, 1000]

已知问题

Paddle 2.1.0 GPU 版本暂时不太稳定，模型能够正常加载和前向计算，但是跑 PaddleHapi 的训练会直接崩溃重启（Issue 已提，Paddle 的 bug，待修复）
通过 Gitee 无法加载，会报错 File is not a zip file（Issue 已提，目前该功能已从文档移除）
GitHub 访问速度比较慢，不过这个没啥好办法
每次加载模型后，如果不重启 Notebook 内核就无法重新加载（Issue 已提，PaddleClas 的 bug，待修复）
PaddleClas 内的一些模型比如 MobileNet v3 系列，还无法在 PaddleHapi 中正常使用（提交的 pr 已合并）

猫的12分类

任务描述

利用训练的模型来预测数据所属的类别。

数据说明

本数据集包含12种类的猫的图片
整个数据将被分为训练集与测试集。
训练集：在训练集中，我们将提供高清彩色图片以及图片所属的分类
测试集：在测试数据集中，我们仅仅提供彩色图片

解压数据集

使用数据之前第一步就是对训练和测试集进行解压缩

In [ ]

!unzip -q -d /home/aistudio/data/data10954 /home/aistudio/data/data10954/cat_12_train.zip!unzip -q -d /home/aistudio/data/data10954 /home/aistudio/data/data10954/cat_12_test.zip

数据预处理

对于一个数据集，首先要了解数据的组成是什么：
- 解压完的数据集中包括两个图片文件夹以及一个数据列表文件，如下图所示
- 其中 cat_12_train 和 cat_12_test 分别存放所有训练和测试集的图片
- train_list.txt 则是以由一行行"图片标签"的数据组成的数据列表
  - 如：cat_12_train/8GOkTtqw7E6IHZx4olYnhzvXLCiRsUfM.jpg 0
  - 其中使用0-11分别对12个类别进行标注
  - 中间使用\t作为分隔符
对于一个数据集，为了更好的衡量模型的效果，不能只有训练集和测试集，所以一般需要从中训练集中分出一部分作为验证集使用
了解了上述的内容，就可以开始使用代码来对数据集进行预处理了

In [ ]

import osimport paddleimport random

total = []# 读取数据标签with open('/home/aistudio/data/data10954/train_list.txt', 'r', encoding='UTF-8') as f:    for line in f:        # 格式转换
        line = line[:-1].split('\t')
        total.append(' '.join(line)+'\n')# 打乱数据顺序random.shuffle(total)'''
切分数据集
95%的数据作为训练集
5%的数据作为验证集
'''split_num = int(len(total)*0.95) 

# 写入训练数据列表with open('/home/aistudio/data/data10954/train.txt', 'w', encoding='UTF-8') as f:    for line in total[:split_num]:
        f.write(line)# 写入验证数据列表with open('/home/aistudio/data/data10954/dev.txt', 'w', encoding='UTF-8') as f:    for line in total[split_num:]:
        f.write(line)# 写入测试数据列表with open('/home/aistudio/data/data10954/test.txt', 'w', encoding='UTF-8') as f:    for line in ['cat_12_test/%s\n' % img for img in os.listdir('/home/aistudio/data/data10954/cat_12_test')]:
        f.write(line)

模型训练

模型训练的一般步骤如下：
1. 搭建模型
2. 构建数据集和数据读取器
3. 配置各种参数
4. 构建训练任务
5. 开始训练模型
注：启动训练前请重启 Notebook 内核
注：目前只有 CPU 环境才可以正常运行如下代码

In [ ]

import osimport paddleimport randomimport paddle.nn as nnimport paddle.vision.transforms as T# 构建数据集class CatDataset(paddle.io.Dataset):
    def __init__(self, transforms, dataset_path='/home/aistudio/data/data10954', mode='train'):
        self.mode = mode
        self.dataset_path = dataset_path
        self.transforms = transforms
        self.num_classes = 5

        if self.mode == 'train':
            self.file = 'train.txt'
        elif self.mode == 'dev':
            self.file = 'dev.txt'
        else:
            self.file = 'test.txt'
        self.file = os.path.join(dataset_path, self.file)        with open(self.file, 'r') as file:
            self.data = file.read()[:-1].split('\n')    def __getitem__(self, idx):
        if self.mode in ['train', 'dev']:
            img_path, grt = self.data[idx].split(' ')
            img_path = os.path.join(self.dataset_path, img_path)
            im = paddle.vision.image_load(img_path)
            im = im.convert("RGB")
            im = self.transforms(im)            return im, int(grt)        else:
            img_path = self.data[idx]
            img_path = os.path.join(self.dataset_path, img_path)
            im = paddle.vision.image_load(img_path)
            im = im.convert("RGB")
            im = self.transforms(im)            return im    def __len__(self):
        return len(self.data)# 加载数据集train_transforms = T.Compose([
    T.Resize(256),
    T.RandomCrop(224),
    T.RandomHorizontalFlip(),
    T.RandomVerticalFlip(),
    T.ToTensor(),
    T.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
])

test_transforms = T.Compose([
    T.Resize(256),
    T.CenterCrop(224),
    T.ToTensor(),
    T.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
])

train_dataset = CatDataset(train_transforms, mode='train')
dev_dataset = CatDataset(test_transforms, mode='dev')
test_dataset = CatDataset(test_transforms, mode='test')# 加载模型model = paddle.hub.load('PaddleClas', 'mobilenetv3_large_x0_5', source='local', force_reload=False, class_dim=12, pretrained=True)
model = paddle.Model(model)# 定义优化器opt = paddle.optimizer.Adam(learning_rate=0.001, parameters=model.parameters())# 配置模型model.prepare(optimizer=opt, loss=nn.CrossEntropyLoss(), metrics=paddle.metric.Accuracy(topk=(1, 5)))

model.fit(
    train_data=train_dataset, 
    eval_data=dev_dataset, 
    batch_size=32, 
    epochs=2, 
    eval_freq=1, 
    log_freq=1, 
    save_dir='save_models', 
    save_freq=1, 
    verbose=1, 
    drop_last=False, 
    shuffle=True,
    num_workers=0)

2025-05-18 12:43:59 INFO: unique_endpoints {''}
2025-05-18 12:43:59 INFO: Downloading MobileNetV3_large_x0_5_pretrained.pdparams from https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/MobileNetV3_large_x0_5_pretrained.pdparams
100%|██████████| 15875/15875 [00:00<00:00, 18983.36it/s]
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddle/fluid/dygraph/layers.py:1297: UserWarning: Skip loading for out.weight. out.weight receives a shape [1280, 1000], but the expected shape is [1280, 12].
  warnings.warn(("Skip loading for {}. ".format(key) + str(err)))
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddle/fluid/dygraph/layers.py:1297: UserWarning: Skip loading for out.bias. out.bias receives a shape [1000], but the expected shape is [12].
  warnings.warn(("Skip loading for {}. ".format(key) + str(err)))

The loss value printed in the log is the current step, and the metric is the average value of previous steps.
Epoch 1/2

/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddle/fluid/layers/utils.py:77: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working
  return (isinstance(seq, collections.Sequence) and

step 65/65 [==============================] - loss: 2.7684 - acc_top1: 0.6628 - acc_top5: 0.9464 - 3s/step        
save checkpoint at /home/aistudio/save_models/0
Eval begin...
step 4/4 [==============================] - loss: 0.8948 - acc_top1: 0.7685 - acc_top5: 0.9907 - 732ms/step         
Eval samples: 108
Epoch 2/2
step 65/65 [==============================] - loss: 0.5738 - acc_top1: 0.8397 - acc_top5: 0.9942 - 3s/step        
save checkpoint at /home/aistudio/save_models/1
Eval begin...
step 4/4 [==============================] - loss: 0.5484 - acc_top1: 0.8611 - acc_top5: 0.9907 - 779ms/step         
Eval samples: 108
save checkpoint at /home/aistudio/save_models/final

模型预测

模型预测一般步骤：
1. 读取数据
2. 模型预测
3. 预测结果后处理
4. 输出最终结果

In [ ]

import numpy as np# 模型预测results = model.predict(test_dataset, batch_size=32, num_workers=0, stack_outputs=True, callbacks=None)# 对预测结果进行后处理total = []for img, result in zip(test_dataset.data, np.argmax(results[0], 1)):
    total.append('%s,%s\n' % (img.split('/')[-1], result))# 生成结果文件with open('result.csv','w') as f:    for line in total:
        f.write(line)

Predict begin...
step 8/8 [==============================] - 805ms/step        
Predict samples: 240

# 重启 # 切分 # 是个 # 测试数据 # 后处理 # 访问速度 # 比较慢 # 就可以 # 文档 # python # 加载 # gitee # issue # bug # github # red # ai # git

相关栏目：【 Google疑问12 】【 Facebook疑问10 】【网络优化91478 】【技术知识72672 】【云计算0 】【 GEO优化84317 】【优选文章0 】【营销推广36048 】【网络运营41350 】【案例网站102563 】【 AI智能45237 】

2025-07-24

2025年中国汽车出口总量达832万辆纯电动占比28% OpenJudge— 阿里云和通义开源的AI应用自动化评测框架云米科技CEO给员工奖励小米YU7：期待能奖励更多台 D4RT— 谷歌推出的动态4D重建与追踪模型 2025中国市场百万超跑销量榜出炉：保时捷911领跑 2025年泰国汽车市场品牌销量榜单揭晓：丰田第一！毕业季/求职季必备！AI生成头像的4种实用场景（证件照风/商务形象/创意简历）情侣头像不求人！用AI生成专属二人世界的5种创意风格（动漫CP/古风画卷/电影海报） AI生成头像能商用吗？版权风险全解析（哪些平台可商用？如何避免侵权？）不用下载！在线AI生成头像的5个网站（手机秒出图，支持微信头像尺寸）朋友圈换头像指南｜3步用AI制作专属头像：输入描述→选模型→一键生成（小白必看）从照片到艺术品：一键生成AI头像的4个步骤详解（上传参考图→优化指令→风格迁移）别只用二次元了！探索AI生成头像的8个小众艺术流派（像素风/水墨画/波普艺术） AI生成头像 vs 专业约稿：哪个性价比更高？深度评测5大平台后我有了答案 2026年AI生成头像免费玩！年度TOP8在线工具盘点（免登录/出图快/风格多）懒人必备！5个“一句话”就能出图的AI头像网站（支持白话文/自动美化/创意无限） AI生成头像的隐私安全吗？7个主流平台隐私政策深度解读（如何保护个人照片）不用PS！在线AI生成头像的6个神级网站（零基础/支持中文指令/即刻出图） 2026年设计师新宠！7款激发灵感的AI头像生成器（概念艺术/角色设计/情绪表达） AI朋友圈文案生成器，一键解决你的社交文案荒

了解您产品搜索量及市场趋势，制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求，1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

4008794355

87067657

13565296790

87067657@qq.com

服务/方案/案例/支持

产品服务

解决方案

营销案例

营销学院

关于我们

公司简介

报名培训

加入我们

4008794355

Paddle.Hub 初探：快速基于预训练模型实现猫的 12 分类

引入

Paddle.Hub

快速使用

已知问题

猫的12分类

任务描述

数据说明

解压数据集

数据预处理

模型训练

模型预测

了解您产品搜索量及市场趋势，制定营销计划

同行竞争及网站分析保障您的广告效果

提交您的需求，1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司

4008794355

服务/方案/案例/支持

关于我们

Notice