如何对SAP Leonardo上的机器学习模型进行重新训练-i042416-ChinaUnix博客

测试

首页　| 　博文目录　| 　关于我

i042416

博客访问： 1519272
博文数量： 931
博客积分： 10
博客等级：民兵
技术积分： 10198
用户组：普通用户
注册时间： 2011-07-08 12:28

个人简介

测试

文章分类

全部博文（931）

Kubernetes（26）
微信（12）
Web（11）
数据库（11）
JavaScript（48）
Linux（39）
Chrome（13）
SAP（769）

Hybris（40）

Java（56）

UI5（56）

C4C（64）

S/4（33）

CRM（106）

ABAP（185）

云（125）
未分配的博文（2）

文章存档

2020年（134）

2019年（792）

2018年（5）

我的朋友

岸边的莎

相关博文

如何对SAP Leonardo上的机器学习模型进行重新训练

分类：服务器与存储

2019-07-24 21:40:30

Jerry之前的两篇文章介绍了如何通过Restful API的方式，消费SAP Leonardo上预先训练好的机器学习模型：

当时Jerry提到，Product Image Classification API只支持29种产品类别：

如果我们开发应用时需要支持额外的产品类别，就需要自行提供该产品类别的图片来重新训练模型。

下面介绍SAP Leonardo上机器学习模型的重新训练步骤。

假设我们期望重新训练之后，Product Image Classfication这个模型能够识别出不同种类的花，那么我们首先得搞到大量花的图片。Tensorflow的官网上，已经体贴地给想做模型训练的学习者们，提供了一个做练习用的压缩包，里面包含了大量各式花的图片。

http://download.tensorflow.org/example_images/flower_photos.tgz

SAP Leonardo接受的能用于重新训练模型的数据集，必须符合下图所示的层级结构，即training, validation和test三个文件夹下面，分别包含以产品类别命名的子文件夹，且数据规模之比为8:1:1.

有了用于训练的数据后，下一步就是把这些数据上传到SAP Leonardo的模型在线存储平台上。

Jerry的前一篇文章部署在SAP Cloud Platform CloudFoundry环境的应用如何消费曾经介绍了如何在SAP云平台上创建Leonardo机器学习的服务实例，这个实例的service key里包含了一个IMAGE_RETRAIN_API_URL，可以用来获取在线存储的url：

向这个url发送一个HTTP get请求，得到在线存储的url：

把这个url粘贴到浏览器里，输入postman里返回的accessKey和secretKey登录，就能以web的方式访问这个在线存储了：

下一步是把本地的训练文件上传到这个部署在AWS上的在线存储上去。

首先用命令行mc config host定义一个名为sapjerrys3的远程站点，将上一步从postman获得的AWS在线存储url，accessKey和secret绑定到这个站点上：

然后使用命令行上传文件：

mc.exe cp -r C:\Code\MachineLearningStudy\flowersjerry sapjerrys3\data

大概十几分钟后，文件上传完毕：

此时可以从浏览器里看到AWS在线存储上传完毕的训练文件。

现在可以提交一个后台作业了，让Leonardo去处理这些上传好的文件，ABAP顾问们可以把这个动作理解成在Netweaver事务码SM36里定义一个后台作业并提交。发送一个HTTP post请求，除了下图jobName, dataset和modelName需要自己维护外，其他字段都使用SAP官网上定义的默认值。