您现在的位置是:网站首页> AI人工智能

AI编程资讯

摘要

AI编程资讯


又一家国产厂商的大模型API官宣免费!还能免费微调





又一家国产厂商的大模型API官宣免费!还能免费微调

点击查看原文

智谱AI大模型开放平台,点击进入平台

当然了,对于在深耕AI应用落地的开发者和企业来说,免费的通用大模型虽好,但离了微调环节依然用不起来


毕竟模型的能力跟它训练阶段见过的数据依然是强关联的。如果模型没见过企业内部知识库、垂直场景的数据,那一定还是做不到实际可落地的效果的。


在一些强依赖模型微调的场景:


比如最简单的分类,在看似相同的分类任务上,不同的业务场景常常有不同的标准,必须通过微调来让模型学习个性化的分类标准。


再比如结构化输出,程序员都深知结构化输出有多香。某一个业务场景下就是需要某种格式的表格,比如银行里填表和工业检测里填表,就完全不一样。这里不仅包括解码阶段的语法规范,还常常涉及一些语义甚至业务逻辑层面的知识训练。要做到高可用性,微调是绕不开的。


再者还有现在企业都非常看重的行业知识、企业知识库,都是在互联网上不存在的数据,像销售话术、医疗诊断、端内数据,如果要在这些场景落地,模型要先微调学习相关的行业知识,才能更好的回答用户的问题。


工具API的调用同样是在互联网上不存在的知识,因此通用大模型往往在工具调用问题上表现的“很傻”,但其实通过少量的样本去微调一把,这种工具API调用的问题也能得到极大的改善。


从这个视角看,也不难理解为什么笔者说能傻瓜式免费微调是更大的爽点了吧!


毕竟如果你要自己微调模型,花钱买卡买机器还是小事儿,关键是软硬件环境的维护、专业人员的配置以及大模型备案等一系列的问题,都会让你觉得“这波创业简直是地狱级的难度”。



微调

1.进入智谱AI开放平台的模型微调页:

https://bigmodel.cn/console/modelft/finetuning

1.png

2.创建数据集

这里笔者把公众号近期的上百篇文章的后台数据给扒拉了下来,做成了json格式的数据集。

然后将数据集丢给智谱:

2.png

3.创建微调任务

配置好后,注意侧边栏的消费金额!

3.png

我们点击确认创建。就能在任务管理页看到任务进度啦!

由于数据量不多,加上我们选了LoRA微调,分钟级的就训练完了!














Top