核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
咦这事和我之前参加过的讨论有关,我应该可以回答至少一部分原因...
0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务...
开始讨论之前,你得知道数字人民币是什么? 其实就是 失去实体...
今年36岁了,现任某区***办主任,平时应该还算成熟稳重。 ...
粤IP*******|网站地图粤IP*******|网站地图 地址: 备案号: