LLM代碼準(zhǔn)確率平均降低15% _準(zhǔn)確率

GPT-4、ChatGPT、CODEGEN、VICUNA、SANTACODER、INCODER、GPT-J、GPT-NEO、PolyCoder、StableLM-α 。
【LLM代碼準(zhǔn)確率平均降低15%】從表格中來看，經(jīng)過嚴(yán)格測(cè)試后，這群AI的生成準(zhǔn)確率都有所下落：

文章插圖
這里會(huì)通過一種名叫pass@k的方法評(píng)估準(zhǔn)確率，其中k是允許大模型給問題生成的程序數(shù)量，n是用于測(cè)試的輸入數(shù)量，c是正確的輸入數(shù)量：
根據(jù)新的這套評(píng)估標(biāo)準(zhǔn)，大模型們的準(zhǔn)確率平均下落了15%，其中比較廣泛研究的CODEGEN-16B更是下落了超過18% 。
至于ChatGPT和GPT-4生成代碼的性能，也下落了最少13% 。
不過，也有網(wǎng)友表示，大模型生成的代碼效果沒那么好，已經(jīng)是“盡人皆知的事實(shí)”了，需要研究的是“為何大模型寫的代碼不能用” 。
關(guān)于本次LLM代碼準(zhǔn)確率平均降低15%的問題分享到這里就結(jié)束了，如果解決了您的問題，我們非常高興。

继夫的玩弄H辣文的小说|女人与拘性猛交视频|精品欧美高清不卡高清|一起做亏亏的事情的视频|啦啦啦在线视频观看|望月直播下载ios版本|国产日韩欧美一区二区三区

LLM代碼準(zhǔn)確率平均降低15%