近日消息,據外媒報道,隨著GPT系列大模型的不斷升級,OpenAI所訓練的ChatGPT也在擁有更強的能力,但這也帶來了一些挑戰,它所生成的內容中存在的錯誤也越來越隱蔽,逐漸到了AI訓練師難以發現的程度。

而為了應對這一挑戰,OpenAI也想出了新招,他們基于GPT-4模型,訓練了一個用于發現ChatGPT輸出代碼錯誤的模型。
OpenAI當地時間周四,已在官網宣布了這一消息,他們訓練的模型名為CriticGPT,從名稱來看就是用于發現不足,以便讓相關的應用變得更好。
從OpenAI在官網公布的消息來看,CriticGPT在他們的應用中有不錯的效果,他們發現在新模型的輔助下,使用者在檢查ChatGPT的輸出代碼時,比沒有CriticGPT的協助要好60%。
在官網上,OpenAI提到,他們也是通過RLHF (從人類反饋中強化學習,Reinforcement Learning from Human Feedback)來訓練CriticGPT,與訓練ChatGPT類似。但與訓練ChatGPT不同的是,他們在訓練CriticGPT時,看了大量包含錯誤的輸入。
雖然CriticGPT能幫助發現更多的問題,但也存在不足,還有改進的空間。OpenAI在官網上就提到,并不是所有的發現都是準確的,用于訓練的ChatGPT生成內容也普遍很短,還需要開發新的方式,以協助訓練師理解更長和更復雜的任務。
此外,OpenAI在官網上也提到,在研發CriticGPT的過程中,他們發現將RLHF應用于GPT-4時,能幫助生成更好的RLHF數據,他們計劃擴大這一項工作的規模,并付諸實踐。
原創文章,作者:科技探索者,如若轉載,請注明出處:http://www.bdzhitong.com/article/664246.html