DeepSeek r1是一個(gè)極不安全的 AI 模型,而開(kāi)源讓它失去掌控
然而,我對(duì)大模型安全有過(guò)一些研究,且在這方面做過(guò)一些工作。 然而,即使是工作做得比較好,經(jīng)過(guò)了數(shù)月的紅隊(duì)對(duì)抗,內(nèi)測(cè),與問(wèn)題發(fā)現(xiàn)+修復(fù)才上線的大模型,也不免會(huì)被拿來(lái)做成了壞事。 或者說(shuō),實(shí)際上,互聯(lián)網(wǎng)上已經(jīng)有….......