Ai平臺(tái)模型
Chatbot Arena
Chatbot Arena是一個(gè)大型語(yǔ)言模型 (LLM) 的基準(zhǔn)平臺(tái),以眾包方式進(jìn)行匿名隨機(jī)對(duì)戰(zhàn),該項(xiàng)目方LMSYS Org是由加州大學(xué)伯克利分校、加州大學(xué)圣地亞哥分校和卡內(nèi)基梅隆大學(xué)合作創(chuàng)立的研究組織。
標(biāo)簽:Ai平臺(tái)模型Chatbot Arena是一個(gè)大型語(yǔ)言模型 (LLM) 的基準(zhǔn)平臺(tái),以眾包方式進(jìn)行匿名隨機(jī)對(duì)戰(zhàn),該項(xiàng)目方LMSYS Org是由加州大學(xué)伯克利分校、加州大學(xué)圣地亞哥分校和卡內(nèi)基梅隆大學(xué)合作創(chuàng)立的研究組織。
通過(guò)demo體驗(yàn)地址進(jìn)入對(duì)戰(zhàn)平臺(tái),輸入自己感興趣的問(wèn)題,提交問(wèn)題后,匿名模型會(huì)兩兩對(duì)戰(zhàn),分別生成相關(guān)答案,需要用戶對(duì)答案做出評(píng)判,從4個(gè)評(píng)判選項(xiàng)中選擇一個(gè):模型A更好、模型B更好、平手、都很差。支持多輪對(duì)話。最終使用Elo評(píng)分系統(tǒng)對(duì)大模型的能力進(jìn)行綜合評(píng)估。(可以自己指定模型看效果,但不計(jì)入最終排名情況)。