|
#人工智能 阿里云推出通義千問 Qwen2 系列模型,阿里完全開源,云開源通義千提供 0.5B~72B 之間 5 個(gè)版本,問Q文測(cè)網(wǎng)鎮(zhèn)江包夜學(xué)生妹(電話微信156-8194-*7106)一二線城市外圍模特伴游預(yù)約、空姐、模特、留學(xué)生、熟女、白領(lǐng)、老師、優(yōu)質(zhì)資源在各項(xiàng)評(píng)測(cè)中表現(xiàn)不俗。上下試中有興趣的表現(xiàn)不俗開發(fā)者現(xiàn)在就可以通過 GitHub 等平臺(tái)獲取最新模型。查看全文:https://ourl.co/104358 阿里云今天推出了通義千問人工智能模型的藍(lán)點(diǎn)重大升級(jí)版本:Qwen2,該模型提供 5 個(gè)不同的阿里尺寸、上下文長(zhǎng)度最高支持 128K tokens,云開源通義千并且在各項(xiàng)測(cè)試中表現(xiàn)不俗。問Q文測(cè)網(wǎng) Qwen2 的上下試中所有尺寸版本均已同步在 GitHub、HuggingFace 和 ModelScope 上開源,表現(xiàn)不俗有興趣的藍(lán)點(diǎn)開發(fā)者可以立即獲取模型進(jìn)行測(cè)試。
此次發(fā)布的阿里新版本亮點(diǎn)包括:
在 Qwen1.5 系列模型中只有 32B 和 110B 版使用 GQA,而在 Qwen2 中所有模型都使用 Qwen2,使用 GQA 后有助于提升推理能力和降低顯存的占用。 同時(shí)諸如 Qwen2-0.5B 和 1.5B 版可以在性能更低的設(shè)備上運(yùn)行,例如在智能手機(jī)本地運(yùn)行 Qwen2-0.5B 而不需要云端處理,這種也是未來的趨勢(shì),未來可能所有智能設(shè)備都會(huì)支持 AI,這就需要更小的模型為本地運(yùn)行提供支持。 模型評(píng)估顯示 Qwen2 能力超過 Llama3: 目前人工智能開源 / 開放社區(qū)中最重要的兩個(gè)貢獻(xiàn)者就是 Meta 和阿里云,Meta 主要就是 Llama 系列模型最新版本為 Llama3。 在開源 / 開放模型能力評(píng)測(cè)中,Qwen2-72B 版在各方面超過 Llama3-70B,也超過了 Mixtral-8x22B,所以現(xiàn)在壓力給到了 Meta,不知道 Meta 什么時(shí)候發(fā)布新版本。
阿里云 AI 團(tuán)隊(duì)表示: 大規(guī)模預(yù)訓(xùn)練后,我們對(duì)模型進(jìn)行精細(xì)的微調(diào),以提升其智能水平,讓其表現(xiàn)更接近人類。這個(gè)過程進(jìn)一步提升了代碼、數(shù)學(xué)、推理、指令遵循、多語言理解等能力。此外,模型學(xué)會(huì)對(duì)齊人類價(jià)值觀,它也隨之變得更加對(duì)人類有幫助、誠(chéng)實(shí)以及安全。我們的微調(diào)過程遵循的原則是使訓(xùn)練盡可能規(guī)模化的同時(shí)并且盡可能減少人工標(biāo)注。我們探索了如何采用多種自動(dòng)方法以獲取高質(zhì)量、可靠、有創(chuàng)造力的指令和偏好數(shù)據(jù),其中包括針對(duì)數(shù)學(xué)的拒絕采樣、針對(duì)代碼和指令遵循的代碼執(zhí)行反饋、針對(duì)創(chuàng)意寫作的回譯、針對(duì)角色扮演的 scalable oversight、等等。在訓(xùn)練方面,我們結(jié)合了有監(jiān)督微調(diào)、反饋模型訓(xùn)練以及在線 DPO 等方法。我們還采用了在線模型合并的方法減少對(duì)齊稅。這些做法都大幅提升了模型的基礎(chǔ)能力以及模型的智能水平。 限時(shí)活動(dòng)推薦:軟購618多款正版軟件2折購、QQ超會(huì)15月108元、B站大會(huì)員88元、騰訊視頻128元、愛奇藝138元。 |





