<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 15B模型單項能力錘得過(guò)GPT3.5，開(kāi)源SQLCoder已上崗

15B模型單項能力錘得過(guò)GPT3.5，開(kāi)源SQLCoder已上崗

發(fā)布人：機器之心時(shí)間：2023-08-23 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

Coder 家族再添新成員，并且已經(jīng)開(kāi)源！

你知道的有關(guān)于代碼編輯的大模型工具有哪些呢？

推特用戶(hù) @lvwerra 制作了下面這張圖，為大家梳理代碼大家庭的大部分成員。

就在他發(fā)布了這張圖后的兩周內，又有三位新成員加入了這個(gè)大家庭，它們分別是 DeciCoder、OctoCoder 以及最新的成員 SQLCoder。

其中，這個(gè)最新成員 SQLCoder 不僅性能出色，并且已經(jīng)開(kāi)源了！

SQLCoder

作為一個(gè) SOTA 大型語(yǔ)言模型， SQLCoder 將自然語(yǔ)言問(wèn)題轉換為 SQL 查詢(xún)。在開(kāi)發(fā)者的開(kāi)源評估框架 SQLEval 中，SQLCoder 的性能明顯優(yōu)于所有主要的開(kāi)源模型，并且優(yōu)于 OpenAI 的 GPT-3.5。

SQLCoder 是一個(gè) 15B 參數的 LLM，也是 StarCoder 的微調實(shí)現。SQLCoder 在手工制作的 SQL 查詢(xún)上進(jìn)行了微調，難度依次遞增。在針對單個(gè)數據庫模式進(jìn)行微調時(shí)，它的性能可與 GPT-4 媲美，甚至更勝一籌。

項目地址：https://github.com/defog-ai/sqlcoder
演示地址：https://defog.ai/sqlcoder-demo/
模型權重：https://huggingface.co/defog/sqlcoder

在過(guò)去的三個(gè)月里，SQLCoder 已經(jīng)部署在了醫療、金融等企業(yè)中。這些企業(yè)通常擁有敏感數據，他們不希望這些數據從自有服務(wù)器中流出，因此利用自托管模型是他們使用 LLM 的唯一途徑。

方法

創(chuàng )建數據集

作者創(chuàng )建了一個(gè)手工編輯的 prompt - 補全對數據集，重點(diǎn)是文本到 SQL 任務(wù)。該數據集由 10 個(gè)不同的模式創(chuàng )建，問(wèn)題難度各不相同。此外，他們還從 7 個(gè)新模式中創(chuàng )建了一個(gè)包含 175 個(gè)問(wèn)題的評估數據集。

他們確保在訓練數據集和評估數據集中都選擇了有 4-20 張表的復雜模式，這是因為只有 1 或 2 個(gè)表的模式由于關(guān)系有限，往往只能進(jìn)行簡(jiǎn)單直接的查詢(xún)。

問(wèn)題分類(lèi)

數據集創(chuàng )建后，作者將數據集中的每個(gè)問(wèn)題分為易、中、難、特難四類(lèi)。這種分類(lèi)通過(guò)調整 Spider 數據集使用的標準來(lái)完成，以衡量 SQL 難度。最后，他們將數據集分為兩個(gè)不同的子部分，分別是簡(jiǎn)單問(wèn)題和中等問(wèn)題，以及難題和超難題。

微調

作者分以下兩個(gè)階段對模型進(jìn)行了微調。

首先，僅在簡(jiǎn)單和中等難度的問(wèn)題上對 StarCoder 基礎模型進(jìn)行了微調。

其次，在難題和超難題上對得到的模型（代碼為 defog-easy）進(jìn)行微調，從而得到 SQLcoder。

評估

作者在自己創(chuàng )建的自定義數據集上對模型進(jìn)行了評估。評估 SQL 查詢(xún)的正確性非常困難，他們曾考慮使用 GPT-4 作為評估標準，但遇到了很多問(wèn)題。過(guò)程中他們還意識到，兩個(gè)不同的 SQL 查詢(xún)可能都正確。

對于「誰(shuí)是最近 10 個(gè)來(lái)自多倫多的用戶(hù) 」這個(gè)問(wèn)題，以下兩種查詢(xún)方式都是正確的。

鑒于此，作者建立了一個(gè)自定義框架來(lái)評估查詢(xún)的正確性。他們不僅開(kāi)源了模型權重，同樣開(kāi)源了評估框架與評估數據集。

發(fā)布數據集的目的是豐富可用基準，幫助研究人員和工程師更好地了解文本到 SQL 生成模型的性能，特別是該模型對返回結果中的無(wú)害變化（如列重命名、附加列和重新排序）的穩健性。

更多關(guān)于評估的細節請參見(jiàn)博客內容：https://defog.ai/blog/open-sourcing-sqleval/

性能

在評估框架中，Defog SQLCoder 的表現優(yōu)于除 GPT-4 之外的所有主要模型。特別地，它的性能超過(guò)了 gpt-3.5-turbo 和 text-davinci-003，而這兩個(gè)模型的大小是它的 10 倍以上。

這些結果針對的是通用 SQL 數據庫，并不反映 SQLCoder 在單個(gè)數據庫模式上的性能。在對單個(gè)數據庫模式進(jìn)行微調時(shí)，SQLCoder 的性能與 OpenAI 的 GPT-4 相同或更好，延遲更低（在 A100 80GB 上）。

將每個(gè)生成的問(wèn)題分為 5 類(lèi)，按類(lèi)別顯示了每個(gè)模型正確回答問(wèn)題的百分比。

SQLCoder 的硬件要求

SQLCoder 已在帶權重的 A100 40GB GPU 上進(jìn)行了測試。你還可以在 20GB 或更大內存的消費級 GPU（如 RTX 4090、RTX 3090 以及 20GB 或更大內存的蘋(píng)果 M2 Pro、M2 Max 或 M2 Ultra 芯片）上加載該模型的 8 位和 4 位量化版本。

接下來(lái)的工作

未來(lái)幾周，作者將對 SQLCoder 進(jìn)行以下更新：

利用更多人工收集的數據和更廣泛的問(wèn)題對模型進(jìn)行訓練；
利用獎勵建模和 RLHF 進(jìn)一步調整模型；
從頭開(kāi)始預訓練一個(gè)專(zhuān)門(mén)從事數據分析的模型（SQL + Python）。

如果你對 SQLCoder 感興趣，快點(diǎn)擊演示地址進(jìn)行探索吧！

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺電腦... 一臺來(lái)創(chuàng )建AI... 一臺來(lái)模擬AI... 一臺來(lái)運行AI”

智能計算 AI | 2024-07-31

釋說(shuō)芯語(yǔ)16：硬科技：構建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

CSR8670CSR8675智能語(yǔ)音Alexa藍牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

蘋(píng)果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

AI+機器視覺(jué)成趨勢，圖文詳解N大應用場(chǎng)景

智能計算安森美 AI 機器視覺(jué) | 2024-07-31

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

如何快速搭建手寫(xiě)體識別演示系統

視頻 digikey AI 手寫(xiě)體識別 | 2022-07-29

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

iPhone 16將不會(huì )預裝AI功能？計劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠(chǎng)的生產(chǎn)力

winni945 | 2018-09-12

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>