<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 國內外大模型高考作文大挑戰：都不及格，但學(xué)習效率恐怖！

國內外大模型高考作文大挑戰：都不及格，但學(xué)習效率恐怖！

發(fā)布人：傳感器技術(shù) 時(shí)間：2023-06-12 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

又到了一年一度的高考時(shí)間，作為6月份關(guān)注度最高的事情，每年的高考總是能夠引來(lái)各路大神關(guān)注，不少自認文采出眾的網(wǎng)友，還會(huì )挑戰現場(chǎng)寫(xiě)一篇高考作文，然后讓大家進(jìn)行評分。

不過(guò)，今年的高考作文整活，似乎因為某些東西的出現而有了不一樣的結果。是的，就是登上熱搜的AI高考作文，AI寫(xiě)高考作文在去年其實(shí)就已經(jīng)有公司在嘗試，寫(xiě)出來(lái)的文章從架構到立意都相當不錯，即使是有著(zhù)多年教學(xué)經(jīng)驗的老教師，看了都直接打個(gè)高分。看到這里，或許你已經(jīng)知道小雷想要整什么活了。沒(méi)錯，作為AI測試大師的小雷（ID：leitech），決定拿今年的高考作文命題去考考國內的各大AI，看看大家寫(xiě)的作文水平到底如何？當然，除了國內的AI，小雷也找來(lái)了一些海外的AI，看看這些“洋和尚”遇到中國高考，能不能整出一些新的花樣。廢話(huà)不多說(shuō)，讓我們直接來(lái)看看各家的作文都寫(xiě)得怎么樣吧。

題目就一句話(huà)，能難倒AI嗎？

在今年的高考作文命題中，上海卷可能是最讓學(xué)生蒙圈的，上海卷的出題老師非常徹底的貫徹了“惜字如金”四個(gè)字，整個(gè)作文命題的描述加起來(lái)只有21個(gè)字：“一個(gè)人樂(lè )意去探索陌生世界，僅僅是因為好奇心嗎? ”，作為曾經(jīng)的高考生，小雷我是最怕遇到這種命題作文的，從網(wǎng)絡(luò )上的聲音來(lái)看，大家也是如此。

面對這種只有一句話(huà)描述的作文題目，AI又會(huì )如何去解讀并回答呢？先來(lái)看看訊飛的星火大模型。

圖源：雷科技一篇標準的討論文，作為曾經(jīng)的文科生，小雷表示：“這個(gè)我熟”，從個(gè)人角度而言，訊飛星火給的這篇文章質(zhì)量是很高的，AI首先肯定了“好奇心”是人類(lèi)探索陌生世界的一大原因，并且對“好奇心”如何驅動(dòng)我們去探索未知做出了解釋。然后訊飛星火以此進(jìn)一步擴展，提出了探索陌生世界并非僅僅是因為好奇心，并且從個(gè)人的成長(cháng)、情感以及精神追求等方面進(jìn)行解讀，最后再用總結點(diǎn)題，我的評價(jià)就八個(gè)字：“有理有據，令人信服”。唯一的問(wèn)題是，文章的字數似乎不到800字，從WPS給出的字數統計來(lái)看是762個(gè)字（加上標點(diǎn)符號），按照審稿規范，估計會(huì )扣掉一些分數。接下來(lái)，我們有請通義千問(wèn)來(lái)作答。

圖源：雷科技與訊飛星火不同，通義千問(wèn)用了另一個(gè)角度來(lái)解答命題，在開(kāi)頭同樣先對“好奇心”驅使我們探索未知世界這段話(huà)進(jìn)行了解析，然后再從社交需要、求知欲和探索欲等方面進(jìn)行解讀。不過(guò)，在文章的倒數第二段，或許是出于對提問(wèn)者的建議，通義千問(wèn)加入了一段“安全提示”。雖然從內容來(lái)說(shuō)是沒(méi)有問(wèn)題的，但是，如果將其作為高考作文來(lái)看，倒數第二段就看起來(lái)有點(diǎn)突兀了，審稿老師估計也會(huì )一臉懵逼，所以，即使前面寫(xiě)得不錯，也會(huì )因此而扣掉一些分數。下一個(gè)“作者”是百度的文心一言，看看它又會(huì )怎樣回答這個(gè)問(wèn)題？

圖源：雷科技文心一言同樣選擇以討論文的形式來(lái)撰寫(xiě)作文，當然，這也是目前AI最擅長(cháng)的文章類(lèi)型。從內容角度來(lái)說(shuō)，文心一言的回答也是十分不錯的，但是過(guò)多的段落和轉折詞，使得文章有點(diǎn)像“流水賬”。不過(guò)在最后的立意點(diǎn)題上，文心一言給出的回答則更好一些，沒(méi)有局限于個(gè)人層面，而是擴大到對其他個(gè)體的思考與包容中，給出了更宏大的立意。接下來(lái)讓我們看看“洋和尚”的表現，首先是谷歌投資的Claude。

圖源：雷科技首先從字數上看，Claude恐怕就沒(méi)有合格，WPS的檢測結果顯示這篇文章的字數為646，離800字還有一些距離。不過(guò)，從內容上看，Claude確實(shí)是給出了不同于國產(chǎn)AI的解答，它從人類(lèi)本身出發(fā)，以冒險基因和進(jìn)取精神為核心，解讀了人類(lèi)為什么要探索陌生世界。從立意上來(lái)說(shuō)，Claude或許是目前出場(chǎng)的AI中最高的，不僅僅是講到人類(lèi)，更是將話(huà)題拓展到了文明的發(fā)展與延續、人類(lèi)的未來(lái)等方面，讓人不禁有種“不明覺(jué)厲”的感覺(jué)。不過(guò)，考慮到命題更多的是對個(gè)體想法的探索，雖然文章內容不錯，但是恐怕也拿不到滿(mǎn)分或是特別高的分數。最后，就讓我們來(lái)看看ChatGPT的回答吧，鑒于時(shí)間關(guān)系，小雷最終是在New Bing上得到的答復。

圖源：雷科技不得不說(shuō)，New Bing給出的文章是所有回答中最長(cháng)的，字數高達1144個(gè)，考慮到文科答卷的作文答題區大小，恐怕會(huì )超出限制，卷面分和文章本身的分數都會(huì )因此大打折扣。至于文章本身，New Bing選擇從人類(lèi)本身去探討這個(gè)問(wèn)題，然后分別從求知欲、創(chuàng )造欲、競爭欲、自我實(shí)現等方面來(lái)討論人類(lèi)為什么要探索陌生世界，立意方面也是與Claude相似，喜歡從人類(lèi)角度來(lái)思考這個(gè)問(wèn)題。從這里其實(shí)就可以看出海內外生成式AI在邏輯上的區別，在面對相同的問(wèn)題時(shí)，海外的AI有時(shí)候會(huì )傾向于從一個(gè)更大的層面上去進(jìn)行解讀，而國內的AI則更加扣題，選擇從個(gè)人角度出發(fā)進(jìn)行解讀。

我認為兩者存在差異的原因主要有兩點(diǎn)：一是海外的訓練數據與國內的訓練數據不同；二是對中文問(wèn)題的理解不同，國內的中文互聯(lián)網(wǎng)有著(zhù)過(guò)去歷年的高考題目，所以AI在看到類(lèi)似的題目時(shí)，會(huì )優(yōu)先與相近的數據進(jìn)行匹配，最終寫(xiě)出一篇類(lèi)似于高考作文的成品，而海外的AI則是將其看做對“人類(lèi)探索陌生世界”問(wèn)題的解讀，所以選擇從一個(gè)更廣泛的角度進(jìn)行回答。至于哪個(gè)AI的文章更好，或許就因人而異了，喜歡科幻、喜歡宏大敘事的讀者，或許會(huì )更喜歡“洋和尚”的文章，從個(gè)人角度來(lái)說(shuō)的話(huà)，國內的AI則表現得更好一些。

作文命題二選一，AI能理解嗎？

在本次的高考作文中，北京卷是給出了兩個(gè)命題，考生可以二選一進(jìn)行作答，那么對于A(yíng)I來(lái)說(shuō)，它們遇到“選擇題”時(shí)，又會(huì )給出怎樣的回答呢？首先是訊飛星火。

圖源：雷科技內容來(lái)說(shuō)是沒(méi)什么問(wèn)題的，但是訊飛星火卻同時(shí)給出了兩篇文章，顯然是沒(méi)有意識到題目中的“任選一題”四個(gè)字的含義，而且從字數上看，兩篇均為500字左右，加起來(lái)是滿(mǎn)足700字以上的要求了，但是單獨算得話(huà)，全都不及格。那么通義千問(wèn)呢？

圖源：雷科技問(wèn)題同樣存在，一樣是寫(xiě)了兩篇文章，一樣是五百字左右，基本上與訊飛星火犯了一樣的錯誤。

圖源：雷科技國內三巨頭里，目前來(lái)看只有文心一言正確理解了題意，從中選擇了“續航”為題目并撰寫(xiě)了一篇文章，單就這一點(diǎn)來(lái)說(shuō)，已經(jīng)是贏(yíng)了。但是，具體到文章本身來(lái)說(shuō)，過(guò)于簡(jiǎn)單且字數僅400+，甚至比訊飛星火和通義千問(wèn)還少，放到高考里基本上就是不合格的了。再來(lái)看看兩個(gè)“洋和尚”表現如何，首先是Claude。

圖源：雷科技Claude也成功理解了題意，并且給出了自己的見(jiàn)解，從字數上來(lái)看，居然是目前所有AI中最接近的，足足有625個(gè)字，而且文章也從“續航”本身的詞義，到人生、社會(huì )、科技等方面進(jìn)行了不同的解讀，總體而言更具有可讀性和連貫性，表現十分不錯。另一方面，New Bing則是給了我一個(gè)“驚喜”。

圖源：雷科技是的，New Bing也理解了題意，但是它反過(guò)來(lái)問(wèn)我想讓它選擇回答哪個(gè)問(wèn)題，說(shuō)實(shí)話(huà)挺樂(lè )的，而在我做出了選擇后，New Bing又給了我一篇900+字數的文章。從文章內容，結構以及字數要求來(lái)說(shuō)，New Bing是在這個(gè)環(huán)節中表現最好的（如果忽略掉反問(wèn)我如何選擇的話(huà)）。而且，在測試過(guò)程中，New Bing還會(huì )提示“正在思考，請等待”的回答，然后我足足等了五分鐘都沒(méi)有下文（偷懶是吧？），最終在我的催促下，New Bing的文章才姍姍來(lái)遲，活脫脫上班想摸魚(yú)卻被老板抓現行的員工。

最后

AI寫(xiě)高考作文，雖然本質(zhì)上是整活，但是也可以側面反映目前的各個(gè)平臺的AI技術(shù)能力如何。從以上兩個(gè)測試的表現來(lái)看，目前國內理解能力最強的應該是文心一言，畢竟是唯一能夠理解北京卷題意的AI，而在文章結構和內容來(lái)說(shuō)，訊飛、文心、通義都差不多，不過(guò)訊飛的更像一篇普通作文。至于海外的“洋和尚”，從表現來(lái)看確實(shí)是領(lǐng)先國內AI平臺不少的，至少在提問(wèn)的理解能力上要高出不少，但是因為缺乏國內中文互聯(lián)網(wǎng)的訓練數據的原因，所有在遇到這些帶有“中國特色”的提問(wèn)時(shí)，會(huì )選擇從普通提問(wèn)的角度去解答。總的來(lái)說(shuō)，目前生成式AI還在快速發(fā)展，各家都有著(zhù)獨特的優(yōu)點(diǎn)，同樣也存在一些問(wèn)題，比如對文章的字數要求總是無(wú)法正確理解等。但是，考慮到它們誕生的時(shí)間，已經(jīng)是相當恐怖的學(xué)習效率了。

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 大模型

相關(guān)推薦

英偉達的挑戰者的來(lái)錢(qián)之道

智能計算英偉達大模型 | 2024-07-23

AI大模型時(shí)代的邊云協(xié)同之EdgeXFoundry

nakey | 2024-04-10

從基礎能力到應用，大模型實(shí)測結果揭曉

智能計算大模型實(shí)測大模型 | 2024-06-11

OpenAI終止對中國提供API服務(wù)，國產(chǎn)大模型發(fā)布應對方案

智能計算 openAI API 大模型 | 2024-06-26

OpenAI再次對線(xiàn)谷歌，誰(shuí)才是贏(yíng)家？

智能計算 OpenAI 谷歌 Gemini ChatGPT 大模型 | 2024-05-16

邊緣智能：AI商業(yè)化中最值得關(guān)注的一環(huán)

智能計算邊緣智能 AI 大模型 | 2024-05-16

大模型價(jià)格戰開(kāi)打，多芯混合能否成破局之策？

智能計算大模型 | 2024-06-25

斯坦福AI團隊承認抄襲清華模型，公開(kāi)道歉并撤下?tīng)幾h項目

智能計算 AI 清華大模型 | 2024-06-05

浪潮之下的大語(yǔ)言模型以及我國未來(lái)大語(yǔ)言模型的發(fā)展

智能計算 202405 大語(yǔ)言模型大模型 | 2024-05-09

大模型提速自動(dòng)駕駛算法開(kāi)發(fā)——2024年IDC中國自動(dòng)駕駛開(kāi)發(fā)平臺廠(chǎng)商評估研究報告發(fā)布

汽車(chē)電子大模型自動(dòng)駕駛算法開(kāi)發(fā) IDC | 2024-06-24

免費！字節跳動(dòng)發(fā)布豆包MarsCode智能開(kāi)發(fā)工具：支持代碼補全、Bug修復

智能計算字節跳動(dòng) 大模型 AI編程 | 2024-06-27

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>