EEPW首頁(yè) >>
主題列表 >>
ai gpu
ai gpu 文章 進(jìn)入ai gpu技術(shù)社區
外媒:DeepSeek省了訓練費,但推理模型應用成"燒錢(qián)黑洞"
- 2月24日消息,盡管投資者曾一度產(chǎn)生疑慮,但來(lái)自大型科技企業(yè)、各國政府以及風(fēng)投機構的巨額資金正以前所未有的速度流入人工智能領(lǐng)域。要理解這一現象背后的原因,關(guān)鍵在于洞察人工智能技術(shù)本身的演進(jìn)趨勢。當前,人工智能技術(shù)正從傳統的大語(yǔ)言模型向推理模型和AI代理轉變。傳統的大語(yǔ)言模型,即多數免費人工智能聊天機器人所使用的模型,其訓練過(guò)程需要消耗龐大的電力和計算時(shí)間。然而,隨著(zhù)技術(shù)的進(jìn)步,我們正在迅速找到方法,在用戶(hù)調用這些模型時(shí)減少其運行所需的資源。與之不同,基于大型語(yǔ)言模型的推理模型,其實(shí)際運行過(guò)程消耗的計算和電
- 關(guān)鍵字: DeepSeek 人工智能 AI
意法半導體攜手亞馬遜,推出AI數據中心光子芯片
- 2月20日,意法半導體(STMicroelectronics)表示,將推出一款新的計算機芯片,瞄準蓬勃發(fā)展的AI數據中心設備市場(chǎng),該芯片是與亞馬遜云端運算服務(wù)部門(mén)(AWS)合作開(kāi)發(fā)。作為“星際之門(mén)”(Stargate)計劃一部分,隨著(zhù)美國頂尖軟件公司計劃投資5,000億美元建設AI基礎設施,這不僅增加對NVIDIA運算芯片的需求,對用于存儲器、電源和通訊應用的芯片需求也在成長(cháng)。意法半導體以“光子芯片”(photonics chip)瞄準通訊市場(chǎng),以提高收發(fā)器的速度,并降低收發(fā)器轉換器的功耗,先進(jìn)的AI數據
- 關(guān)鍵字: 意法半導體 亞馬遜 AI 數據中心 光子芯片
2025 年的疲軟開(kāi)局
- WSTS 在 4 年報道了全球半導體市場(chǎng)th2024 年季度為 1,709 億美元,同比增長(cháng) 17%,比 3 增長(cháng) 3%RD2024 年季度。2024 年全年市場(chǎng)規模為 6280 億美元,比 2023 年增長(cháng) 19.1%。我們 Semiconductor Intelligence 為今年最準確的半導體市場(chǎng)預測頒發(fā)了一個(gè)虛擬獎項。這些標準是在去年 10 月和 3 月初發(fā)布 WSTS 1 月數據之間發(fā)布的公開(kāi)預測。對于 2024 年,我們打成平手。IDC 在 2023 年 11 月預測 2024 年將增長(cháng) 2
- 關(guān)鍵字: 半導體 預測 AI 服務(wù)器
降價(jià)了!RTX 5070 Ti國行建議售價(jià)公布:6299元起
- 2月19日消息,NVIDIA RTX 5070 Ti顯卡海外價(jià)格早已公布,但在中國的售價(jià)一直未公布,不過(guò)隨著(zhù)上市日期的臨近,NVIDIA終于公布國內建議零售價(jià)。NVIDIA官網(wǎng)顯示,RTX 5070 Ti建議零售價(jià)為6299元起,將于2月20日上市。作為對比,RTX 5070 Ti海外建議零售價(jià)是749美元(約5454元人民幣),RTX 4070 Ti的建議零售價(jià)則是6499元起。不過(guò)想要以6299元的價(jià)格買(mǎi)到RTX 5070 Ti估計可能性不大,根據博板堂透露的信息,RTX 5070 Ti的首批貨源直供
- 關(guān)鍵字: 英偉達 GPU 5070
租比買(mǎi)劃算,英偉達GPU價(jià)格飆漲
- 日經(jīng)新聞18日報道,英偉達GPU價(jià)格飆漲,2年來(lái)上漲超過(guò)2成,主因生成式AI普及、需求強勁,持續陷入短缺。 而因價(jià)格上漲,租比買(mǎi)劃算,越來(lái)越多用戶(hù)使用租借產(chǎn)品。 某家日本企業(yè)表示,現行主力的H100 NVL采購價(jià)格在2024年末時(shí)約440萬(wàn)日元,較2年前上漲25%,而現階段的售價(jià)約520萬(wàn)日元。 預計將在近期開(kāi)始大量出貨的次世代系列「Blackwell」的「B200」售價(jià)傳出達750萬(wàn)日元以上。從事GPU租借服務(wù)的GDEP Solutions表示,要購買(mǎi)搭載4顆H100的服務(wù)器需花費約2,6
- 關(guān)鍵字: 英偉達 GPU
DeepSeek發(fā)布NSA 加速推理降低成本
- 2月19日消息,2月18日,DeepSeek官宣推出NSA(Native Sparse Attention)。DeepSeek稱(chēng),NSA是一種與硬件一致且本機可訓練的稀疏注意力機制,用于超快速的長(cháng)上下文訓練和推理。通過(guò)針對現代硬件的優(yōu)化設計,NSA加快了推理速度,同時(shí)降低了預訓練成本,而不會(huì )影響性能。在一般基準測試、長(cháng)上下文任務(wù)和基于指令的推理上,它的表現與完全注意力模型相當甚至更好。NSA的核心組件包括:動(dòng)態(tài)分層稀疏策略;粗粒度token壓縮;細粒度token選擇。
- 關(guān)鍵字: deepseek NSA AI
無(wú)愧地表最強AI!Grok 3“思維鏈 × DeepSearch”雙刃劍來(lái)襲
- 快科技2月18日消息,今日午間,馬斯克旗下的人工智能初創(chuàng )公司xAI震撼發(fā)布了其新一代聊天機器人——Grok 3。在此之前,馬斯克已將Grok 3譽(yù)為“地球上最聰慧的人工智能”。在今日的發(fā)布會(huì )上,馬斯克對Grok 3的贊美之情依然溢于言表。他強調,Grok 3在極短的時(shí)間內便實(shí)現了對上一代產(chǎn)品Grok 2的超越,“我們堅信,它在能力上較Grok 2有了一個(gè)數量級的飛躍”。xAI公司的工程師現場(chǎng)解釋稱(chēng),Grok 3的訓練量是Grok 2的整整10倍。馬斯克還高度評價(jià)道:“Grok 3展現出了極強的推理能力,在
- 關(guān)鍵字: 馬斯克 AI 人工智能
英偉達被曝研發(fā) SOCAMM 內存:694 個(gè) I/O 端口突破 AI 計算瓶頸
- 2 月 18 日消息,科技媒體 WccFTech 昨日(2 月 17 日)發(fā)布博文,報道稱(chēng)英偉達正積極研發(fā)名為“SOCAMM”的全新內存模塊,主要用于 Project DIGITS 等個(gè)人 AI 超級計算機,可在性能方面帶來(lái)巨大飛躍。該模塊不僅體積小巧,而且功耗更低,性能更強,有望成為內存市場(chǎng)的新增長(cháng)點(diǎn)。目前正與三星電子、SK 海力士和美光等內存廠(chǎng)商進(jìn)行 SOCAMM 原型機的性能測試,預計最快將于今年年底實(shí)現量產(chǎn)。援引博文介紹,SOCAMM 擁有最多 694 個(gè) I/O 端口,遠超 PC DRAM 和
- 關(guān)鍵字: 英偉達 SOCAMM 內存 AI 計算
美銀:DeepSeek可能加速中國車(chē)企自動(dòng)駕駛技術(shù)研發(fā)
- 快科技2月17日消息,據報道,美銀證券的分析師在一份研究報告中寫(xiě)道,DeepSeek可能會(huì )加速中國汽車(chē)生產(chǎn)商自動(dòng)駕駛技術(shù)的開(kāi)發(fā)。他們表示,DeepSeek的開(kāi)發(fā)邏輯與自動(dòng)駕駛有一定相似之處,可能對未來(lái)自動(dòng)駕駛技術(shù)的開(kāi)發(fā)產(chǎn)生影響。DeepSeek的方法可以增強自動(dòng)駕駛解決方案公司的多模態(tài)能力,幫助這些公司更好地理解道路場(chǎng)景,并在復雜的道路條件下提供更強大的性能。分析師指出,這在處理復雜場(chǎng)景時(shí),所需的額外計算能力投入也減少了。一些大型汽車(chē)生產(chǎn)商已將DeepSeek納入自身的自動(dòng)駕駛模型,規模較小的公司未來(lái)也可
- 關(guān)鍵字: DeepSeek AI 大語(yǔ)言模型 人工智能 自動(dòng)駕駛
攜手聯(lián)發(fā)科挑戰高通!NVIDIA被曝正開(kāi)發(fā)AI手機芯片
- 快科技2月14日消息,據媒體報道,NVIDIA與聯(lián)發(fā)科的合作正在進(jìn)一步深化,雙方不僅計劃于2025年下半年推出一款AI PC芯片,還正在研發(fā)一款AI智能手機芯片,意圖在移動(dòng)市場(chǎng)分得一杯羹。在PC領(lǐng)域,NVIDIA與聯(lián)發(fā)科的合作AI PC芯片預計將采用臺積電3nm制程和Arm架構,結合聯(lián)發(fā)科在定制芯片領(lǐng)域的專(zhuān)長(cháng)與NVIDIA強大的圖形計算能力,有望在2025年臺北國際電腦展期間發(fā)布。目前,包括聯(lián)想、戴爾、惠普、華碩等在內的多家知名廠(chǎng)商已計劃采用該芯片。而在智能手機市場(chǎng),NVIDIA與聯(lián)發(fā)科還可能發(fā)布一款AI
- 關(guān)鍵字: 英偉達 臺積電 GPU 計算平臺
谷歌 DeepMind 發(fā)布 WebLI-100B:千億級數據集解鎖 AI 視覺(jué)語(yǔ)言模型的文化多樣性
- 2 月 14 日消息,科技媒體 marktechpost 昨日(2 月 13 日)發(fā)布博文,報道稱(chēng)谷歌 DeepMind 團隊發(fā)布了 WebLI-100B 千億級數據集,并通過(guò)增強文化多樣性和多語(yǔ)言性,以及減少子組之間的性能差異來(lái)提高包容性。目前挑戰注:機器通過(guò)學(xué)習大型數據集來(lái)連接圖像和文本,數據越多,模型識別模式和提高準確性的能力就越強。視覺(jué)語(yǔ)言模型 (VLMs) 依賴(lài)這些數據集執行圖像字幕和視覺(jué)問(wèn)答等任務(wù)。視覺(jué)語(yǔ)言模型目前依賴(lài)于 Conceptual Captions 和 LAION 等大型數據集,包
- 關(guān)鍵字: AI 智能計算 大語(yǔ)言模型
2000億歐元,歐盟加碼AI競賽
- 中美 AI 遙遙領(lǐng)先?歐盟不認同。
- 關(guān)鍵字: AI
美國 AI 營(yíng)銷(xiāo)龍頭 AppLovin 股價(jià)飆升 36.45% 創(chuàng )歷史新高,Q4 業(yè)績(jì)超預期
- 2 月 14 日消息,美國 AI 營(yíng)銷(xiāo)龍頭 AppLovin 的股票在當地時(shí)間周四迎來(lái)飆升,最高上漲 36.45%,收盤(pán)時(shí)上漲超過(guò) 24%。該公司公布了超出預期的第四季度收益,許多分析師上調了他們的股價(jià)目標,AppLovin 股價(jià)也首次突破 500 美元大關(guān)。AppLovin 在其收益電話(huà)會(huì )議中表示,公司正剝離其應用業(yè)務(wù),旨在將其 AI 驅動(dòng)的 AXON 廣告軟件拓展到其他領(lǐng)域,如金融科技、保險和汽車(chē)。AppLovin 在 2024 年第四季度營(yíng)收同比增長(cháng) 44% 至 13.7 億美元(IT之家備注:當前
- 關(guān)鍵字: AI 智能計算 市場(chǎng)分析
谷歌Gemini宣布上線(xiàn)全局記憶功能:可回憶曾經(jīng)所有對話(huà)
- 2月14日消息,據報道,谷歌正式宣布其人工智能平臺Gemini AI上線(xiàn)了一項備受期待的“全局記憶”功能。此創(chuàng )新功能賦予Gemini AI前所未有的能力,能夠全面記錄并存儲用戶(hù)與其之間的所有過(guò)往對話(huà)。借助全局記憶,用戶(hù)在與AI互動(dòng)時(shí),徹底告別頻繁翻閱對話(huà)歷史的繁瑣,輕松接續未竟話(huà)題。Gemini AI憑借對先前對話(huà)內容的深刻記憶,自動(dòng)銜接上下文,顯著(zhù)簡(jiǎn)化了人機交互流程,提升了效率與便捷性。對于想要查看過(guò)往聊天內容的用戶(hù),Gemini迅速響應,不僅提供內容概覽,還能基于此展開(kāi)深入交流,極大地增強了溝通的連貫
- 關(guān)鍵字: 谷歌 Gemini AI
ai gpu介紹
您好,目前還沒(méi)有人創(chuàng )建詞條ai gpu!
歡迎您創(chuàng )建該詞條,闡述對ai gpu的理解,并與今后在此搜索ai gpu的朋友們分享。 創(chuàng )建詞條
歡迎您創(chuàng )建該詞條,闡述對ai gpu的理解,并與今后在此搜索ai gpu的朋友們分享。 創(chuàng )建詞條
關(guān)于我們 -
廣告服務(wù) -
企業(yè)會(huì )員服務(wù) -
網(wǎng)站地圖 -
聯(lián)系我們 -
征稿 -
友情鏈接 -
手機EEPW
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產(chǎn)品世界》雜志社 版權所有 北京東曉國際技術(shù)信息咨詢(xún)有限公司
京ICP備12027778號-2 北京市公安局備案:1101082052 京公網(wǎng)安備11010802012473
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產(chǎn)品世界》雜志社 版權所有 北京東曉國際技術(shù)信息咨詢(xún)有限公司
