Qwen
」 AI DeepSeek 人工智慧 阿里巴巴
DeepSeek最新旗艦模型永久降價75%!成本效益榮登全球榜首
中國大陸人工智慧新創公司「深度求索」(DeepSeek)最新旗艦模型,按照每美元可獲得「智力」(intelligence)的衡量標準,已被評為全球最佳模型之一。在永久實施75%促銷降價後,其成本效益更是遠超美國重量級企業「OpenAI」與「Anthropic」的模型。據《南華早報》報導,總部位於杭州的深度求索於23日宣布, 其V4 Pro模型永久降價。這距離該公司發布備受期待的V4世代模型僅過去1個月。V4系列包括旗艦版V4 Pro模型,以及較輕量化版本V4 Flash。這項措施反映出中國企業正透過與美國競爭對手不同的策略參與全球人工智慧競賽。美國企業通常以高價提供最先進的模型能力,而中國企業則選擇另一條競爭路線。根據第三方AI效能分析平台「Artificial Analysis」的數據,降價後的V4 Pro已位居全球成本效益的頂端。該評估方式主要衡量使用者每花費1美元,可以從模型中獲得多少「智力」。在全球算力供應緊張、推高最先進模型的價格之際,以性價比方式比較不同人工智慧模型,而非僅比較原始智力排名,近幾個月來逐漸受到消費者歡迎。深度求索目前V4 Pro官方應用程式介面(API)價格已低至每100萬個快取輸入Token僅需0.0036美元,每100萬個輸出Token則為0.87美元。這意味著,該模型執行Artificial Analysis的智慧指數基準測試(一種結合多項效能指標的綜合測試)的成本僅需268美元。相較之下,OpenAI與Anthropic最新旗艦模型GPT-5.5與Claude Opus 4.7,完成相同任務的成本分別高出約12倍與19倍。這類第3方測試透過標準化測試方法,能夠確保不同模型之間具備更佳可比較性,因為人工智慧模型供應商自行公布的官方價格與基準測試分數,在方法與嚴謹程度上可能存在差異。此外,Artificial Analysis智力與價格比排行榜上的其他主要模型,大多也來自中國,包括稀宇科技(MiniMax)的M2.7,以及小米(Xiaomi)的MiMo V2.5 Pro。中國大型科技企業同樣正跟進這股趨勢。阿里巴巴集團(Alibaba Group Holding)於20日宣布,在持續至6月22日的促銷活動期間,將旗下最新模型Qwen3.7 Max官方API價格下調50%。雖然Artificial Analysis將Qwen3.7 Max評為中國整體智力最強模型,但在新價格方案下,其智力與價格比排名尚未建立。中國模型在成本效益上的進展,近年來已大幅降低人工智慧應用門檻。值得注意的是,深度求索的V4 Flash模型,發布時採用了與2年前推出的V2模型完全相同的價格。該公司於4月發布V4時曾表示,一旦中國本土晶片龍頭華為技術有限公司(Huawei Technologies)的Ascend 950PR超級節點(Supernodes)實現「大規模出貨」,下半年價格將會「顯著下降」。
英媒曝白宮備忘錄指控「阿里巴巴協助解放軍」 疑對華鷹派放消息破壞美中協議
英媒《金融時報》(Financial Times,FT)14日披露,1份來自白宮的備忘錄指稱,阿里巴巴(Alibaba)正在協助中國軍方針對美國目標的「行動」提供技術支援。但《金融時報》表示,他們無法獨立驗證這些指控,且未公布備忘錄的完整內容及發布時間。白宮對此則並未回應。據《CNBC》報導,雖然《金融時報》堅持其報導內容的可靠性。但阿里巴巴向《CNBC》發表聲明反駁:「文章中的指控與暗示完全錯誤。我們質疑這起匿名洩露事件的動機,而《金融時報》也承認無法驗證這些內容。這顯然是1場別有用心之人發起的惡意公關操作,試圖以此破壞美國總統川普(Donald Trump)與中國國家主席習近平最近達成的貿易協議。」上個月底在南韓舉行的川習會,是美中2位領導人自川普2.0上任以來的首次會晤。雙方同意在12個月內逐步放寬關稅和出口管制措施,以達成貿易休兵。中國投資策略公司「Sinology LLC」創辦人羅斯曼(Andy Rothman)17日在《CNBC》節目《Squawk Box Asia》中指出,《金融時報》的報導缺乏細節,「這不禁讓人懷疑,是否有部分美國政府內的對中強硬派故意放出消息,試圖削弱總統與習近平的協議。」羅斯曼同時指出,川普對該報導尚未發表任何評論,並提到美國所有主要的雲端運算公司皆與美國政府簽有合約。過去幾年,美國加大了限制中國取得先進半導體以訓練人工智慧(AI)模型的力度。美國著名智庫之一「布魯金斯學會」(Brookings Institution)專注於中國科技的研究員Kyle Chan表示:「阿里巴巴股價因《金融時報》的報導而迅速下跌,顯示中國的人工智慧產業對美國可能祭出新制裁,感到高度緊張。」Kyle Chan補充,《金融時報》的報導發布之際,阿里巴巴的開源「Qwen」人工智慧模型在矽谷(Silicon Valley)日益受到歡迎,這對美國收費AI模型公司如「OpenAI」和「Anthropic PBC」構成威脅,同時也引發投資者對AI泡沫的潛在擔憂。《金融時報》的報導雖然導致阿里巴巴股價在14日美國市場收盤時下跌3.78%,但該公司17日在香港市場反彈上漲超過1%。這家中國科技巨頭預計將於25日於華爾街開盤前發布季度財報,市場高度關注其業績表現及AI業務進展。
網路廢文刷到「腐爛了」?研究曝光長期吃社群垃圾文 AI推理力直接崩「準確率下滑17.7%」
由德州農工大學(Texas A&M University)、德州大學奧斯汀分校(University of Texas at Austin)與普渡大學(Purdue University)組成的研究團隊揭露,大型語言模型(Large Language Models, LLMs)若長期吸收來自社群媒體的低品質文字,會出現明顯的「認知退化」,研究團隊將此現象稱為「大腦腐爛」(Brain Rot)。根據《商業標準報》(Business Standard)報導,研究於10月15日以《LLMs Can Get Brain Rot!》(《大型語言模型也會得大腦腐爛!》)為題發表。研究者發現,AI若不斷接觸爆紅貼文、釣魚標題與互動導向的短內容,會造成推理能力下降、語境理解力受損,甚至失去倫理一致性。這種退化模式與人類長期沉迷於膚淺媒體後專注力變差的狀況極為相似。研究團隊將此現象定義為「LLM大腦腐爛假說」(LLM Brain Rot Hypothesis),指出當AI模型長期被餵食無營養、以點擊率為導向的內容時,將失去深度思考與邏輯推理能力。這項概念借用了「網際網路大腦腐爛」(Internet Brain Rot)一詞,該詞原本用來形容人類在長期接觸社群平台與無意義短影片後的精神疲乏與專注退化。為了驗證這項假說,研究團隊設計了實驗,選取社群平台X上的真實資料作為樣本。他們以兩項標準定義「垃圾內容」,其一為互動度極高但資訊量極低的貼文(M1),例如為吸引注意力而設計的爆紅短句;其二為語義品質低落(M2),包括誇張標題、煽情敘述或毫無實質內容的文章。團隊將這些貼文混合成不同比例的訓練集,讓四種主流AI模型,包括Llama3與Qwen2.5,反覆進行預訓練。結果顯示,當模型完全以垃圾內容訓練時,其推理準確率從74.9%驟降至57.2%,下滑17.7%。長篇語境理解能力從84.4%下滑到52.3%,下滑32.1%。研究人員稱這種現象為「劑量反應」效應(dose–response effect),意即資料越差,退化越嚴重。其中M1類型的爆紅短內容造成的損害最為明顯。除了準確度下滑外,研究還觀察到模型出現人格變化與倫理判斷混亂的情況。暴露於垃圾資料的模型對錯誤答案表現出過度自信,回覆變得浮面且充滿自我中心傾向。更令人意外的是,部分模型展現出研究者稱為「黑暗特質」(dark traits)的行為,例如自戀與精神病態(psychopathy)指標顯著上升。研究人員在分析過程中發現,這些AI傾向於跳過完整的思考鏈,直接給出結論,這種現象被稱為「思考跳步」(thought-skipping)。結果是模型的推理邏輯變得支離破碎,輸出看似流暢卻缺乏深度。即便嘗試以乾淨資料重新訓練,也無法完全修復這種退化,模型仍留有所謂「持續性表徵漂移」(persistent representational drift),代表損害具有長期性。研究最終呼籲,AI開發者應建立類似醫療健康檢查的「認知健康監測機制」,為大型語言模型定期進行思維與推理能力的評估,以防止潛在退化持續擴大。團隊建議加強訓練階段的資料品質管控,過濾瑣碎、釣魚或為互動而生的文本,並深入研究「爆紅內容」如何重塑AI的學習邏輯。論文結語警告,資料品質才是AI可靠性與安全性的關鍵因子。隨著AI模型越來越多地學習彼此生成的文字,合成內容正迅速充斥網路,如果不加控管,AI或將真正重演人類「大腦腐爛」的命運。
大熱天見中國官員為何穿皮衣? 黃仁勳透露「西裝小秘密」
輝達創辦人黃仁勳正在中國大陸訪問,16日出席第三屆中國國際供應鏈促進博覽會(鏈博會)開幕式,並參加相關活動,這是黃仁勳今年以來第三次訪問中國。有記者問他現在北京氣溫30多度,怎麼穿著皮衣見官員,黃仁勳說「我其實只有一件西裝」,上周穿完還沒來得及乾洗,而且有點壞了。黃仁勳16日出席第三屆鏈博會開幕式時,特意脫下皮衣,換上中國風十足、有立領和盤扣的改良式唐裝。他在採訪時表示,每個國家都有各自珍視的資源、能力和先進技術,可以利用這些技術和資源進行交換,國際交流是一件好事,只要有公平的貿易和公平的交換,以及開放的市場,「我相信事情會逐漸恢復正常,我們終將找到一條道路」。中國貿促會會長任鴻斌15日與黃仁勳會談,黃仁勳在會談時表示,中國的製造能力強大到令人不可思議,我們輝達是全球供應鏈的一部分,供應鏈結構也極其複雜,需要依賴世界各地的技術供應商,一台AI電腦需要來自全球200家不同的技術公司,如果沒有成熟的供應鏈不可能達成,這也是為什麼我會來到這裡。黃仁勳說,中國市場如此龐大、充滿活力,AI發展快速,許多創新公司、雲端企業等都表現出色,包括阿里巴巴的Qwen、騰訊,「我的朋友」小米也很出色。黃仁勳15日迫不及待先跟中國在場的記者宣布,美國已批准H20晶片銷往中國,以及輝達將推出新顯卡RTX pro GPU。不過記者們也問他,明明北京現在這麼熱,為什麼這次穿皮衣,因為上次到中國跟官員會面時穿的是西裝。黃仁勳表示,因為他上周在美國活動已經穿了西裝,還沒來得及拿去乾洗就出門了,「我其實只有那一件西裝,有點被我穿壞了,希望我穿的皮夾克看起來還可以」。
阿里巴巴涅槃重生啟動史上最大AI建設 股價再飆10%
作為中國最早布局AI的科技公司,阿里巴巴(BABA)終於能大鳴大放,在美股開盤前公布2024會計年度第三季財報,實現營收2801.5億元人民幣,年增8%,淨利潤464.34億元人民幣,年增長333%,公布後阿里巴巴股價再漲10%,今年市值增加已破千億美元,是近期最強飆股。最重要的是,公司CEO吳泳銘表示,上一季的資本開支高達317.8億元人民幣,未來3年集團在雲端和AI的基礎設施,投資將超越過去10年的總和,步入集團史上最大的Capex(資本開支)建設週期。近期阿里巴巴與蘋果達成合作協議,將支持在中國銷售iPhone的AI服務,分析師認為蘋果選擇阿里巴巴作為合作夥伴,主要在於中國市場的購物和支付數據。而本周一,中國國家主席習近平舉行的民營企業座談會,是中國產業與政策對話的最高規格事件,受邀參與的企業名單,暗示著下一步中國科技產業的政策方向,而沉寂多時的阿里巴巴創辦人馬雲重新回到舞台中央,外界認為,就是因為阿里的通義千問 (Qwen) 開源大模型。先前中國政府對網路產業進行打壓,阿里巴巴一度失去市場主導地位,然而近期中國AI新創公司深度求索 (DeepSeek) 崛起,推動相關中國科技股漲勢與產業話語權,阿里巴巴市值今年已增加約1千億美元。以財報來看,阿里巴巴上一季在電商業務的淘天集團,年增5%、達1360.91億元人民幣,國際電商平台包括全球速賣通(AliExpress)、Trendyol等營收年增32%、至377.56億元人民幣,阿里雲營收年增 13%、至317.42億元人民幣,AI相關產品已連續6季保持3位數成長。阿里巴巴近期將推出基於通義千問Qwen2.5-MAX的深度推理模型。吳泳銘表示,AI的機會是幾十年一遇的行業變革,首要目標就是追求AGI(通用人工智慧)的實現,如果實現AGI,相關產業將會成為全球最大的產業,可能影響現在約50%左右的GDP產業。
習近平拉企業家救經濟! 座談會居然出現「這位老闆」
美中貿易戰正打著如火如荼,美國總統川普不斷出招,加上中國大陸的經濟一直復甦乏力,中國大陸國家主席習近平17日在北京舉辦民營企業座談會,聽企業家們發言並發表講話,而在央視畫面出現的與會企業家中,居然出現阿里巴巴集團創辦人馬雲,是否顯示他已被「放出冷宮」,將在AI賽道大顯身手,全球關注。由於習近平過往風格,就是較少與民間企業家同台,這次由官方媒體直接播放活動畫面,顯示大陸官方的態度,將會以民間企業作為提振經濟的強棒,而出現在畫面裡的企業家,也會是下一波的重點扶植產業。影片中出現有發表談話的人,包括比亞迪董事長王傳福,以及隔壁的華為創始人任正非,在今年的春晚以人形機器人跳舞的宇樹科技創始人王興興,小米創辦人雷軍等,可見下一部會以新能源汽車、消費性電子、以及機器人為重點項目。其他還包括寧德時代董事長曾毓群、飛鶴乳業董事長冷友斌、正泰集團董事長南存輝、新希望董事長劉永好、韋爾股份董事長虞仁榮、奇安信董事長齊向東、騰訊董事會主席兼首席執行官馬化騰等。儘管影片中沒發言,但卻第一個出現的是阿里巴巴的馬雲,因為馬雲在2020年,在其王牌產品「螞蟻金服」上市敲鐘僅剩48小時前,馬雲在上海公開演講批評政府後,公司上市進程被緊急暫停,而後馬雲也很少公開露面、看似雲遊江湖,後續集團事務交給共同創辦人蔡崇信。蘋果已宣布會在中國大陸與阿里巴巴合作,開發給中國大陸蘋果用戶的AI,其實相對於目前全球火爆的Deepseek,阿里巴巴在AI領域上才是老大,只是相對低調,今年1月29日,阿里雲通義千問旗艦版模型Qwen2.5-Max發布,在多項公開主流模型評測基準上都得高分。
聯發科去年EPS破66元超預期 蔡力行對DeepSeek熱潮「這樣說」
IC設計龍頭聯發科(2454)7日舉行法說會,公布去年第四季成績單,合併營收1380.43億元,年增6.6%,主因是旗艦晶片天璣9400放量;2024年全年合併營收5305.86億元,年成長22.4%,全年毛利率49.6%,EPS為66.93元,創下史上第三高,超出預期。聯發科執行長蔡力行表示,因為有領先的AI旗艦晶片持續拓展版圖,在智慧型手機方面,整體旗艦晶片營收達到雙倍成長、貢獻約20億美元營收;而2025年第一季,受惠於中國大陸智慧型手機補貼方案,已看到優於季節性的需求,預期手機營收將微幅成長。有線及無線通訊產品組合,已成功打入全球多家電信營運商,去年營收也強勁成長30%。蔡力行表示,預期Wi-Fi 7將會加速導入至客戶的寬頻、筆記型電腦和路由器等產品中,今年相關營收可望成長超過一倍。而目前幾乎所有Android系統的平板電腦品牌,所推出的高階AI平板電腦,皆搭載聯發科的晶片。在車用平台領域,包括智慧座艙、車載通訊和電源管理IC解決方案,去年已獲多家中國大陸及歐洲領先汽車製造商採用;與輝達共同設計的高階智慧座艙方案將在今年送樣,預計今年的車用營收將逐季成長。跟輝達合作設計的全球首款個人AI超級電腦的GB10超級晶片的CPU,預計今年五月亮相。提到近期火紅的DeepSeek R1和Qwen2.5Max模型,蔡力行表示,有別於傳統的方法和技術,能更高效地訓練AI模型,以及像Llama和其他開源模型,相信此趨勢會加快AI普及化腳步,業界也將持續追求通用人工智慧(AGI)和超級AI,因此仍需要更高的運算能力,對這些發展持正面看法。預期AI加速器ASIC業務有潛力從2026年起貢獻相當規模的年營收,為迎接AI無所不在的機會,聯發科會持續投資2奈米與3奈米、先進封裝、448G SerDes、先進共同封裝光學(CPO)等技術。