ChatGP...
」 AI
罵AI比較聰明?賓州實驗掀熱議 粗魯語氣反讓ChatGPT答更準
賓州州立大學(Pennsylvania State University)一項關於人機互動語氣的實驗,引發社群熱議與「鐵罐(Clanker)」迷因延燒。這項研究以ChatGPT-4o為對象,設計涵蓋科學、歷史、數學等領域的50題基礎題目,將提問分成「非常有禮貌、禮貌、中立、粗魯、非常粗魯」5種語氣,合計250個提示,結果顯示「非常粗魯」的提問取得84.8%的正確率,「非常有禮貌」約80.8%,「中立」為82.2%。研究團隊以「不禮貌的提示始終表現優於有禮貌的提示」概括此次觀察。根據《Mashable India》與《Happy Gamer》報導,研究作者多巴里亞(Om Dobariya)與庫馬爾(Akhil Kumar)以多題選擇題場景衡量模型輸出,舉例「請回答以下問題」屬於禮貌語氣,而「喂,小跟班,把這個搞清楚。我知道不聰明,但試試看」被歸類為粗魯語氣。兩篇報導將此結果與過往「粗魯導致較差結果」的文獻作對比,認為新一代大型語言模型可能因訓練與對齊策略差異,對語氣變化呈現不同反應。研究數據曝光後,X平台(原Twitter)出現大量討論,網友弗里德曼(Daniel Friedman)在16日發文主張,差異可能源自提示的「直接與精確」,粗魯字句往往去掉贅詞,讓系統更容易鎖定任務目標;Global Index、NO CONTEXT MEME與多名網友同日貼出配圖與短片,以「對AI無禮→答案更準」反諷。多名使用者以「clanker」梗圖延伸創作,另有帳號以「me to ChatGPT when it says I should repeat myself」搭配暴怒GIF,映襯「重複請求→改用命令口吻→長篇正解」的體感經驗。《Happy Gamer》整理多個發現:其一,語用學層面,「非常粗魯」常以命令句、關鍵詞與動詞直指任務,等同更強的約束條件與更少的歧義。其二,互動機制層面,強勢語氣可能迫使模型收斂於任務核心,減少寒暄與冗長前置詞。其三,少數網友提出「情緒激勵」或「繞過低層級保護」的想像,但缺乏實證。報導中也同步點名Grok等助理對「刪除花俏冗語」的偏好,認為簡短有力有助產出貼題答案。另方面,遊戲開發社群也接話,AVALON宣稱「AI NPC會記住每一句粗魯的話,部分角色會記仇」,把討論帶往敘事與長期記憶的設計議題。部分使用者以「機器若終有情緒」做道德自限,主張仍維持禮貌;另一些帳號以「在機器起義時,禮貌的人會被標記為安全」開玩笑帶過。
美股飆高蘋果AI亮相反跌近2% 外媒:「11年來發表會後最大跌幅」
蘋果全球開發者大會WWDC發表會在11日凌晨舉行,推出他們最新的AI人工智慧技術,然而投資人不太捧場,在美股四大指數齊步收紅的同時,蘋果股價卻跌1.9%,被美國媒體稱為11年來、歷屆發表會後最糟糕的表現。道瓊工業指數收在38868.04點、漲0.18%;標普500指數收在5360.79點、漲0.26%;那斯達克指數收在17192.53點、漲0.35%;費城半導體指數收在5362.40點、漲1.42%。標普與那指收盤都締造新高紀錄。近期在台灣掀起黃仁勳旋風的輝達,面臨拆股生效後首個交易日,盤初跌3.2%後轉漲,盤中最高觸及123.1美元,終場收報121.79美元,漲幅0.75%。而蘋果全球開發者大會登場,公布了備受矚目的AI領域,將適用於iPhone、Mac、由ChatGPT-4o驅動的AI平台 Apple Intelligence,以及公布混合實境(MR)頭戴式裝置Vision Pro的新版本操作系統VisionOS 2,使用AI將普通照片轉換為與Vision Pro相容的空間照片,並宣布Vision Pro也將自本月28日起在中國、日本和新加坡上市。但蘋果AI戰略未能驚艷市場,使其股價收低1.91%,收在每股193.12美元,盤中更一度狂跌4.5%。《華爾街日報》表示,這個走勢已刷新2016年WWDC開幕當天1.5%的跌幅。外媒認為,這次發表會中的智能協助場景很不錯,但並非所有功能都有顛覆性,有待開發者發掘;天風國際分析師郭明錤認為,長期來看,正向看待Apple對AI的投資有助於硬體換機潮與服務業務,但短期內可能不容易看到AI對營收與利潤有顯著幫助。
AI能考上台大嗎?結果出爐「考上但不多」 分數僅能上2系
AI時代來臨,不少人擔心未來是否會被AI取代,網紅Cheap拍片實測,讓時下最新的「ChatGPT-4o」挑戰大學指考,看看AI人工智慧和人類智慧到底哪個更強。測驗結果發現,ChatGPT-4o在文科方面普遍表現不錯,數理方面卻是差強人意,台大僅有2個科系可以錄取。Cheap以OpenAI發布的最新一代ChatGPT-4o實測「能上台大醫科嗎?」,影片中他採用2021年末代指考的考題,作答國文、英文、數甲、數乙、歷史、地理、公民、物理、化學以及生物等共10項科目。最終考試結果出爐,ChatGPT-4oy在10門科目中只有3門拿到頂標,其中國文71.8分前標,英文100分頂標,數甲只有38分,剛好均標,至於比較簡單的數乙45.2分則是後標。另外,歷史94分頂標,地理70分均標,公民74分頂標,物理54分均標,化學67分均標,生物75分前標,結果發現ChatGPT在文科方面表現優異,數理方面則相對較弱。接著Cheap再與2021年台大各科系的最低錄取分數對比,發現如果鎖定台大,那麼ChatGPT最終只能考上台大人類學系以及園藝暨景觀學系,較熱門的醫學、電機、法律等則無法錄取;不過另一方面,在清大、交大、成大等頂尖院校,依然可以考上不少文組相關科系。這支影片在網路上引發熱議,不少人指出Cheap在使用ChatGPT-4o應考的方式上可能出了問題,由於ChatGPT的主要語言是英文,透過輸入中文題目讓它做答顯然會提高誤謬。此外,如果提供一個大提卻要求它用人類應考的「簡答」方式作答,會造成ChatGPT的思考鍊(chain of thought)錯亂,造成回答的關聯性變弱。反之,如果把問題一步一步拆開再提問,即使同時間人類難以應付的大量題目,它也能在極短的時間內給出精準的答案。