繁中守護者3/「連阿嬤都會用!」聯發科跨界做AI平台報帳面試還能幫忙寫程式
「大家都在問為什麼聯發科要做這件事情?因為我們蔡董說,『2024年讓AI普及在臺灣,是聯發科技集團的使命』所以不管哪一個部門,都把這件事當成最重要的目標,而且要思考,生成式AI如何提升生產力。」聯發科技人工智慧暨數據工程處副處長楊建洲向CTWANT記者表示。晶片設計龍頭跨界AI,聯發科技在4月9日對外正式宣布生成式AI服務平台「MediaTek DaVinci」(聯發科技達哥),背後的動機,除了董事長蔡明介認為聯發科的競爭力就是「技術力」,更希望台灣產業加速導入生成式AI,讓原本「超級富豪才玩得起的AI,可以用更便宜的方式、且各行各業都能取得。」群聯電子技術長林緯說。國際電機電子工程師學會(IEEE)今年5月將頒發電子產業最高個人榮譽之一 IEEE Robert N. Noyce Medal 予聯發科技董事長蔡明介,以彰顯他的遠見及對全球半導體產業的影響力,賦予世界各地數十億平民百姓使用先進科技的機會與帶來的好處。「我常跟團隊說,如果你做出來的東西,你的阿嬤不會用的話,就要退回去,所以我們的平台必須要夠開放、夠安全,而且不斷迭代進步。」楊建洲說。MediaTek DaVinci原先是為集團內部打造具資料安全性、提高生產力的生成式AI工具,後續獲各部門廣泛使用。「其實DaVinci這個名字,是我們問系統,如果你想要一個有藝術、科技、人文特質的名字,要取什麼,他就幫自己取了DaVinci達文西,」楊建洲跟CTWANT記者透露,「我覺得這個很棒,我們公司是『發哥』嘛,現在又有『達哥』,聽起來很『發達』。」聯發科技人工智慧暨數據工程處副處長楊建洲。(圖/記者黃耀徵攝)聯發科人工智慧暨數據工程處協理葉家順表示,聯發科約2萬名員工有1萬人會寫程式,所以在開發時就鼓勵大家一起用,去年5月11日上線、12月推出智慧助理功能,目前達哥平台在聯發科集團滲透率達96%,有跨50多個部門參與這個生成式AI專案,使用後更是取得8成以上的員工認同。目前聯發科內部使用達哥做軟體開發的分析需求規格、生成技術文件,在編寫程式部分,能協助寫程式、協助除錯和Code review等工作,另外還能幫助開發者自動生成測項、自動生成測試案例等,其他還有像是人資篩選履歷和自動配對,財務自動辨識發票並報銷流程,法務拿來專利翻譯、合約修改,銷售業務也可以即時查詢客戶訂單出貨等資訊。「其實我們一開始就有同仁用達哥做炒股、搶票小幫手,不過後來都被公司刪掉了,被說應該做點『正經事』。」聯發科員工笑著說。葉家順坦言,目前達哥平台可能只有70分,但這是一套可不斷進化的系統,達哥1.0在去年完成,今年2.0版本新添智慧助理架構,具備4個主要商店,包括AI模型、擴充外掛、提示範本、知識庫(DVCs)等,使用者可用來打造適合自己的智慧助理。此外,達哥平台本身也有內建一般企業常用的功能,像是DocChat可用來分析競爭對手、履歷表媒合、技術文件摘要,VideoChat則能自動生成會議記錄、產出YouTube影片摘要、TED影片摘要等,WebChat能用於技術趨勢分析、市場趨勢收集、產業新聞集錦等。而Plugins新功能,可提供企業知識檢索、RPA自動化等。各界都知道生成式AI很強,但實際落地很少,因此達哥平台在聯發科內部上線測試後,台廠趨之若鶩,紛紛上門。「去年第二季集團內部開始測試後,第三季、第四季很多業界的學長學弟跑來詢問,能不能讓他們也試試看。」葉家順說,聯發科上個月開放給外部企業申請串接,目前已有數十家來自高科技、金融、電信、法律、製造、銷售、服務、系統整合、雲端服務等行業的企業,以及教育機構、新創公司加入。生成式AI服務平台MediaTek DaVinci合作多家系統商,包含宏碁資訊服務、雲馥數位、賽微科技、緯創軟體等。(圖/記者黃耀徵攝)目前該平台合作多家系統商,包含宏碁資訊服務(AEB)、雲馥數位(CloudRiches)、賽微科技(Cyberon)、緯創軟體(WITS)等;賽微科技表示,可以想像達哥平台就像是一個App Store,而系統廠就像是內容開發商,在上面開發不同的APP應用程式,與公司內部系統串接,假設員工要請假,只要在達哥平台介面上說「我要請假」,就會串接到公司人資系統,幫員工導入請假程序。全球最大的獨立快閃記憶體(NAND Flash)控制晶片IC設計廠群聯電子跟聯發科合作,以固態硬碟(SSD)整合AI運算架構,降低AI基礎建設的硬體成本,打造比傳統AI伺服器耗電更少的「aiDAPTIV+」方案,也就是一台電腦主機大小,就能讓一般企業在公司裡用內部網絡使用自己的生成式AI,價格便宜、CP值高,插一般的電源就可以,不用特別幫機器吹冷氣,也不怕上傳雲端後資料外洩。群聯電子技術長林緯表示,他們現在內部也在用達哥系統,因為過去老一輩的高層擔心用ChatGPT資安會有問題、怎麼控管、如果新創公司倒了怎麼辦等等問題,所以才停滯不前,而聯發科推出這樣的平台,解決了這些問題,「真的能更快地推動人類AI的普及。」
前立委費鴻泰兒搶進AI翻譯百億商機 「翻譯貝果」專攻財報年報
現年30歲,目前擔任翻譯貝果營運長費聿德,為美國紐澤西-羅格斯州立大學畢業,擁有ESG專長、APPLE供應鏈採購經理的學經歷,在台灣AI、青年創業圈子小有名氣,他的父親更有來頭是財經界大老前立委費鴻泰。費聿德2023年成立新創公司「萬語智能」,所推出的「翻譯貝果」(Lingo Bagel)在速度、準確度都有一定的水準或甚至在業界表現突出,費聿德說,主要來自由背後強大的AI訓練團隊;尤其是專業的會計師群,每天都持續不斷更新專業詞語庫,並協助校正優化財務AI模型,讓翻譯成果更貼近產業需求,通過國家級考驗的翻譯品質。「我們的翻譯品質已經通過嚴謹的驗證,目前平均可協助企業單位節省90%的時間,正確率更達專業人工翻譯的程度。」費聿德表示。現在翻譯貝果能夠做到幾天之內就將高度專業的資料翻譯完成,包含ESG準則S1&S2的翻譯、臺北醫學大學800頁醫學專書,以及多家知名會計師事務所的財報、年報、永續報告書等,都出自翻譯貝果之手,翻譯品質也獲得各界客戶的肯定。或許受到父母與周遭親友長輩長期在財經界耳濡目染的環境之下成長,近年來看到政府大力推動企業永續經營ESG行動主義,符合自己專業,長輩們又為翻譯年報、財報高昂的費用與低效率所苦抱怨不已,啟發自己衝入翻譯市場,為何不能用AI科技來解決這個問題呢,都甚麼時代了….這就是費聿德一頭栽進翻譯界的濫觴。費聿德說,藉由科技可以為翻譯界迎來翻天覆地的改變契機,那就是跨國語言的翻譯,目前市面上雖然已有不少即時翻譯工具,就連三星最新主打的旗艦機種,也以通話時的AI雙向翻譯為亮點,帶動了一波銷售高潮。但AI翻譯速度快,不過準確度、能否自動排版及在地慣用語的契合度仍是最大的考驗,就一般日常的溝通而言,當前的AI翻譯軟體或許游刃有餘,但面對正式或官方的報表文件、重要的會議資料,以及國際型的公開資訊時,可就不能有所馬虎。如何讓AI在翻譯速度及準確度都做到頂級的程度,大量的訓練及經驗的累積是不可少的,而真正能夠通過國家級考驗的翻譯品質,當屬新創公司「萬語智能」所推出的「翻譯貝果」(Lingo Bagel)。傳統的翻譯方式大多會有耗時過久、品質不佳、母語人士難尋等痛點,尤其是時間上的等待,一份動輒上百頁、多達幾十萬字的財務年報,往往得要分發給多位翻譯人員同步進行,從開始到完成也幾乎得花上1、2個月以上。政府近年來大力推展企業永續發展落實ESG行動主義,金管會又已要求全台近2千家上市櫃公司從今年開始,必須將財報英文化與國際接軌,這讓原本就已活絡的翻譯市場,變得更加火熱,初估整體商機超過百億元以上。
全球看見台灣 輝達最強晶片發布會「這一家」鏡頭最多
全球AI晶片龍頭輝達NVIDIA,台灣時間19日在美國舉行萬眾矚目的年度大會「GTC 2024」,創辦人暨執行長黃仁勳介紹新一代AI平台Blackwell,以及建構的GB200晶片,為台積電(2330)4奈米製程;他表示這將成為推動新工業革命的引擎;在長達兩小時的專題演講中,黃仁勳不但用台灣的颱風AI預測影片,讓世界看到台灣,也用影片介紹緯創的智慧工廠。其他被點名的台廠今日股價都相對抗跌。這次推出的GPU晶片,可由2顆B200與現有的Grace CPU組合成GB200 Superchip超級晶片,由台積電4奈米製程客製化製造。Blackwell是全新的平台,支援AI訓練和即時大型語言模型推理,模型可擴展至10兆個參數,而成本和能耗比其前身低25倍,有助於在資料處理、工程模擬、電子設計自動化、電腦輔助藥物設計、量子運算和產生人工智慧方面實現突破,成為輝達創造新興產業的機會。黃仁勳也在大銀幕上介紹台灣的供應鏈,除了台積電之外,包括鴻海(2317)、華擎旗下永擎、華碩(2357)、技嘉(2376)、英業達(2356)、和碩(4938)、雲達科技、緯創(3231)、緯穎(6669)等公司。被點名的公司中,和碩一舉攻上漲停收在100元,緯創漲2.08%、英業達漲0.72%、鴻海收平盤136元。這次輝達發表會上推出的影片,特別宣傳了一下緯創資通,緯創表示,透過輝達NVIDIA Omniverse和NVIDIA Modulus構建數位孿生平台,實現工廠與製造數位轉型,也強化了預測未來生產場景的能力。緯創表示,利用Omniverse 軟體開發平台的功能,建立動態且高效的模擬生產現場,優化製造過程的各個環節,也讓緯創建立新的工廠時,針對先期的layout規劃與工廠建置調整所需的時間,減少約2個月的建廠時間,透過導入Omniverse Simulation技術,緯創工廠的生產線效率也顯著提高51%。黃仁勳也展示「Earth-2氣候數位孿生雲平台」,是與台灣的中央氣象署及IBM子公司The Weather Company合作,將生成式AI應用在預測天氣上,採用輝達CorrDiff的新型生成式AI模型,透過學習高解析度資料集,學習精細的尺度及當地氣候原理,除了能以視覺化建立模擬天氣和氣候,還可以協助用戶在短短幾秒鐘之內發布警告和更新預報。
科技巨頭19日齊聚輝達GTC盛會 黃仁勳演講聚焦AI+遊戲傳媒四大亮點
全球頂級AI盛會、輝達GTC 2024於當地時間3月18日下午(台北時間3月19日凌晨)將正式開場,輝達CEO黃仁勳將做主題演講,OpenAI、微軟、Meta Platforms、谷歌DeepMind等科技巨頭都會派代表參與,鴻海、廣達等輝達產業鏈公司也將出席。在會議預熱期間,輝達在遊戲和影視領域的最新技術進展已成熱門話題。本次會議議程與遊戲有關的演講有11個,與傳播媒體娛樂有關的演講有34個,中國遊戲廠商騰訊控股、網易,以及傳媒巨頭網飛、皮克斯、迪士尼動畫工作室等均將參與討論。輝達與遊戲和影視有關的主題演講內容主要集中在以下幾個方面:一、生成式AI輔助遊戲開發和影視製作。黃仁勳在主題演講中可能會探討如何利用該技術來創造更加逼真的虛擬人物和世界。這些技術的進步為遊戲開發和影視製作帶來了新的可能性,使得虛擬環境和角色的創建更加高效和真實。二、文字生成圖、文字生成影片模型,以及其他AI應用。熱門文生影片應用開發商Runway的技術長兼聯合創始人Anastasis Germanidis將親自上場,介紹Runway Gen-1和Gen-2影片生成模型的開發、商業化過程;騰訊則將介紹其全新的數十億參數的文生圖像模型,該模型已經廣泛應用於廣告、社群媒體、遊戲、媒體等商業領域,每天生成500萬張圖片。其他將被介紹的AI工具還包括音樂科技新創公司Digitrax的音樂生成類AI應用等。三、3D內容生成。會上可能會介紹一種全新的3D生成式AI技術,該技術可以根據圖像或文本提示自動生成超逼真的數字角色。網易公司計算機視覺組負責人將以《逆水寒》手遊(Justice Mobile)為案例進行介紹,據悉數百萬用戶採用了AI自動創建的角色作爲頭像。此外,新創公司Convai執行長和技術長將發表演講,探討如何使用AI技術在3D場景中讓NPC與玩家對話,以及如何通過不同的AI模型實現低延遲交互。四、在雲端創作遊戲。來自騰訊的遊戲開發人員將分享如何在雲端進行遊戲開發,以及如何使用OpenUSD重塑3D美術資源創作流程,如何將這些工具集成到遊戲引擎和數字內容製作軟體中,從而實現更加高效的遊戲創作。總體來說,輝達強調「AI+」,通過生成式AI在影視製作、3D建模、NPC互動等方面實現突破。GTC 2024為參會者提供了深入了解和探討未來遊戲和影視製作可能性的機會,1045場各種形式的演講、交流、培訓將在美國聖荷西會議中心輪番上演,遊戲、影視等AI應用主題能否從中脫穎而出,讓人期待。
滿滿台灣味!攜手盧森堡AIVA合作半年 富瑜文教基金會打造《臺灣AI組曲》
自從生成式AI聊天機器人ChatGPT問世後,感覺各「創作」領域都出現了AI的蹤跡,像是ChatGPT本身可以生成文章、圖片生成可以仰賴Stable diffusion、Midjourney等軟體。而如今,富瑜文教基金會攜手盧森堡AIVA團隊,透過該公司的AI音樂創作引擎,耗時6個月的時間,打造出3首充滿「臺灣味」的交響樂曲。富瑜文教基金會執行長朱玉昌解釋,在與盧森堡AIVA的過程中,使用了該公司三套AI模型,整體創作過程也分為三個階段,分別是「認識/創作臺灣音樂」、「選擇詮釋樂器」與「AI採譜」。富瑜文教基金會執行長朱玉昌。(圖/廖梓翔攝)在第一階段「認識/創作臺灣音樂」的階段中,AI模型必須要透過學習的方式,去深入理解臺灣風格的音樂。在這其中,前文建會主委、資深鋼琴家陳郁秀,先前推出的《百年台灣音樂圖像巡禮》給予很大的幫助,透過陳郁秀老師先前的資料整理,這讓富瑜文教基金會與盧森堡AIVA合作中,節省了大量蒐集音樂的時間,讓AI模型可以很快地進入到學習、認識臺灣音樂的階段。前文建會主委陳郁秀。(圖/富瑜文教基金會提供)在第一階段AI認識了臺灣風格的音樂,甚至嘗試性的創作幾首旋律作品,交由人工檢驗無誤後,就進入第二階段「選擇詮釋樂器」,這時候,富瑜文教使用了盧森堡AIVA的第二套AI模型,讓原本較為單調平板的旋律,變成由各式樂器組成的管弦樂團演出風格,大大的提升整個曲目的意境感。由於富瑜文教在與盧森堡AIVA合作的過程中,一直堅持AI創作,人類演奏「以人為本」的理念,富瑜文教認為,人類演奏時的感情,是AI難以取代的。所以,當整個曲目的音樂都完成後,就需要盧森堡AIVA的第三顆AI模型進行「AI採譜」,將原本的由各項樂器合併演奏的音樂,轉換成人類可以理解、單一樂器的樂譜,這樣才方便專業的樂手們,以自身的技藝與感情,來完成這次堪稱數位與現實的跨界演出合作。《臺灣AI組曲》運用AI的算力並理解臺灣音樂的獨特元素。(圖/富瑜文教基金會提供)最後,富瑜文教與盧森堡AIVA在歷時半年後,成功推出了《臺灣AI組曲》,其中分別為《海洋臺灣》、《島嶼臺灣》、《科技臺灣》等三個樂章。朱玉昌表示,到這個階段的時候,他深深體悟到科技力量的偉大,現在的AI已經超越了人類的想像。而朱玉昌也認為,之後人類要如何與AI共處,就是一門重要的學問。記者實際在現場聆聽時也注意到,這個《臺灣AI組曲》三個樂章的風格迥異,《海洋臺灣》帶給人一種波瀾壯闊的磅礡,宛如船舶航行在海洋中,一面抵禦著驚滔駭浪,一面呈現出對於冒險犯難後甜美果實的期待與悸動,初期讓人感覺沉重的音符逐漸和緩,接著轉為昂揚,給人一種強烈的雨過天晴的感覺。《島嶼臺灣》初期則是呈現出一種靜謐、悠揚的感覺,猶如置身在寶島臺灣的山林之中,中間不時穿插出的長笛、鋼琴輕快的旋律,就好像呈現出人們靠著大自然、辛勤工作、勞累但是愉悅的紮實感,而弦樂陣陣悠揚的感覺,就好像是告訴著,大自然的山川樹石,都溫柔的環抱著島上的每個人。富瑜文教基金會創辦人曾怡禎。(圖/富瑜文教基金會提供)在聆聽《海洋臺灣》、《島嶼臺灣》的過程中,其實多少都能聽出許多「臺灣味」,用通俗的方式講,就有點像是早年臺語歌曲、民謠變成管樂團演奏的感覺,許多橋段總是有讓人熟悉的感覺,但是細細品嘗,又品出其中的巧思與耳目一新。而這種感覺到第三樂章《科技臺灣》愈發強烈。有別於前兩個樂章,《科技臺灣》的節奏偏快,當中太多橋段都能讓人產生一種「正在聽臺灣經典老歌交響樂」的感覺,但仔細聆聽能明顯感覺出其中新穎、現代化的感覺,並沒有落入過往的「老套」,反而成為一種相輔相成的感覺。這種感覺就有點像是上一秒還身處在70、80年代台灣民風純樸、積極向上的工商轉型時期,但下一秒又進入如今生活便利、科技快速發展的感覺,文字描述起來非常突兀,但實際聆聽卻又是享受在這其中的衝突中,過往臺灣社會的影子深深的重疊在現在的科技社會中。
Sora來襲1/OpenAI新殺手鐧「文字轉影片」 馬斯克:「gg humans」動畫廣告業恐受創
不出手則已,一出手就是橫掃市場!OpenAI繼2022年11月底發表文字生成式AI「ChatGPT」,相隔才短短15個月,2月16日又推出影片生成AI模型「Sora」,一舉將AI應用從文字升級到影片,立馬驚艷全球,市場甚至對一分鐘以內短影片的動畫及廣告產業,湧現唱衰聲浪。對於「Sora」的橫空出世,有網友在推特上發文,「gg Pixar(皮克斯動畫工作室)」,而特斯拉執行長馬斯克更直接回文表示,「gg humans」(意指AI將取代人類)。而就在OpenAI發布「Sora」的前幾個小時,Google也在15日發表了最新的Gemini 1.5模型,可一次處理大量資訊,包括1小時的影片,不過經過網友們的測試,Gemini 1.5最後生成的產品一定都會「種族多元化」,遭到 Google暫時下架。其實在2023年,也有數個影像生成軟體出現,包括RUNWAY Gen-2在6月推出,11月又有Stable Video Diffusion、Pika等模型推出,不過這些模型的影片生成能力,大多僅約3、4秒左右,最長不超過10秒。而OpenAI的「Sora」一亮相,就立刻震撼全市場。「Sora 是一個AI模型,可根據文字指令創建現實且富有想像的場景,產生長達一分鐘的視頻,同時保持視覺品質並遵守用戶的提示。」也就是說,只要輸入「Prompt(提示)」文字敘述下指令,Sora就可以生成最長約1分鐘的真實度不低的影片。OpenAI展示數十個由Sora所生成的影片,內容擬真度極高,像是「一名穿著時尚的女子走在充滿溫暖霓虹燈及招牌的東京街頭。她身著黑色皮夾克、紅色長裙及黑色靴子,拎著一個黑色包包,戴著太陽眼鏡,擦著紅色口紅,走起路來自信又隨性。潮濕的街道反射出七彩燈光,行人熙來攘往。」但影片也出現謬誤,例如「一個人在跑步機上跑步的場景,以35毫米拍攝的電影膠片。跑者卻是逆向在跑步機上跑步。」一般認為,包括分鏡師在內的影像從業人員將受到最大的衝擊。圖為錄影示意圖。(圖/翻攝自GoodSpace.好空間網站)對此,OpenAI解釋,「我們正在教授人工智慧理解和模擬運動中的物理世界,目標是訓練模型幫助人們解決需要現實世界互動的問題。」「現實的物理原理及因果關係,仍是Sora最大的問題所在。」儘管仍不盡完美,「相較於之前的影片生成AI,幾乎是小學生對於比大學生。」有Youtuber如此形容。M觀點主持人Mulia認為,「Sora」的出現,勢必嚴重衝擊動畫及廣告產業,尤其廣告,一般頂多就是30秒左右,剛好就是「Sora」可處理的長度,他甚至預期,5年後,也許小說家可透過ChatGPT,將小說內容生成劇本,再透過Sora生成一小時影片。知識力科技執行長曲建仲指出,目前OpenAI對於原理公開並不多,基本上就是使用了「變換模型(Transformer model)」及「擴散模型(Diffusion model)」來對影片結構做了全面創新。擴散模型(Diffusion model)是將真實圖片逐漸加入雜訊(Noise),讓圖片慢慢變成完全的雜訊圖片,再反轉這個過程,逐漸去除雜訊(Denoise),讓圖片回復為原來的樣子,叫做反向過程(Reverse process)。「ChatGPT利用token(類似單詞的文字語意)來進行文字接龍,產生連續且具有意義的句子及文章,Sora就是利用圖片版的token也就是Patch,來創造出具有連貫性的圖片。」Youtube頻道泛科學院解釋道。「這也是AI變成人的里程碑。」對於Sora的出現,「Sora對於動畫產業的影響,並非是全面衝擊,反而應該要這樣來看,畢竟AI的內容基礎,還是由照片來生成,也就是說,如果是紀實類的影片,例如人物類,由於AI已經很容易收集到相關內容所需資料,影響程度就會比較大,至於是創作型的影片,那Sora反倒是一個不錯的工具。」動畫導演蕭永生告訴CTWANT記者說。知識力科技執行長曲建仲指出,OpenAI基本上就是使用了「變換模型(Transformer model)」及「擴散模型(Diffusion model)」來對影片結構做了全面創新。(圖/翻攝自曲博科技教室臉書、翻攝自魔法學院官網 )Youtube頻道中二見習中製作人Raymond表示,很多影片在正式拍攝之前,都會有分鏡師先進行分鏡,最後再由導演來決定如何拍攝,Sora的出現,對於分鏡的作業將會有明顯的衝擊,但是對於編劇及導演來說,則是一個很好用的工具。「對於很多講述性質的Youtube頻道來說,Sora可以生成很多不同段的影片,讓他們的影片更加豐富。」至於Sora需要多少的算力,來生成一則長度約60秒的影片?目前在論壇Reddit就有網友在討論,也有引用到外媒《Wired》的報導,推估,Sora生成一個1分鐘長度的影片,認為大約需要一個小時。這也說明了目前Sora並沒有開放給一般民眾使用,而是僅給OpenAI內部及部分的動畫家、導演等來測試。而Sora何時會像ChatGPT一樣普及?目前OpenAI並沒有時間表。OpenAI正在跟「錯誤訊息、仇恨內容和偏見等領域的領域專家」對模型進行對抗性測試,另外也在建立工具來幫助偵測誤導性內容,例如偵測分類器,以判斷Sora何時產生影片。
降低AI模型訓練成本和對輝達的依賴 微軟傳要自行研發網卡
外媒引述消息報導,科技巨擘微軟(Microsoft)正在開發一款新的網路卡,希望提高自家人工智慧(AI)伺服器晶片Maia的性能。這款客製化的網路設備不僅能壓低AI模型訓練成本,也能讓微軟降低對於主要高速網卡供應商輝達(NVIDIA)的依賴程度。美國科技媒體《The Information》近日報導,微軟執行長納德拉(Satya Nadella)已任命網路設備開發商Juniper Networks共同創辦人辛度(Pradeep Sindhu)領導此次網路卡開發工作。微軟去年收購辛度創立的伺服器晶片新創公司Fungible。消息人士表示,微軟研發的這款網路卡類似輝達旗下的ConnectX-7,後者支援400Gb乙太網路最大頻寬,並與輝達GPU(圖形處理器)搭配販售。此網路設備的研發可能需要一年多時間。如果成功的話,便能減少合作夥伴OpenAI在微軟伺服器訓練模型所需的時間,並降低訓練過程耗費的成本。微軟尚未回應關於此消息的任何提問。
動畫師飯碗不保?他用AI生成《西遊記》短片 「只花1週」成果超震撼
AI模型ChatGPT的問世,在社會各界激起廣泛的討論和關注,時光荏苒,轉眼間AI行業已經發生了翻天覆地的變化。最近,大陸四川省博主「AI瘋人院」在網路上發布了一部利用AI技術生成的《西遊記》動畫短片,儘管製作時間只要短短1週,其震撼的視覺效果令網友驚嘆不已,紛紛感慨科技發展的迅猛。《揚子晚報》報導,從事15年美術工作的馮先生表示,這段視頻如果人工製作至少需要半年,而自己在AI的幫助下用時1週就完成,隨著AI生成模型Sora的問世,很多現在看來遙不可及的事在未來都可以實現。這段3分56秒的動畫短片以《西遊記》原著第一集為藍本,通過AI技術將石猴降生到拜師學藝的故事生動地呈現在觀眾面前。影片中,整個天庭識別度極高,宮殿群依山而建,錯落有致,屋頂覆蓋著金色的琉璃瓦,陽光下閃閃發光;花果山則充滿了寧靜與和諧,鬱鬱蔥蔥的樹木、飛流直下的瀑布、古樸典雅的石橋,共同勾勒出一個如詩如畫的世外桃源。影片還展示了孫悟空駕舟渡海、來到城鎮、前往靈台方寸山等場景,讓網友嘖嘖稱奇。大陸四川省博主「AI瘋人院」在網路上發布了一部利用AI技術生成的《西遊記》動畫短片。(圖/翻攝自微博)馮先生透露,用AI生成視頻需要4步驟,分別是構思、用文字生成靜態圖片、讓圖片動起來、整理剪輯,「第一步肯定是構思,以《西遊記》第一集為例,從混沌初開到石猴出世再到拜師學藝,首先就要確定一共需要多少個畫面、多少個分鏡」,他使用ChatGPT分析原著文字,讓AI幫忙規劃分鏡方案,自己再從中找到合適的。馮先生提到,有了分鏡規劃後,用AI繪畫軟件把想要的畫面畫出來,然後再用「圖片生成視頻」軟件讓這些畫面動起來。這2個過程中,一般會產生大量廢稿,「目前AI很難完全理解我的意思,無論是圖片還是動畫片段,隨機性都比較大,每次我都會用AI生成很多,在這些素材裡找到合適的再進行下一步。」他接著說,「剩下的就是把素材放到一起剪輯了,台詞我會自己想好,然後使用AI配音。有些特殊角色我會自己配,用變聲器變聲,在剪輯的時候還可以再用聲音特效打磨一下」,最後再加上轉場、背景音等,一部由AI生成的動畫視頻就誕生了。大陸四川省博主「AI瘋人院」在網路上發布了一部利用AI技術生成的《西遊記》動畫短片。(圖/翻攝自微博)「AI繪畫問世以來引發過很多次爭議,插畫師們認為AI用自己的作品進行訓練,現在倒過頭來搶自己的飯碗。」馮先生坦言,AI技術的叠代確實影響了一部分人的利益,「但這是沒辦法的事情,就像潘朵拉魔盒一樣,一旦被打開,再要關上就不可能了,再去抵觸它已經沒有任何意義。」以《西遊記》動畫短片為例,馮先生一共用AI生產了3000多張圖片,最後選擇了約200張,若放在過去,哪怕是資深畫也需要至少半年,至於要讓畫「動」起來,更是天方夜譚。
年收入逾20億! 外媒:OpenAI躋身增長最快矽谷公司行列
據金融時報報導,人工智慧研究公司OpenAI的年收入可能已經超過20億美元,躋身於歷史成長最快的科技公司之列。知情人士透露,這家新創公司在12月實現 20 億美元營收里程碑;他們還表示,在商業客戶對生成式人工智慧產生濃厚興趣的背景下,到2025年這個數字可以增加一倍以上。根據《Information》先前報導,由於ChatGPT產品的強勁成長,該公司12月年化收入突破16億美元,高於10月中旬的13億美元。這一增速將使2015年成立的OpenAI可以躋身谷歌、Meta等少數幾家矽谷公司之列。雖然公司去年11月發生了「人事大地震」,但首席執行長奧特曼(Sam Altman)在被董事會罷免後的幾天內就恢復了職務,對公司業務的影響幾乎可以忽略不計。奧特曼曾宣稱,截至2023年11月,92%的財富500強公司都在使用OpenAI的產品,包括ChatGPT及其底層AI模型GPT-4,而這個聊天機器人每週也同樣擁有1億用戶。OpenAI的許多競爭對手,包括谷歌、Meta等大型科技公司,以及Anthropic、Mistral等新創公司也都在積極將AI產品商業化。近日,谷歌推出了Gemini Advanced,使用的是谷歌此前已公佈過的對標GPT-4的Gemini Ultra模型。奧特曼曾表示,由於構建和運行模型的巨額成本,OpenAI仍然處於虧損狀態。隨著該公司開發更復雜的模型,預計支出將繼續超過收入。為了支付這些成本,該公司可能需要再融資數百億美元。為了獲得資金,OpenAI幾個月前曾尋求以860億美元的公司估值出售股份,這一數字大約是去年4月時的三倍。除此以外,奧特曼還在探索增加晶片供應的選項,以緩解人工智慧行業普遍潛在的挑戰和瓶頸。
群聯自研AI方案正式導入Kingston、華泰 潘健成:讓AI技術擴大應用如PC普及
NAND控制晶片廠群聯電子(8299)今(24日)宣布,自主研發的AI落地應用服務方案aiDAPTIV+,已成功導入遠東金士頓科技(Kingston Technology)與供應鏈夥伴華泰電子(2329)AOI系統,加速進入工業4.0。群聯電子執行長潘健成表示,很高興遠東金士頓科技與華泰電子願意攜手群聯,共同將群聯的aiDAPTIV+ AOI技術落地至實際的生產線AOI應用,證明群聯的aiDAPTIV+技術不僅可以有效降低AI落地運算的硬體建構成本,也能實際助力日漸普及的各種AI應用需求。未來群聯的aiDAPTIV+技術將持續延伸擴大至各種AI應用,讓AI技術能如PC電腦一樣普及化。群聯於2023年7月發佈自主研發的AI人工智慧運算服務aiDAPTIV+,是透過群聯獨創整合SSD的AI運算架構,將大型AI模型做結構性拆分,並將模型參數隨應用時間序列與SSD協同運行,在有限的GPU與DRAM資源下,最大化可執行的AI模型,預計能有效降低提供AI服務所需投入的硬體建構成本。遠東金士頓全球製造副總經理蔡錫銘指出,公司的SMT生產線的產品種類很多且複雜度較高,回顧剛開始導入群聯的aiDAPTIV+ AOI方案時,雙方團隊在不良品檢出的AI圖像學習有非常密切的合作,整個導入時間大約花費2-3個月,非常的快速有效率。展望未來,有信心可以有效降低AOI誤判率,讓整體直通率提升至99%以上。華泰董事長董悅明表示,這次導入時間大約3-4個月,雙方團隊密切的透過AI影像學習,將公司的SMT AOI直通率提升至95%左右,目前公司的載板生產線也正在導入群聯的aiDAPTIV+ AOI方案,目標是希望直通率提升至99.7%以上。
拿新聞訓練AI侵犯版權? OpenAI宣布已與數十家業者洽談合作中
在生成式AI問世的過程中,除了造成全球範圍的轟動外,不少創作者與內容供應者都反對,因為許多AI公司在他們不知情的情況下,擅自將其作品用來訓練AI模型,為此也引發不少爭議。而聊天機器人ChatGPT的所屬公司OpneAI,為了解決這個問題,日前表示已經與數十家新聞出版業者進行洽談,希望獲得內容授權來進行AI訓練。根據《彭博社》報導指出,《紐約時報》曾於2023年底的時候指控OpenAI,表示其在未經授權予同意的情況下,就擅自使用自家數百篇文章內容來進行AI模型的訓練。《紐約時報》甚至在1月初起訴OpenAI與微軟。OpenAI 智慧財產權和內容主管魯賓(Tom Rubin)近期受訪時不僅證實洽談合作的傳聞外,同時也表示對《紐約時報》的指控感到費解,因為OpenAI已經與《紐約時報》進行積極有效的授權協議討論中。而有消息人士表示,目前OpenAI計畫用每年100萬至500萬美元的的價格與新聞業者達成合作,但如此報價似乎很難讓當地內容出版業者接受。至於針對《紐約時報》對OpenAI提出的訴訟,報導中也提到,如果屆時由《紐約時報》勝訴的話,OpenAI有可能因此欠下數十億美元的任務,而且會讓OpenAI被迫刪除掉透過《紐約時報》內容所產生的訓練資料,這也會讓OpenAI未來與其他內容產業合作時,增加更多複雜性。
AI模型計竟能「預測生死」 準確率高達78%
現在AI發展日漸進步,不僅能聊天也能、繪圖,現在竟然還能知道生死。現在科學家開一種AI模型,能預測一個人的生死,和一生能賺多少錢,準確率約為78%。不過科學家也說,現在還不會開放給大眾使用。據《每日郵報》報導,丹麥和美國科學家近日開發一款AI模型,名為「life2vec」,可以從一個人的生活故事,預測生與死,和你一生能賺多少錢,準確率約為78%。據了解,這模型就像聊天機器人一樣,利用現有的細節來預測接下來發生的事,而科學家為訓練它,提供了600萬種真實人物的收入、職業、居住地、懷孕情況等資訊。你可以要求ChatGPT寫一首歌曲、一首詩或一篇文章,科學家也能向life2vec提出簡單問題,如「我會在4年內死亡嗎?」該模型用2008年至2016年的資料訓練,研究已發表在期刊上。不過,首席研究員萊曼(Sune Lehmann)強調,為保護使用該系統的人員個資,不開放大眾或公司使用,就算最後開放,丹麥也會有法律規範,如要AI規劃保險單或做招聘決定是非法的。萊曼說,現在的數據都來自丹麥,其他地方的人們可能不適用,而大多數人實際上並不想知道自己何時會死。據悉,其實預測生活事件和人類行為的技術,已經在科技公司內部使用,「現在這種技術要多討論,才能讓我們決定要將技術帶到何方,以及是否是我們想要的。」
龍年漲一波2/追AI科技股「怕買貴」 Nvidia股價天花板指標「這四檔有空間」
「你看我在2024財經趨勢論壇中沒有提到傳產、航運、觀光等類股,是我認為明年比較沒有亮點,還是以科技股為主。」富邦投顧董事長蕭乾祥告訴CTWANT記者;中信投顧總經理陳豊丰、永豐金控首席經濟學家黃蔭基博士也不約而同地鎖焦AI應用等相關科技股。蕭乾祥表示,市場看好生成式AI應用成長潛力,資金紛紛靠攏AI股,單看AI伺服器產值成長超越一般伺服器的20倍,AI下一步將由雲端走向終端,2024年AI PC需求可望興起。中信投顧總經理陳豊丰說,「我們也是看好熱門AI應用,包括以雲端服務商CSP為核心,AI模型、AI中下游供應鏈,高階半導體封裝業,以及AI PC可望明年亮相後、2025年放異采。」多名本土法人研究員也分析,「生成式AI可作為車輛的語音助理,應用於自駕車具有潛力之外,Intel現已偕同多家合作夥伴啟動AI PC加速計畫,從企業端發展到相關設備,而且大型語言模型GPT4、BERT等,Microsoft、Google、META、Amazon等CSP業者砸錢搶攻AI商機,進入戰國時代。」據此,像是世芯-KY(3661)、創意(3443)、聯發科(2454)與網通IC設計大廠博通(AVGO)、美滿電子(Marvell)概念股等ASIC代工業者,都可以多加關注。今年11月,華碩董事長施崇棠(左)向英特爾執行長季辛格(右)演示搭載於ASUS AI筆電上之大型語言模型FFM-Llama2。(圖/報系資料照)「尤其大型語言模型也積極應用於手機產業,從華為、VIVO、小米、OPPO到高通、聯發科的旗艦手機,可運作參數高達數百億、千億,「看好2024年手機市場需求回升,帶動接下來幾年的出貨成長量。」一名投顧研究員說。「從APPLE、OPPO、VIVO、小米、華為等品牌端來看手機相關類股,應用在手機的SoC、光學鏡頭、PA、PCB、摺疊軸承等都是可以關注的」,一名投顧公司主管分析說,相關個股包括聯發科(2454)、大立光(3008)、全新(2455)、穩懋(3105)、宏捷科(8086)、華通(2313)、新日興(3376)、富世達(6805)、兆利(3548)等。而且觀察AI發展,2024年是「Nvidia與非Nvidia(例如Intel等)」兩大陣營角力,以Nvidia相對支持包括DELL、Supermicro、技嘉(2376)、華碩(2357)等伺服器品牌廠來說,還有鴻海(2317)、緯創(3231)等GPU模組、基板廠,成為市場焦點。不過,AI概念股價已高漲,投資人跟進會不會買在最高點?這些概念股的營收獲利表現會否跟上?一名投顧主管跟CTWANT記者分析說,「市場會拿Nvidia股價在2024年預估EPS的22~25倍本益比,當作供應鏈評價天花板;而美超微Supermicro預估本益比約12~15倍,同時也做為評估ODM股價的參考標準。」進一步了解AI相關供應鏈的ODM,包括廣達(2382)、英業達(2356)、緯創(3231)、緯穎(6669)、技嘉(2376)、華碩(2357),到Network的智邦(2345),Power的光寶科(2301)、台達電(2308),與PCB的台光電(2383)、金像電(2368),Thermal的奇鋐(3017)、雙鴻(3324)與Chassis的勤誠(8210)等。2024年7月26日巴黎奧運登場,可望帶動國內運動、機能衣等相關成衣製鞋個股。(圖/翻攝自Paris 2024奧運臉書)「以上個股股價都漲,與最新報價預估相比的話,台達電、台光電、金像電、雙鴻還有空間。」一名研究員分析資料研判說。永豐金控首席經濟學家黃蔭基博士則提到,隨著2024巴黎奧運將屆,可望帶動NIKE等運動製鞋成衣代工廠;「11月下旬,受到外資買超台股效應,半導體為主的電子題材股帶量走揚,傳產紡織製鞋股也跟著起飛。」一名分析師說,像是紡織成衣雙雄儒鴻(1476)、聚陽(1477),製鞋廠寶成(9904)、豐泰(9910)也都有上揚震盪行情。台新投顧副總經理黃文清則指出,距離明年7月26日的巴黎奧運時間不到一年,國際運動賽事可望帶動相關品牌NIKE、Adidas、UNDER ARMOUR、Lululemond等供應鏈,包括聚陽(1477)、儒鴻(1476)、宜進(1457)、遠東新(1402)、廣越(4438)、光隆(8916)與製鞋業寶成(9904)、豐泰(9910)等,都是可以關注個股出貨量受惠情況。
金融業導入AI有利投資決策? 美SEC主席示警:「從眾效應」恐產生市場風險
美國證券交易委員會(SEC)主席詹斯勒(Gary Gensler)在本週的一次採訪中,再次就人工智慧(AI)給金融市場帶來的風險發出了警告。儘管AI技術的不同版本已經在金融行業中使用了多年,且部署了各種防範欺詐與合規的措施,但AI仍可能對投資者的決策構成風險。詹斯勒表示,在微觀層面上,使用人工智慧來承保貸款、保險等可能會導致偏見。例如,機器人顧問或自營商必須精心編寫程式,以優化客戶的最佳利益,而不是顧問的利益。同時他也表示,這存在系統性風險,金融公司和投資者都使用相同的人工智慧工具可能存在風險。這可能會在市場上產生「從眾效應」,當群體或機構都做同樣的事情或依賴同樣的工具,而不是獨立行動時,就會出現這種情況。詹斯勒指出,自然經濟會導致單一文化,會有基本資料集或基本模型,金融部門的大部分將依賴於它,並在此基礎上進行交易和承銷。「幾十年來,FICO的信用評分一直是單一文化,所以我說的這不是什麼不尋常的事情,也不是什麼新奇的事情。」並稱,如果讓大部分市場依賴於一個資料集,那麼可能會出現金融不穩定而產生從眾效應,可能會讓投資人無意中掉下懸崖。今年稍早,詹斯勒也曾警告說,企業將依賴少數幾個占主導地位的AI模型,這最終將增加危機的可能性。他在8月份表示,這項技術將成爲未來金融危機的中心,這與圍繞規模和網路的強大經濟體系有關。
茶渣變身吸油棉 高中生團隊「KC」奪三星提案競賽冠軍獲20萬獎金
第四屆台灣三星Solve for Tomorrow「新思維,心技術,永續星未來」創意提案競賽於24日進行決賽與頒獎典禮。這場賽事最終是由9組高中生隊伍闖入決賽。而最終,是以「KC」團隊提出的「茶渣的再生之路」以高度可行性的紮實想法獲得評審青睞,拿下這場賽事的冠軍。在這次的三星Solve for Tomorrow創意提案競賽競賽中,冠軍是由「KC」團隊的「茶渣的再生之路」拿下冠軍,亞軍則是技術過硬的「軟體工程師改變世界」的「SightPath-專為國高中生設計的資訊整合平台」拿下,第三名則是以長照為主題的「Tech-Aided Elders」團隊所提出的「SMILE!」拿下。而獲獎的三組團隊也分別獲得新台幣20萬、15萬與10萬元的獎金。「防災小隊」團隊成員。(圖/廖梓翔攝)除此之外,「軟體工程師改變世界」的提案,還因為最獲學子的青睞,拿下賽事的網路人氣獎。而「防災小隊」團隊提出的的「『CAM』 you help me 魚塭監測即時預警系統」與「創能小組」提出的「新式綠能溫差風力整合發電裝置」則拿下賽事的佳作獎。「創能小組」成員與領隊老師。(圖/廖梓翔攝)獲得冠軍的KC團隊表示,他們最大的想法,就是將生活中放眼所及的茶渣進行回收、再處理,讓茶渣可以進入有效率的回收系統,盡可能地達成完成茶渣的循環經濟。成員學生也解釋,他們透過附帶重量檢測的裝置,當店家的茶渣到累積一定程度後,就透過合作的弱勢族群進行茶渣的回收,將回收的茶渣送到工廠,接著將這些茶渣製造成輕薄的「吸油棉」。KC團隊成員。(圖/廖梓翔攝)KC團隊也解釋,其實他們所搭配的裝置成本並不高、後續的茶渣再利用的技術早已存在,這套回收系統,除了讓茶渣得以在更進一步的利用,不僅減輕焚化爐的壓力,同時也能幫助社會上的弱勢族群。而他們也表示,這套流程也是得以運用在咖啡渣上。(圖/台灣三星電子提供)獲得第二名的「軟體工程師改變世界」團隊也說明他們所提出的提案「SightPath-專為國高中生設計的資訊整合平台」,該專案的用意其實就是「資訊整合」,先是透過軟體將許多高中生感興趣的資訊進行整合,接著透過AI人工智慧進行篩選,直接讓高中生們徹底認識自己,甚至是去深入了解自己的喜好,甚至還能透過通訊軟體的推播,多鼓勵高中生去接觸那些他們「可能」感興趣的活動。軟體工程師改變世界團隊成員。(圖/廖梓翔攝)「軟體工程師改變世界」團隊表示,其實有55%的大學畢業生,認為自己就讀錯科系,導致出社會時變成「學非所用」。這套系統的最終目的,就是幫助高中生找尋到自己真正有興趣的道路,在高中轉換大學,從廣泛領域轉換到專業領域的重要時刻,可以透過這套系統,為每一個人建立專屬的AI模型,幫助高中生真正有興趣、可以持續深入學習的領域,達成「學有所用」的目標,降低生涯探索時的門檻。(圖/台灣三星電子提供)獲得第三名優選的「Tech-Aided Elders」的所提出的專案是「SMILE!」,「Tech-Aided Elders」團隊表示,其實這就是一套屬於長輩的「貼身管家」系統,不擅長使用3C產品的長輩,可以透過內建AI系統的「SMILE鏡」進行互動,內建攝影機功能的「SMILE鏡」在獲取到長輩的神色、情緒、語調後,就會進行長輩身體狀況的判斷,並且將判斷後的結果傳入App「SMILE Go」中。「Tech-Aided Elders」團隊成員。(圖/廖梓翔攝)而「SMILE Go」所扮演的就是一個整合的腳色,不僅會記錄長輩的情況,同時也能在上面新增一些長輩的「代辦事項」,也能透過物聯網的功能,將長輩的行程傳回「SMILE鏡」中提醒長輩。「SMILE Go」甚至還能將長輩一些重要的情況、甚至是進行即時性的通知,將訊息透過LINE BOT傳到有家屬、醫師的群組中。(圖/台灣三星電子提供)台灣三星電子行動通訊事業部總經理陳啓蒙表示「三星從2010年開始在全球範圍舉辦Solve for Tomorrow競賽,號召青年學子運用STEM領域知識和創新科技,解決在地問題。而台灣2020年開始推行,截至目前已經累積近300個團隊,超過1,200名學生及老師參與,每一屆都讓我們深刻感受台灣莘莘學子對環境與社會的關心、改變現狀的熱情,還有世界共好的決心。」評審團代表、5% Design Action社會設計平台副執行長黃詩妤表示「從同學們的提案中,看到他們對生活周遭問題的關心、對環境生態的在乎,從天馬行空的創意到收斂為具體應用,轉化成今日的最終提案,讓我們再次為年輕學子的創新想法與落實計畫感到驚艷!5% Design Action很榮幸再度獲邀成為輔導業師團隊,每次輔導過程中,觀察到同學們在協作、團隊溝通能力的成長;也在IxDA台灣互動設計協會的業師輔導下,讓提案更臻完善、科技應用可行性及論述更加完備。非常開心三星持續回應承諾,提供這樣的舞台讓高中職五專學生完整體驗『設計思考』的旅程,相信他們未來都能成為推動社會進步的養分。」