APMIC

」

平價AI大爆發2／美股上演DeepSeek雲霄飛車　台灣科技人蛇年春節狂加班

蛇年農曆春節期間，大陸新創公司DeepSeek號稱以低價完成的AI模型，引發市場轟動，美股那斯達克指數瞬間蒸發近1兆美元市值，不少台灣科技人也忙了起來，找資訊、讀論文，探討DeepSeek能否用在自家產品線上，畢竟原本在大語言模型領域最強的OpenAI，已被笑稱是CloseAI，不但封閉、且以英文思考為主。「自DeepSeek R1發佈以來，很快的AWS、Azure等都開始主持R1變體」 Google大腦之父、AI科學家吳恩達在臉書上說，「什麼是『最好的模型』定義，正在頻繁變化，開發者經常想嘗試新的模型。」「這對台灣來說就是一顆原子彈，是台灣幾十年難得一見的戰略機會，這不只是技術專案，更是文化與價值工程。」MeetAndy AI共同創辦人薛良斌說，台灣目前幾款繁中版大型語言模型，主要以Meta釋出的Llama模型為基礎訓練，但Llama相對來說不夠聰明，DeepSeek R1開源模型可下載後開發，論文也有記錄訓練過程，讓其他人了解其運作方式。耐能Kneron執行長劉峻誠說，AI的黃金時代要來了。（圖／陳曼儂攝）整個春節假期都因DeepSeek，而在辦公室加班的耐能執行長劉峻誠告訴CTWANT記者，「這是一個黃金時代的來臨。」自家的模型已透過DeepSeek R1論文中提到的前沿訓練技巧，升級而有了「思維鏈推理」和「自我反思」的能力。劉峻誠表示，在DeepSeek的方法論支持下，未來大、中、小企業推出的大語言模型能力差異將變得很小，技術開源後，專精型的模型將會百花齊放，「可能幾天就多四、五百個」，特別是台灣有龐大的製造業，可以按照模式，用很低的成本去做專屬自己公司的AI，「在台灣的產業界絕對是一個很好的加分項」。像是在醫療行業，耐能的AI助手可在問卷填寫中進行推理，根據患者的回答動態調整問題，分析可能的健康風險，提高診斷效率。也可做金融衍生品定價，涉及複雜數學計算和市場分析，傳統的AI只能提供簡單的報表分析，這次進化後，可直接找出資料中的異常。比亞迪用DeepSeek來提升車輛的AI能力。（圖／新華社）特別是在中國大陸，在官方的支持下，已從地方政府、國有企業、醫院等，都有採用DeepSeek模型的案例，像是長春市吉林大學醫院已推出一套診斷工具，以DeepSeek產生醫療計畫；武漢、成都、杭州等許多醫院都提到，會用DeepSeek作醫療參考，或是向病人解釋複雜的醫療報告。在汽車行業，比亞迪等20多家企業已宣佈在車載系統中加入DeepSeek產品。MeetAndy AI創辦人薛良斌、Taiwan LLM開發者林彥廷與Ubitus執行長郭榮昌，也在2月7日發起「台灣製造」的大型語言模型計畫FreeSEED，打算以DeepSeek R1為基礎，重新訓練、打造一個符合台灣需求的大型語言模型，並以開源授權釋出模型權重，預計在3月底釋出第一版預覽的推理模型，不到一周已募得1千萬元，APMIC創辦人吳柏翰表示，大型推理模型將會是今年主流，目前在數學領域最佳的Thinking Tokens是4000到8000 Tokens，而簡單推理確認是在4096 Tokens就可以，做單一垂直的微調能縮小到1K的資料，所以訓練時間可從700小時變成7小時，今年會是地端市場爆發準備期，雲端廠商可以跟地端廠商合作。

老黃簡報提3次提「他」 APMIC帶AI解決方案反攻美國市場

今年台北國際電腦展COMPUTEX掀起AI教父、輝達（NVIDIA）執行長黃仁勳炫風，他在演講簡報提及的台灣公司股票都大漲一波，有一家軟體公司的名稱出現三次，那就是主打企業自主AI解決方案的台灣新創公司APMIC。APMIC創辦人暨執行長吳柏翰27日表示，旗下的大型語言模型「CaiGunn開講」將引進北美市場，讓企業擁有能力打造自己的AI大腦、人人輕鬆參與AI時代，協助全球企業邁向AI轉型。「CaiGunn開講」，名稱取自台語「聊天」發音，是APMIC團隊打造的在地化大型語言模型與平台框架。吳柏翰介紹，企業人員只要將現有的文章、網站或是文件資料上傳，不需寫任何程式，就能打造出地端的企業AI大腦，不上傳到雲端，所以不怕機密洩漏，每個員工都能一鍵套用、用對話的方式使用AI工具。「CaiGunn開講」已獲得Google、台北市政府、NEC、台塑生醫、中國信託銀行及亞太電信等800多家橫跨健康、製造、金融、航空、零售等產業採用，為企業服務效率提升超過30%，也是2023年全台唯一上榜全球知名開源語言模型平台Hugging Face百大排名的模型。輝達也在27日宣布推出四款全新NVIDIA NIM微服務，讓開發人員能輕鬆建置與部署高效能的生成式AI應用，針對地區需求量身打造，在台灣使用Llama 3-Taiwan 70B NIM微服務，可降低生產環境中運行模型的總成本，並減少延遲。輝達新聞稿提到，像是長庚醫院正在以此建置該院專屬的AI推論服務，集中管理醫院體系內的所有LLM應用；和碩用來開發內外部的應用，將這款微服務與旗下的AI系統整合，提升製造與營運效率。其他包括長春集團、欣興電子，媒體公司，以及線上合約服務公司律果科技與新創公司APMIC等都有在開放模型上進行合作。數據顯示，目前企業做AI生成，用小模型加上RAG準確率只能達到83.9%，若想更精準，就必須花更多的錢、買更大的設備與模型，但APMIC的技術就是用他們「微調」，使用輝達H100的顯卡，達到H200擁有的90%以上的精準度。吳柏翰表示，今年他到美國參加輝達的GTC大會時，發現美國雖然AI發展得早，但缺乏相關的框架業者，而他們已能跟輝達生態圈合作打團體戰，包括硬體、軟體與系統整合等廠商，進軍美國市場。

APMIC

平價AI大爆發2／美股上演DeepSeek雲霄飛車 台灣科技人蛇年春節狂加班

老黃簡報提3次提「他」 APMIC帶AI解決方案反攻美國市場

平價AI大爆發2／美股上演DeepSeek雲霄飛車　台灣科技人蛇年春節狂加班