語音模型
」
遭控非法蒐集學生聲紋與臉部資料 Google同意支付875萬美元和解
目前有消息指出,美國科技巨頭Google同意支付875萬美元,以解決一起在伊利諾州的集體訴訟案。根據《The Daily Hodl》報導,這起訴訟指控Google透過Google Workspace for Education(又稱G Suite for Education)服務,長期在伊利諾州學校內未經許可收集並儲存學生與教職員的生物特徵資料。報導中提到,Google被指在超過十年的時間裡,未向使用者作出適當通知或獲得同意,就收集並保存語音模型與人臉模型,涉及的對象是在伊利諾州就學期間於Google Workspace for Education帳號中建立語音或臉部辨識功能的學生與教職員,包括啟用了Voice Match或Face Match的用戶。訴訟範圍涵蓋2015年3月26日至2025年5月15日期間的相關帳號。依照和解條款,符合資格的集體成員可在10月16日之前提交申請,並按比例獲得賠償。首席原告可獲最高5,000美元,其他成員的預估補償金額約在30至100美元之間。最終的和解批准聽證會則將於10月14日舉行。雖然Google對指控全盤否認,聲稱未曾在缺乏通知或同意的情況下收集、捕捉或保存生物特徵資料,並否認違反伊利諾州或其他法律,強調公司不承擔任何法律責任,也沒有任何人因相關行為受到損害或傷害。不過,Google仍同意支付和解金,以結束這場曠日持久的法律糾紛。
卸任前被封鎖帳號!川普二度就任美國總統 Meta同意支付8.2億元進行和解
美國總統川普(Donald Trump)在上任任期結束之前,因為網路發言而引發國會暴亂,後續各大科技公司便對川普的社群帳號進行封禁,川普也為此對Meta等公司提出告訴。而隨著川普再次勝選,Meta執行長祖克柏(Mark Zuckerberg)也多次前往海湖莊園(Mar-a-Lago)向川普示好。而目前有消息指稱,Meta將會支付2500萬美元(折合新台幣約8.2億元)與川普就刪除帳號一事進行和解。根據《華爾街日報》報導指出,其實這項訴訟早在2021年就提出,但訴訟進展一直十分緩慢,直到祖克柏在美國總統選舉後造訪海湖莊園,才出現突破。報導中提到「11月的晚宴接近尾聲時,川普提到了這起訴訟,暗示只有在祖克柏願意配合的情況下,這起案件才能順利解決。」因此,目前傳出Meta將支付2500萬美元與川普和解,而這筆和解金的大部分將用於資助川普的總統圖書館。而Meta此舉也被外界視為是為了安撫川普所做的最新讓步。其實早在競選期間,川普就多次威脅要將祖克柏送進監獄,指控他與科技公司密謀對抗自己。選舉結束後,Meta在祖克柏的領導下,終止了長期以來的事實查核計畫,並撤銷了禁止非人化言論、針對移民與LGBTQ群體的污辱性內容等審查標準。此外,Meta還取消了內部的多元化計畫,並在董事會納入川普支持者、終極格鬥錦標賽(UFC)執行長白大拿(Dana White)。在川普就職典禮上,祖克柏與其他科技公司執行長也坐在顯眼位置。報導中也提到,Meta先前發布最新財報之時,在與分析師的電話會議中,祖克柏表示2025年將是「重新定義我們與政府關係的重要一年」,並強調Meta將與「為美國企業感到自豪、優先考慮美國科技勝利」的新政府密切合作。儘管他並未直接點名川普,但這番話被外界解讀為Meta正積極修補與川普的關係,為可能的川普政府回歸提前鋪路。此外,祖克柏也宣布,Meta計畫2025年投資高達650億美元於AI技術,並預測Meta AI在2025年將擁有10億用戶。而在談及中國AI的崛起一事,祖克伯特別提到開源AI語音模型DeepSeek,並表示「全球將會形成一個開源標準,而確保這個標準由美國主導,對我們國家至關重要。」。
最強推理語音模型? OpenAI執行長:o3 mini幾週內將釋出
人工智慧研究公司OpenAI執行長奧特曼(Sam Oatman)美東時間17日表示,OpenAI已完成其新推理AI模型o3 mini的版本,並將在幾周內推出。奧特曼在社交媒體平台X上表示,其公司考慮了用戶的反饋意見,因此計劃同時發佈應用編程接口(API)和ChatGPT版本。OpenAI去年9月發佈了o1的預覽版,並於12月發佈了完整版本。不同於普通大模型,o1在回答問題之前會進行「思考」,使它在處理複雜的任務、科學和編程時比GPT-4o更優秀。OpenAI當時也透露,預計將於1月底推出OpenAI o3-mini,完整版本的o3將在之後發佈。o3是OpenAI推出的第二個推理模型,之所以在命名時跳過數字「2」,是爲了避免和英國電信運營商O2的商標衝突。奧爾特曼在回覆X用戶提問時表示,希望在今年將GPT系列模型和o系列推理模型合併。然而,對於備受期待的GPT-5,奧爾特曼依舊沒有給出具體的時間表和性能指標,僅僅表示「仍在確定中,但我認爲你們會滿意。」《華爾街日報》12月報導表示,OpenAI的 GPT-5項目進度落後,而且花費巨大,不清楚是否會成功。奧爾特曼隨後回應了這篇報道,並對其表示質疑。OpenAI先前表示將在ChatGPT中引入一項名為 「Tasks」(任務)的測試版功能,表示其將進軍虛擬助手領域,與蘋果的Siri和亞馬遜的Alexa競爭。
懶得打字就用說的!ChatGPT紛擾中推出語音對話功能 免費版也能用
近期科技領域最大的新聞,莫過於就是生成式AI聊天機器人ChatGPT母公司OpenAI的內部鬥爭吧!截至目前為止,尚不清楚OpenAI要如何進行收尾,但就在這紛紛擾擾之際,OpenAI竟然正式釋出了ChatGPT的語音對話功能,而且就連免費版用戶也能使用。首先要強調的是,這項功能其實早在10月初時就陸續開放給全球ChatGPT Plus(付費用戶)使用,如今是正式開放使用,連免費版用戶也能正常使用。如果要使用這項功能,最快的方式就是前往Google Play商店或是App Store下載ChatGPT的App。ChatGPT正式釋出語音對話功能,只要點選App中耳機的圖案,就能開啟對話功能。而且你與ChatGPT之間的對話,也能轉換成完整的文字。(圖/翻攝自ChatGPT)在下載完成App、打開ChatGPT完成登錄後,就可以看到原本輸入文字的對話框右邊,出現了一個小小的麥克風圖案。第一次點選這個功能的時候,系統還會要求你選擇你偏好的語音模型,接著你就可以透過對話的方式與其進行自然的溝通。第一次使用的時候,可以選擇各種不同語調的模型跟你對話。(圖/翻攝自ChatGPT)經由《CTWANT》實測,初次使用ChatGPT的對話功能時,AI很有可能直接對著你說英文。但你只要一句「請使用中文與我溝通」,這時候AI模型就會切換成超級流暢的中文與你對話。而經過測試後,發現ChatGPT的語音模型真的是流暢異常,只能在一些枝微末節的地方感覺到那種一般AI人聲特有的「機械感」。除此之外,ChatGPT的語音對話功能也能當作翻譯機來使用,美中不足的是,多次與ChatGPT溝通後,目前要讓ChatGPT實現翻譯功能的話,就需要在他每次聆聽到外語前、後,對ChatGPT用口語下達翻譯指令,與坊間的自動偵測後實現自動翻譯仍有一大段距離。跟ChatGPT對話時畫面圖案的含意,左邊的圓形是正在聽你說,中間的不規則形狀是ChatGPT正在思考中,右邊的四個橢圓形則是ChatGPT正在語音回答中。(圖/翻攝自ChatGPT)
柯文哲北流活動深夜急喊卡 競辦回應:將另尋場地
民眾黨總統參選人柯文哲競辦昨(18)日傍晚發出採訪通知,原訂今(19)日在北流卡夫卡舉辦AI語音模型暨單曲發表會,結果昨深夜突臨時通知將另尋場地舉辦。昨日柯文哲競辦於深夜11點51分突發布通知,原訂今(19)日於北流卡夫卡餐廳舉辦「柯文哲AI語音模型暨單曲發表會」,將進行調整,待確認時間地點後再行通知。柯辦發言人陳智菡表示,活動同仁租借場地時,該餐廳業者相當熱情,表示屬商業租借沒有問題。然採訪通知於晚間發出後,北市文化局接獲消息並翻閱合約內容,認為餐廳可能因此有違約之疑慮。競辦釐清後,即刻與文化局蔡詩萍局長聯繫,感謝文化局善意提醒,並決定另尋場地舉辦。北市文化局長蔡詩萍在臉書發文表示,突然有消息說柯文哲要宣布AI競選歌曲,地點就辦在北流的餐廳,「我當然很驚訝!怎麼又來了!」蔡詩萍當下即請北流查詢相關合約,確定了營業場所內,提供的販售品項、服務、內容等,都「不得涉及政黨活動」或違反法令。蔡詩萍把相關訊息傳給柯辦後,柯辦給了正面的回應,決定不違反規定,另覓場地辦AI競選歌曲發布會,「這場風波,算是消弭於無形了。」更坦言身為台北市文化局的一份子,必當全力維護我們所轄之館所場地,在大選中的中立角色,也希望各政黨,尊重文化超越政治的信念,共同打拚民主政治的里程碑。
用《聖經》練習!Meta推AI語音模型 支援全球4千種語言
臉書(Meta) 今(23)日發表一系列的 AI大規模多語言語音(Massively Multilingual Speech,簡稱 MMS),可以辨識超過4,000種口語語言,文字和語音之間的轉換也支援超過1,100種語言,不僅能夠使用偏好的語言操作、用於AR及VR,更可理解每個人的聲音。過去最大型的語音資料庫最多僅涵蓋 100 種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta 使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如《聖經》,作為語言的文字訓練資料。聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta 創造的資料集,蒐集超過1,100種語言的《新約聖經》有聲讀物資料集,平均為每種語言提供 32 小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4,000種語言。Meta 將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。