微軟提出規模僅38億組參數、可在行動裝置更快運作的自然語言模型Phi-3 Mini接下來更計畫推出Phi-3 Small、Phi-3 Medium

在諸多科技業者均提出可用於行動裝置上執行的大型自然語言模型之後,微軟研究人員提出名為Phi-3 Mini、規模更小的大型自然語言模型,僅以38億組參數規模運作。 微軟研究人員表示,Phi-3 Mini相比先前推出的Phi-2參數規模更大一些,同時運作效能可比擬Meta提出的大型自然語言模型Llama 2,本身基於Phi-2模型設計,並且以嚴格過濾的網...

看更多...

華為雲在香港為大模型訓練和推理提供即開即用澎湃算力

香港2024年4月23日/美通社/--4月23日,華為雲香港峰會成功舉辦,華為雲在香港提供即開即用的AI雲服務(瞭解詳情及試用),為大模型訓練和推理提供高效、長穩、可靠的AI算力。通過全鏈路雲化工具鏈支持大模型高效遷移、開發和高效運行,並提供針對昇騰雲進行特別優化的大模型專區,使能「百模千態」應用快速落地。華為雲全球Marketing與銷售服務總裁石冀琳華為雲全球Marketing與銷售服務總裁石冀琳表示:香港AI產業發展具備良好的基礎,擁有一流的高校資源和科研機構,以及開放的經濟體制和國際化的

看更多...

Intel宣布推出Gaudi 3人工智慧加速器,加速大型自然語言模型與多模態模型的人工智慧訓練專為高效的大規模人工智慧運算需求打造

市場動態 處理器 在Vision 2024大會上,Intel宣布推出Gaudi 3人工智慧加速器,相比前一代產品在BF16運算約提供4倍人工智慧效能,並且對應1.5倍記憶體傳輸頻寬與2倍網路傳輸頻寬,藉此實現擴充更大規模人工智慧運算,並且加速大型自然語言模型與多模態模型的人工智慧訓練,以及推論運算效率。 英特爾執行副總裁暨資料...

看更多...

Google Vertex AI平台累積超過130款人工智慧模型,Gemini 1.5 Pro、Imagen均增加新功能加入合作夥伴Anthropic日前公布的Claude 3,更包含開源社群提供的CodeGemma、Mistral7B與Mixtral 8x7B等開源模型

在此次Google NEXT’24活動上,Google宣布旗下Vertex AI平台已經累積收錄超過130款人工智慧模型,其中包含近期先針對開發者、企業客製化需求提供搶先體驗的Gemini 1.5 Pro,以及全面開放使用的Imagen 2文字生成影像模型,另外也加入合作夥伴Anthropic日前公布的Claude 3,更包含開源社群提供的CodeGemma、Mist...

看更多...

蘋果再傳與影像寄存、分享網站PhotoBucket合作,透過130億個照片、影片訓練人工智慧模型預期在iOS 18等作業系統整合諸多人工智慧應用技術

除了近期傳出與圖像授權業者Shutterstock達成協議,將能使用其提供數百萬張圖像訓練人工智慧模型,蘋果似乎也與提供影像寄存、分享網站PhotoBucket達成合作協議,同樣以其提供影像內容訓練人工智慧模型。 由於PhotoBucket提供超過130億個照片與影片內容,因此顯然相當適合用於訓練人工智慧模型,並且強化人工智慧影像識別、場景分析與理解...

看更多...

聯發科推出名為「BreeXe」的大型語言模型、自動生成式人工智慧服務平台「MediaTek DaVinci」以「達哥」作為暱稱

聯發科在今年釋出其對應70億組參數規模的大型自然語言模型Breeze-7B之後,此次再次推出名為「BreeXe」的大型語言模型,以及相應的自動生成式人工智慧服務平台「MediaTek DaVinci」,更以「達哥」作為暱稱。 依照聯發創新基地負責人許大山博士說明,「BreeXe」是由聯發科位於英國劍橋、倫敦,以及台大創新機第三方合作打造的大型自然語言...

看更多...

報導指稱OpenAI、Google均透過YouTube影片訓練人工智慧模型目前並未確認OpenAI是否有類似違反使用政策情形

消息報導指稱,OpenAI已經透過YouTube收錄影片內容訓練其人工智慧模型,但並未遭Google出面制止,原因似乎與Google自身也同樣藉由YouTube影片內容訓練其人工智慧模型有關。 在此之前,YouTube執行長Neal Mohan接受彭博新聞採訪時,認為OpenAI透過YouTube影片訓練其文字生成影片工具Sora背後人工智慧模型,明...

看更多...

NVIDIA公布名為LATTE3D的研究技術,透過文字描述即可快速生成完整3D模型同時也能產生品質更高的模型內容

NVIDIA在此次GTC 2024期間公布名為LATTE3D的3D模型自動生成技術,讓使用者能直接透過自然語言文字描述,即可產生完整的3D模型。 此研究是由NVIDIA位於多倫多的AI實驗室團隊提出技術,透過自動生成式人工智慧,配合文字描述即可創建可用於虛擬視覺環境的3D模型,藉此加速電玩遊戲、廣告活動、設計項目,或是用於建構機器人虛擬訓練場域。 ...

看更多...

AMD將擴大人工智慧應用發展,今年將推進採用Zen 5系列、RDNA 3+與XDNA 2架構設計攜手中國開源人工智慧模型平台社群「始源AI」,讓在地企業、開發者能更容易找到合適的人工智慧模型

除了NVIDIA在近期GTC 2024說明如何藉由人工智慧加速改變,AMD今日 (3/21)於北京舉辦的AI PC創新峰會活動也說明旗下採用Ryzen AI設計的AI PC產品陣容如何改變市場。 在此之前,AMD已經在2023年推出第一款搭載NPU設計的Ryzen 7040處理器,並且說明將以Ryzen AI設計結合Zen、RDNA及XDNA架構,並...

看更多...

消息指稱OpenAI將在未來幾個月內公布大型自然語言模型GPT-5似乎還暗示新款模型尚未公布消息

Business Insider網站取得消息指稱,OpenAI將在未來幾個月內公布新款大型自然語言模型GPT-5。 時間點方面,消息人士表示最快會在今年夏季對外公布,而部分企業用戶已經收到OpenAI最新模型,以及ChatGPT相關工具改進展示內容。 同時,OpenAI似乎還暗示新款模型尚未公布消息,其中包含OpenAI正在開發人工智慧數位助...

看更多...