深度求索發布的DeepSeek-V3和DeepSeek-R1大模型,圍繞高效推理和經濟訓練的創新算法,以較低成本實現了大語言模型的性能突破,成為今年以來AI領域的現象級熱點。
DeepSeek火爆之后,會對AI領域的同行產生哪些影響?日前,科大訊飛對此作出回應。
“總體來看,DeepSeek的出現促進了大模型應用的熱度,為科大訊飛等已經提前布局的企業帶來了市場加快成熟的新機會。”科大訊飛表示,該公司更加有信心依托純國產化的星火大模型底座競爭力、數據飛輪和場景創新,在大模型應用上持續深化“護城河”和差異化競爭優勢。
“DeepSeek的火爆吸引了大量云服務廠商、算力企業、芯片廠商、應用端企業等產業鏈上下游積極參與,中國人工智能產業生態建設的速度進一步加快,人工智能的賦能價值和產業規模加速發展,對科大訊飛這樣長期投入培育人工智能市場的企業有很大的綜合好處。”科大訊飛稱。
DeepSeek在英偉達卡上的工程化探索,對科大訊飛進一步提升國產算力基礎上大模型性價比也有很好的借鑒作用。DeepSeek驗證的長思維鏈可讀化輸出,有助于整個產業鏈降低在數據推理路徑標注的投入。未來在需要復雜推理的應用領域,大模型落地過程會進一步加快。
科大訊飛表示,當前,行業眾多“深水區”問題已經到了突破解決的前夜,大模型技術階躍發展是最關鍵和明確的曙光。訊飛星火會堅持全國產化路線,面向行業剛需落地,底座大模型會持續對標國內外最高水平。
此外,DeepSeek的火爆,也讓更多的行業客戶對大模型技術和應用有了更加廣泛的關注和期待。尤其是通過數據飛輪驅動的知識積累和場景創新的業務領域,如教育、醫療等領域,人工智能應用的規模化落地會進一步加快。
基于此,科大訊飛認為,訊飛星火當前在教育、醫療等行業都是市場占有率第一的大模型,該公司在這些領域的先發優勢會得到進一步發揮,未來也會形成更穩固的行業領先優勢。
具體到G端(面向政務部門)和B端(面向企業客戶)業務,DeepSeek的火爆對科大訊飛影響會更為復雜。
G端上,科大訊飛稱,部分 G 端客戶當前對DeepSeek的技術創新和產業影響處于關注和學習階段,短期內對正在實施的智算中心建設節奏有一定影響,但長期來看,各地政府在國產智算中心等新型基礎設施建設、產業生態體系完善、拓展“AI+”新型工業化應用場景、加快數智化治理轉型等方面,投入會進一步加大,這些對訊飛的G端業務都會帶來好處。
在以國企為代表的B端企業市場,由于DeepSeek開源免費,一些企業在AI落地項目中對大模型底座建設的投入會更加謹慎。但也有越來越多的企業在應用AI構建行業專屬大模型方面的需求被激活。在與國企的合作上,訊飛在人工智能企業應用落地中的自主可控優勢以及專屬模型訓練工具鏈、場景落地能力的優勢,有可能會促使其業務收入規模性增長。
“DeepSeek的橫空出世,將吸引國產算力廠商投入更大資源支持國產大模型的適配,有利于國內人工智能產業鏈更好發展。”科大訊飛稱,在DeepSeek獲得越來越多產業資源、政府資源支持時,一批原先以通用大模型為目標的創業公司和互聯網公司將會因為無法獲得足夠的資源支撐而退出角逐,轉做特定方向的人工智能應用落地,這有助于國內人工智能產業資源的合理分布。
科大訊飛認為,大模型對算力的需求為訓練和推理兩個方面,而訓練實現的難度遠大于推理。目前仍只有訊飛星火一家是訓練和推理均在國產算力上進行的,并且僅用1萬張910B國產算力卡,“科大訊飛做了大量國產算力平臺上的無人區適配和效率優化,追求國產算力的極致效率,這更需要技術實力和戰略勇氣”。
值得注意的是,科大訊飛透露,正在訓練的星火X1新版本預計在3月內完成。新版本有信心實現數學答題和過程思維鏈能力全面對標甚至超過世界一流同行。
“DeepSeek的火爆進一步表明通用人工智能前所未有的創新活力和發展潛力,通用大模型的天花板仍然在被持續打開,我們會堅定不移地持續投入大模型底座研發,不斷輸出最新成果。”科大訊飛稱。(記者 許昊杰)