2025-05-28 19:28 | 來源:泡泡網 | 作者:俠名 | [產業] 字號變大| 字號變小
5月27日,星環科技主辦“AI×Data:新一代AIInfra”2025年度產品發布會,星環科技正式發布AI-ReadyDataPlatform概念,并全面展示其構建新一代AI基礎設施的核心能力。...
5月27日,星環科技主辦“AI × Data:新一代 AI Infra”2025年度產品發布會,星環科技正式發布AI-Ready Data Platform概念,并全面展示其構建新一代AI基礎設施的核心能力。
一、從“AI + Data”邁向“AIⅹData”: AI與Data的關系演進
當前,AI技術正經歷從工具性應用向深度融合的轉變。星環科技在發布會上清晰地勾勒了AI演進的四個階段:從最初的內容生成(Step 0),到自然語言與知識庫的簡單交互(Step 1),再到AI成為共事者、重構應用的乘法階段(Step 2),最終邁向人類進入AI時代的指數級躍遷(Step 3)。
這一演進過程可以用公式表達為:從AI生成Data,到AI + Data的簡單加法,再到AI × Data的乘法效應,最終達到(AI × Data)^n的指數級增長。其中,AI × Data不僅僅是簡單疊加,而是AI與數據處理、數據治理、數據分析的深度融合與相互賦能。
正如Gartner最新研究報告《Data Management Is the Sole Differentiator in a Commoditized and Multipolar LLM World》所指出的:"特定的LLM將不再被視為企業成功的主要區別因素。取而代之的是,其他企業很難獲得或復制的獨特內部數據將成為成功AI旅程的唯一競爭力來源。"在AI技術深度普及的今天,數據管理能力將成為企業差異化競爭的關鍵。
二、大模型落地的多重挑戰:數據與應用的雙重困境
在企業大規模落地AI的進程中,數據挑戰和應用挑戰成為制約高效落地和高ROI的兩大關鍵因素。星環科技在發布會上深入剖析了這些挑戰,為企業智能化轉型提供了清晰的問題視角。
數據挑戰:從沉淀到應用的全鏈路痛點。
數據挑戰主要體現在四個方面:首先是數據資產沉淀不足,企業數據割裂,形成嚴重的信息孤島;其次是數據存儲模型單一,不同模型分離存放,無法統一存儲;第三是數據質量問題,包括數據雜亂、質量差,缺乏數據標準和自動化治理工具;最后是數據應用層面的挑戰,如數據安全性低、時效性差、共享流通存在壁壘等。
這些挑戰不僅影響了企業數據資產的價值發揮,也直接制約了AI技術的落地效果。
應用挑戰:碎片化與集成難題。
在應用層面,企業面臨的主要挑戰是應用爆發成百上千,單點建設成本高,與現有系統對接困難,以及AI Safety等問題。這些挑戰導致企業在AI應用建設過程中投入大量資源,卻難以獲得理想的回報。
面對這些挑戰,企業需要一個能夠統一管理數據和AI的基礎設施,以降低建設成本,提升AI應用質量,確保AI應用的安全可控。這正是星環科技新一代AI Infra的核心價值所在。
三、星環科技新一代AI Infra:重構企業AI基礎設施
星環科技在此次發布會上推出的新一代AI Infra,不僅是一套完整的人工智能基礎設施技術架構,更是一次關于未來企業智能化如何落地的系統性思考。新一代AI Infra旨在解決企業在AI落地過程中面臨的數據和應用挑戰。這一架構包含四大核心平臺: Knowledge Platform(知識平臺)、AI Platform(AI平臺)、AI-Ready Data Platform(AI 就緒數據平臺)和Resources Platform(資源平臺)。
AI Infra整體架構:四層協同,全棧賦能
星環科技新一代AI Infra采用分層設計,從底層資源到上層應用形成完整閉環。
Resources Platform作為基礎,提供統一的資源管理能力,支持多種異構計算資源;
AI-Ready Data Platform作為核心,提供多模型數據的統一存儲和處理能力;
AI Platform提供模型訓練、推理和應用開發能力;
Knowledge Platform則負責知識管理和工程化,將數據轉化為知識資產。
這四層架構不是簡單疊加,而是深度融合、相互賦能,形成了一個完整的AI基礎設施生態。
通過這一架構,企業可以實現從數據到知識、從模型到應用的全鏈路智能化轉型。
四、AI-Ready Data Platform:數據平臺的革命性創新
作為AI Infra的核心構成,AI-Ready Data Platform是一個AI賦能的數據平臺,為AI生產和提供高質量數據。該數據平臺以關系型、向量、圖、全文、時序等多模型數據統一存儲管理為基礎,提供多模態數據自動處理、高效數據治理、特定領域知識構建以及全流程的實時數據洞察能力,實現從數據產生到應用于AI的全過程數據管理,一站式助力企業更高效地運用AI釋放數據價值。它具有五大核心能力:
1.AI-Ready Data多模型數據:支持向量、圖、文檔、全文索引、關系型表等多種數據模型,為AI應用提供豐富的數據基礎;
2.非結構化數據處理:能夠將非結構化數據轉化為半結構化、結構化數據,解決企業80%以上的非結構化數據難以利用的問題;
3.數據治理:提供高效數據治理能力,確保數據的準確性、一致性和可用性;
4.特定領域知識:將數據模型轉化為知識,提取和沉淀領域知識,為AI應用提供知識基礎;
5.全流程實時數據洞察:支持實時接入、實時處理、實時分析,滿足企業對數據時效性的高要求。
這些能力通過星環科技的多款產品得以實現,包括Transwarp Corpus Studio(星環語料開發工具)、Transwarp Data Studio星環數據開發工具)、Transwarp Data Hub(星環一站式多模型大數據平臺)和Transwarp Knowledge Hub(星環知識平臺)。
多模型統一架構:AI-Ready Data Platform的技術核心
星環科技的AI-Ready Data Platform支持向量、圖、全文索引、文檔、時序數據等多數據模型,并實現了統一接口、統一計算引擎、統一存儲到和一資源管理,形成了完整的統一技術架構,用戶可以在接口和計算層屏蔽所有異構數據帶來的差異化,以統一形態滿足目前以及未來各類垂直大模型場景的落地需求。星環科技自2020年實現多模型統一架構以后,不斷拓展多模型能力,到2023年發布分布式向量數據庫后已完整支持業內主流的11種數據模型,連續2年入選Gartner“數據庫產品品類最多的廠商之一”,并成為國內首個通過信通院"多模數據庫產品評測"的廠商。
全流程實時數據洞察,加速數據價值創新
星環科技湖倉集統一平臺,端到端秒級數據分析:星環科技湖倉集統一數據平臺,基于統一的存儲、統一的資源管理、統一的計算引擎和統一的接口,一個平臺能夠同時支持批處理、交互式分析、實時數據處理和在線數據服務四類場景。基于星環科技一體化的數據平臺,端到端數據處理延時從過去的T+1天提速到T+1秒,實現數據落地即分析。并且,在數據處理分析性能方面相比業內同類產品均都數倍的提升,例如在100TB TPC-DS測試場景中,數據分析性能相比Databricks(Photon)提升1倍,硬件成本降低一倍。星環科技自2017年實現湖倉一體架構后,在實時、高并發數據寫入以及數據處理分析方面不斷創新突破,在2022年實現了湖倉集一體的架構,并且數據集市性能能夠達到甚至超越單獨的數據集市,幫助數百個客戶構建統一的數據平臺,加速實時數據創新。
高性能分布式時序數據庫,PB級實時時序數據秒級分析:星環科技分布式時序數據庫Timelyre9.3版本實現了10倍的分析性能提升,能夠秒級分析PB級實時時序數據,助力企業用戶實時處理傳感器、金融交易、系統日志、生產設備等實時產生的海量時序數據,快速識別風險或者定位故障原因。同時,分布式架構可以線性擴展,滿足PB級到EB級數據的存儲需求,結合5-20倍的無損數據壓縮能力,有效減少存儲節點數據量,大幅降低成本。
五、Sophon LLMOps 1.6:四維進化,催化AI × Data融合
星環科技在此次發布會上重點介紹了Sophon LLMOps 1.6平臺的四維進化,作為企業級AI基礎設施,Sophon LLMOps統一支撐空間管理、模型、算力管理、數據管理、通用工具,實現智能體驅動的AI全流程運營,實現了從數據到智能、從模型到應用的閉環升級,全面催化 AI × Data 的深度融合。
四大模塊協同:全生命周期統一管理
Sophon LLMOps平臺包含四大核心模塊:
星鑄(Model Foundry模型開發):支持主流HuggingFace大模型的一鍵導入、納管與部署,具備自動量化與推理加速能力。兼容多種國產GPU與推理引擎,適配企業級模型多環境管理需求。助力企業構建穩定、安全、高效的模型基礎能力;
星典(Knowledge Lodge知識工程):提供從知識構建、審核、發布到優化的全流程管理能力,支持多源知識融合與企業級知識體系建設。強化知識治理與問答應用的支撐能力,是AI理解業務語義的核心模塊;
星解(Corpus Studio語料工程):新增數據資產化、文件編目與分布式語料處理能力,幫助企業快速準備訓練數據。支持語料標準化、自動標注、協同審核,是高質量數據供給的核心支撐平臺;
星構(Agent Go應用開發):支持智能體(Agent)、應用鏈與插件的靈活編排與部署,全面兼容MCP協議。新增數據解析、知識工程等智能體,讓模型能力快速集成進業務系統,推動AI在各類場景中真正落地。
Sophon LLMOps還具備企業級AI基礎設施管理能力,提供對空間、工具、算力、模型、數據的統一管理,支撐大模型從開發到部署全過程的有序運行。這一能力使得AI能力成為企業級資產,具備可監管、可配置、可復用等特性。
一站式解決企業六大痛點
Sophon LLMOps平臺通過全生命周期統一管理,一站式解決了企業在AI應用開發過程中面臨的六大痛點:
「難」:多模型適配難:通過統一的模型管理和適配機制,簡化了多模型的使用和集成;
「缺」:算力永遠缺:提供高效的算力管理和調度能力,優化算力資源利用。;
「難」:語料供給難:通過星解模塊提供專業的語料工程能力,解決語料供給問題;
「差」:準確度差:結合知識工程和模型優化,提高AI應用的準確度和可靠性;
「難」:新需求VS舊能力:大模型人工智能硬件需求、軟件開發、應用、人才要求和傳統軟件都不一樣;
「貴」:應用分散建設成本高。
通過這一平臺,企業可以構建各種智能應用,如客服助手、合規助手、財務分析、數據分析和決策助手等,滿足不同部門的業務需求。企業級管理能力,讓AI從分散開發走向統一運營,實現資源可控、流程可管、資產可用,加速AI在企業中的規模化落地。
六、星環科技新一代AI Infra的行業應用案例
從理論到實踐 星環科技的新一代AI Infra不僅在技術上實現了突破,更在實際應用中展現了強大的價值。
實時湖倉集一體:一體化構建AI × Data 實現端到端秒級數據分析
在此之前,用戶使用CDH、Hbase、Hive、Clickhouse等多個開源產品來實現多業務場景,存在數據冗余、處理鏈路長、時效性差等問題,通過星環科技構建實時湖倉集一體平臺,可以基于一個平臺同時支持傳統數據應用、實時數據洞察和AI大模型應用。
遷移到星環實時湖倉集一體平臺后,在傳統數據應用方面,整體性能大幅提升。例如在交易報表場景中,批處理性能提升1倍,在大屏駕駛艙場景中,OLAP分析性能提升高達10倍。
同時,星環科技實時湖倉集一體平臺的實時入庫、秒級分析能力可以助力金融機構實現實時數據洞察,例如在實時風控場景,可以實現秒級延時,數據落地即分析,助力金融更快地識別風險和采取應對措施;在手機銀行場景,每服務器可支持2000QPS的高并發在線數據服務;在CRM等場景,星環科技實時湖倉集一體可支持HTAP的混合負載能力,避免數據搬遷帶來的延時,助力金融機構實現更快的服務響應。
此外,用戶可以AI-ready data platform快速構建大模型應用,例如基于星環科技數據分析助手無涯·問數,可以實現自然語言做數據分析,并且準確率達到95%以上;在智能營銷方面,過去需要幾天來做的數據處理和報告整理,基于星環科技知識平臺構建營銷助手只需要幾分鐘即可實現數據處理和報告生成,大幅提高金融機構營銷效率。
金融機構:打造企業級知識庫,為大模型應用輸送高質量語料
在銀行業的應用中,星環科技幫助某銀行打造了企業級知識庫,解決了數據治理工程復雜、企業構建應用中缺乏高質量數據與語料、數據孤島和領域知識匱乏等挑戰。
通過星典Knowledge Lodge和星解Corpus Studio,結合Sophon LLMOps平臺,構建了統一 的企業級知識工程平臺,實現了知識資產的定義、管理、構建和存儲全流程管理。最終形成了"4+1"知識庫體系,包括指標、制度、運營、客服四大場景知識庫和金融行業通用知識庫, 支持智能問答、信貸助手、行業研究、代碼生成、財務分析、風險分析、智能營銷、智能軟件工程、數字辦公和科研檢索等多種知識應用。
這一案例充分體現了"AI × 企業私有數據"的核心理念,通過高質量的企業知識庫,打造了銀行業的核心競爭力。
數據治理:AI賦能,實現全面自動化
星環科技在 AI 數據治理領域,以知識工程為核心,構建了一套全面自動化、高效且精準的解決方案,助力企業實現數據價值的深度挖掘與高效利用。星環科技語料平臺星解Corpus Studio,支持多源數據采集 ,PDF、Word 文檔及其他多種格式文件,無論來自網站公布的行業動態,還是企業內部規范,都能一站式匯聚,為后續的數據處理提供豐富素材,同時可以對采集到的語料進行深度解析,精準提取標準名稱、編號、發布單位等關鍵信息,并依據內容類別進行智能分類,形成高質量語料。
星環科技知識工程平臺星典Knowledge Lodge進一步解析語料正文、表格、圖片等信息,運用先進的 AI 技術精準抽取數據項、數據定義等關鍵知識要素,抽取的知識被整合進知識庫,形成標準化、體系化的知識資產。知識庫涵蓋數據字典、數據質量規則等豐富內容,為企業數據治理提供知識支撐,同時支持知識的更新與維護,確保知識的時效性與準確性。
星環科技將各類數據治理工具封裝為 AI 數據治理 MCP Server,實現 AI 與數據治理的無縫融合。憑借深度智能驅動,數據治理工具得以高效運作,這不僅突破了傳統數據治理的局限,更將智能化水準推向新高度,極大地提升了整體工作效率,為數據治理領域樹立了智能化的新標桿。
M域和O域統一視角:高效融合實現價值創新
星環科技時序數據庫Timelyre可以實現PB級實時時序數據分析,并且可以直接進行機器學習。
不僅如此,基于星環科技統一技術架構,實現時序數據和關系型數據的統一存儲和庫內跨模型融合分析,幫助企業構建M域(如ERP、CRM)和O域(如運維、監控、設備)的統一數據視角,更好地支撐經營決策、質量管控、供應鏈優化與運維監控等多種場景的數據和業務價值實現。
這一案例場景展示了星環科技多模數據融合與實時分析如何為企業創造新的價值,通過打破數據孤島,實現了管理和生產的深度協同。
七、星環科技引領新一代企業AI基礎設施新時代
星環科技此次發布的新一代AI Infra,不僅是一系列技術產品,更是企業競爭力重構的重要支撐。通過"AI × Data"的創新理念,星環科技為企業提供了從數據到知識、從模型到應用的全鏈路解決方案,幫助企業在AI時代重構競爭力。
在當前大模型技術日益普及的背景下,星環科技敏銳地洞察到高質量數據將成為企業差異化競爭的關鍵。通過AI-Ready Data Platform的五大核心能力,實現從數據產生到應用于AI的全過程數據管理,一站式助力企業更高效地運用AI釋放數據價值;通過Sophon LLMOps平臺的四維進化,企業可以構建高質量的AI應用,解決多模型適配難、算力永遠缺、語料供給難、準確度差和企業架構規劃難、應用分散建設成本高等六大痛點。
從銀行業的企業級知識庫建設,到數據治理的全面自動化,再到M域和O域的統一視角,星環科技的解決方案已在多個行業展現了強大的價值。這些成功案例不僅驗證了星環科技新一代AI Infra的可落地性,更展示了AI與數據融合為企業創造的實際價值。
展望未來,隨著AI技術的不斷發展和數據管理能力的持續提升,AI與數據的深度融合將重塑企業競爭格局。星環科技的新一代AI Infra為這一趨勢提供了技術基礎和實踐路徑,幫助企業在 AI時代贏得未來。
"企業落地AI是競爭力重構",在這個過程中,星環科技將繼續發揮技術引領者的作用,為企業提供全棧式的AI基礎設施解決方案,助力企業實現真正的智能化轉型。
《電鰻快報》
相關新聞