无码人妻精品一区二区三18禁,影音先锋男人AV橹橹色,污污污污污污www网站免费,日韩成人av无码一区二区三区,欧美性受xxxx狂喷水

技術揭秘|TDgpt 如何讓時序數據庫原生支持 AI?

昨天,我們重磅發布并開源了新一代時序數據分析 AI 智能體 TDgpt,這是(shi) TDengine 3.3.6.0 的核心亮點功能(neng)之一(yi)。作為時序數據庫(ku)原(yuan)生(sheng)集成 AI 能(neng)力的全新嘗試,TDgpt 將統(tong)(tong)計分析、機器學習、大(da)(da)模型等(deng)技術通過 SQL 統(tong)(tong)一(yi)封裝,極大(da)(da)降低了復雜(za)算法在業務中的應(ying)用(yong)門(men)檻。本文將帶你深入了解 TDgpt 背后的技術設計與實現細節。

打通 AI 與數據庫的最后一公里

在時序數據預測分析、異常檢測、數據補全和數據分類等(deng)應(ying)用領域(yu),研究人員提出(chu)并(bing)開發了(le)眾多(duo)具有不同技術特點、適用于不同場景的時序(xu)數(shu)(shu)據分析算法,已被廣泛應(ying)用在(zai)時序(xu)數(shu)(shu)據預(yu)測、異常檢測等(deng)任務中。

這類分析算法通(tong)常以高(gao)級(ji)編程語言(yan)(Python 語言(yan)或(huo) R 語言(yan))工具(ju)包的(de)(de)形式存在(zai),并通(tong)過開(kai)源的(de)(de)方式廣泛分發和使用(yong),這種應用(yong)模式極大地便(bian)利(li)了(le)軟件開(kai)發人(ren)員在(zai)應用(yong)系統中調用(yong)復雜的(de)(de)分析算法,大大降低了(le)使用(yong)高(gao)級(ji)算法的(de)(de)門檻。

與此同時,數(shu)據庫(ku)(ku)系(xi)統的(de)研(yan)發也在不斷演進(jin)。許(xu)多(duo)開(kai)發者(zhe)嘗試(shi)將數(shu)據分(fen)析(xi)(xi)算法(fa)模型整合到(dao)數(shu)據庫(ku)(ku)系(xi)統中,例如通過建立 Machine Learning 庫(ku)(ku)(如 Spark 的(de)機器學習庫(ku)(ku)),進(jin)一步提升數(shu)據庫(ku)(ku)和(he)分(fen)析(xi)(xi)計算引擎的(de)智能化分(fen)析(xi)(xi)能力。

隨著人(ren)工智能(neng)的(de)快速發展,時序(xu)數(shu)據分析也迎來(lai)了(le)全新的(de)機遇。如何(he)更(geng)高(gao)效、更(geng)靈活地將(jiang) AI 能(neng)力(li)應(ying)用于時序(xu)數(shu)據場景,成(cheng)為數(shu)據庫發展的(de)重要方(fang)向。

為此,濤思數據創新性地提出了時序數據分析 AI 智能體 TDgpt。通(tong)過 TDgpt,用(yong)戶只需使用(yong) SQL 語(yu)句,即可調用(yong)適配及整合驅動(dong)統計分(fen)析(xi)算法(fa)、機器學習算法(fa)模(mo)型、深度學習模(mo)型、時序數據基礎模(mo)型以及大語(yu)言(yan)模(mo)型,并(bing)將這些分(fen)析(xi)能(neng)力轉化為 SQL 語(yu)句的(de)調用(yong),通(tong)過異常檢(jian)測窗口和(he)預測函數的(de)方(fang)式應(ying)用(yong)在時序數據上。

TDgpt 技術特點

TDgpt 是與 TDengine 主進程 taosd 適配的外(wai)置式(shi)時序(xu)數據高級(ji)分析系(xi)統,能夠將時序(xu)數據分析服務無縫集成在(zai) TDengine 的查詢(xun)執行(xing)流程中。

作為一個無狀態的(de)平(ping)臺化時(shi)序(xu)(xu)數(shu)據(ju)分析平(ping)臺,TDgpt 內置了(le)經典的(de)統計分析模(mo)型庫 Statsmodel,內嵌(qian)了(le) torch/Keras 等機器/深度學習框架庫,此外它還(huan)能(neng)通過請求轉發(fa)和適配的(de)方(fang)式(shi)直接調用濤思數(shu)據(ju)自研的(de)時(shi)序(xu)(xu)數(shu)據(ju)基礎大(da)模(mo)型 TDtsfm (TDengine time series foundation model)。作為一個分析整(zheng)合(he)應用平(ping)臺,TDgpt 后(hou)續還(huan)將整(zheng)合(he)第三方(fang)時(shi)序(xu)(xu)數(shu)據(ju)大(da)模(mo)型服務,僅修改(gai)一個參數(shu)(algo)就(jiu)能(neng)夠(gou)調用最先進的(de)時(shi)序(xu)(xu)模(mo)型服務。

TDgpt 擁有高(gao)度(du)開(kai)放的(de)架構,用(yong)(yong)戶可按需接入(ru)自定義的(de)預(yu)測分(fen)析(xi)、異常檢測、數據(ju)(ju)補全、數據(ju)(ju)分(fen)類算(suan)(suan)法(fa)(fa),添加(jia)完成后,僅通(tong)過(guo)修改(gai)(gai) SQL 語句中調用(yong)(yong)的(de)算(suan)(suan)法(fa)(fa)參數就能夠無縫使用(yong)(yong)新加(jia)入(ru)的(de)算(suan)(suan)法(fa)(fa),整個過(guo)程無需修改(gai)(gai)一行代碼(ma)。

TDgpt 系統架構

TDgpt 由若干個無狀態的分析節點 Anode 構成(cheng),用(yong)戶可按需在系統集群中部署 Anode 節點,也可以根據分(fen)析(xi)模型算法的(de)特(te)點,將 Anode 部署在合適的(de)硬(ying)件環境中,例如帶有 GPU 的(de)計(ji)算節點。

TDgpt 為所(suo)有分析算法提(ti)供統一的(de)調用(yong)接口和(he)標準化的(de)調用(yong)方式。系統會根據用(yong)戶請求(qiu)的(de)參數,自動(dong)匹(pi)配并調用(yong)高級分析算法包及其他(ta)的(de)分析工具,并將分析獲得的(de)結果按照約定方式返回給 TDengine 的(de)主進(jin)程 taosd。

整個 TDgpt 系統由(you)四個關鍵(jian)模塊構成:

  • 第一部分是內置分析庫,包括 statsmodels, pyculiarity, pmdarima 等,提供可以直接調用的預測分析和異常檢測算法模型;
  • 第二部分是內置的機器學習庫(包括 torch,keras,scikit-learn 等),用于驅動預訓練完成的機器(深度)學習模型在 TDgpt 的進程空間內運行。預訓練的流程可以使用 Merlion/Kats 等開源的端到端機器學習框架進行管理,并將完成訓練的模型上傳到 TDgpt 指定目錄即可;
  • 第三部分是通用大語言模型的請求適配模塊。將時序數據預測請求轉換后,基于 Prompt 向 DeepSeek,LlaMa 等通用大語言模型 MaaS 請求服務(這部分功能暫未開源);
  • 第四部分是通過 Adapter 直接向本地部署的 Time-MoE、TDtsfm 等時序數據模型請求服務。時序數據專用模型相對于通用語言大模型,無需 Prompt,更加便捷輕量,本地應用部署對硬件資源要求也較低;除此之外,Adapter 還可以直接請求 TimeGPT 這種類型的時序數據分析 MaaS 服務,調用云端的時序模型服務提供本地化時序數據分析能力。
技術揭秘|TDgpt 如何讓時序數據庫原生支持 AI? - TDengine Database 時序數據庫

查詢(xun)過程(cheng)中(zhong),TDengine 中(zhong)的 Vnode 會將(jiang)涉及時序數(shu)據高(gao)級(ji)分析的部分直接(jie)轉發到 Anode,并等(deng)待分析完(wan)成后(hou)將(jiang)結(jie)果組裝完(wan)成,嵌入查詢(xun)執行流(liu)程(cheng)。

時序數據分析服務

使用(yong) TDgpt 提供的時序數據分析服(fu)務,用(yong)戶可(ke)以通過 SQL 語句輕松實(shi)現以下功能:

  • 時序數據異常檢測:TDengine 引入了新的時間窗口——異常(狀態)窗口——來提供異常檢測服務。異常窗口可以視為一種特殊的事件窗口(Event Window),即異常檢測算法確定的連續異常時序數據所在的時間窗口。與普通事件窗口區別在于——時間窗口的起始時間和結束時間均是分析算法確定,不是用戶指定的表達式判定。異常窗口使用方式與其他類型的時間窗口(例如狀態窗口、會話窗口等)類似。因此時間窗口內可使用的查詢操作均可應用在異常窗口上。
  • 時序數據分析預測:TDengine 新增 FORECAST 函數,支持基于歷史時序數據,調用指定(或默認)的預測算法,生成未來時間段的預測結果,用戶可通過 SQL 直接完成預測分析任務。
  • 時序數據補全:研發測試中預計 2025 年 7 月發布
  • 時序數據分類:研發測試中,預計 2025 年 7 月發布

自定義分析算法

TDgpt 是(shi)一個可擴展的時序數據高級(ji)分析(xi)(xi)平臺,用(yong)(yong)戶只需按(an)照簡單的流程,就可以將自(zi)定義的分析(xi)(xi)算(suan)法接入到(dao)分析(xi)(xi)平臺,并通過 SQL 語(yu)句直接調用(yong)(yong),實現“零門檻”使(shi)用(yong)(yong)高級(ji)分析(xi)(xi)能力。新引入的算(suan)法或模型無需對應用(yong)(yong)層(ceng)做任何改動,極大(da)提升了集成效率(lv)。

目前,TDgpt 只(zhi)支(zhi)持使用 Python 語言(yan)開發的(de)(de)分析算(suan)法。其(qi)分析節點 Anode 采(cai)用 Python 類動態(tai)加載模式,在啟動的(de)(de)時候(hou)掃描特定目錄(lu)內(nei)滿足約定條件(jian)的(de)(de)所有代碼(ma)文(wen)件(jian),并將其(qi)加載到(dao)系統(tong)中。因此,開發者只(zhi)需(xu)要遵(zun)循以(yi)下幾步就能(neng)完成新算(suan)法的(de)(de)添(tian)加工作(zuo):

1. 編(bian)寫符(fu)合規范的分析算法類;

2. 將代(dai)碼文(wen)件放入對(dui)應目錄(lu),并重(zhong)啟(qi) Anode;

3. 使用 SQL 命令更新算法(fa)緩存列表。

完成(cheng)上述步驟后(hou),新算法即(ji)(ji)可通(tong)過 SQL 語(yu)句立即(ji)(ji)調(diao)用,輕松集成(cheng)至各類時序(xu)數(shu)據(ju)分(fen)析任(ren)務中。

算法評估工具

TDgpt 企(qi)業版還(huan)提供(gong)針對多種算法模型(xing)(xing)有(you)效性的(de)綜合評(ping)估(gu)工具。該工具可以針對 TDgpt 可調用所有(you)時(shi)序(xu)數據(ju)(ju)分(fen)析(預測(ce)分(fen)析與異(yi)常檢測(ce))服務,包括內置數據(ju)(ju)分(fen)析算法模型(xing)(xing),已(yi)部署(shu)的(de)預訓練機(ji)器(qi)學(xue)習模型(xing)(xing)、第三方(fang)時(shi)序(xu)數據(ju)(ju)(大)模型(xing)(xing)服務,基(ji)于 TDengine 中的(de)時(shi)序(xu)數據(ju)(ju)進行預測(ce)分(fen)析對比和異(yi)常檢測(ce)對比評(ping)估(gu),并給出量化指(zhi)標(biao)評(ping)估(gu)不同分(fen)析模型(xing)(xing)在(zai)給定數據(ju)(ju)集上的(de)準確度及性能。

模型管理

對(dui)于 Torch/Tensorflow/Keras 等(deng)機器學(xue)習庫框架驅動(dong)(dong)的預訓練(lian)模型(xing),只需將已完成訓練(lian)的模型(xing)文件放(fang)入 Anode 指定目錄,Anode 可以(yi)自(zi)動(dong)(dong)調用(yong)該目錄內的模型(xing),驅動(dong)(dong)其運行并提供(gong)服務(wu)。

在(zai)企業版 TDgpt 中,還提供了模型管理功能,支(zhi)持與(yu) Merlion、Kats 等開源的端到端時(shi)序數(shu)據(ju)機器學習框(kuang)架無縫(feng)集成,方便用(yong)戶統一(yi)管理和部署多種預訓練模型。

處理能力

通常(chang)意義上(shang),時序(xu)數據分析本質上(shang)是高度計算密集型任務,因此(ci)可(ke)以通過部署(shu)更高性能的 CPU 或(huo) GPU 來(lai)提升整體處(chu)理效(xiao)率。

對(dui)于依(yi)賴(lai) torch 等(deng)框架運行(xing)的(de)(de)機(ji)器學(xue)習(xi)或深度(du)學(xue)習(xi)模(mo)型,可(ke)以(yi)采用(yong)標準(zhun)的(de)(de)提(ti)(ti)升(sheng)(sheng)分析處理能(neng)力的(de)(de)方案來(lai)提(ti)(ti)升(sheng)(sheng) TDgpt 的(de)(de)服(fu)務(wu)能(neng)力,例如(ru)將 Anode 部署在內存更大(da),并(bing)具有 GPU 的(de)(de)服(fu)務(wu)器之上(shang),使用(yong)可(ke)調用(yong) GPU 的(de)(de) torch 庫驅(qu)動模(mo)型運行(xing),以(yi)提(ti)(ti)升(sheng)(sheng)分析響(xiang)應(ying)能(neng)力。

同(tong)(tong)時,不同(tong)(tong)的模型(xing)和(he)算(suan)法也可以按需部署在不同(tong)(tong)的 Anode 節(jie)點上,實現并行處理,進(jin)一步(bu)增強系統(tong)的整體(ti)分析能(neng)力和(he)擴(kuo)展性。

運營維護

開源(yuan)版本的 TDgpt 不包含用(yong)戶權(quan)限(xian)管理(li)和資源(yuan)控制機制。系(xi)統默認采用(yong) uWSGI 驅(qu)動(dong) Flask 服務(wu),運(yun)維人員(yuan)可通過開啟(qi) uWSGI 端口,對服務(wu)運(yun)行狀態(tai)進行實時監控。

目前,TDgpt 的核心功能已隨 TDengine 3.3.6.0 正式發布,并同步開源。無論你是希望通過 SQL 快速接入 AI 能力的應用開發者,還是希望靈活集成自定義模型的數據科學家,TDgpt 都為你提供了一個強大、開放、易用的時序數據智能分析平臺。想了解更多技術細節和使用方式,歡迎訪問官網查看完整介紹://yakult-sh.com.cn/tdgpt