无码人妻精品一区二区三18禁,影音先锋男人AV橹橹色,污污污污污污www网站免费,日韩成人av无码一区二区三区,欧美性受xxxx狂喷水

TDengine IDMP 應用場景:IT 系統監控

TDengine IDMP 應用場景:IT 系統監控

1. 簡介

本文以一個數據中心的服務器監控為例,詳細介紹通過開源的輕量級的工具 Telegraf ,輕松采集系統 CPU、內存、磁盤、網絡等系統監控指標,將數據寫入 TDengine TSDB 時序數據庫,然后通過 TDengine IDMP,利用 AI 自動(dong)生(sheng)成可(ke)視化面板和(he)實時分析,幫助您(nin)幾分鐘就(jiu)構建一套(tao)穩定、高效的服務器監控解決(jue)方案(an)。

在這個方案中,TDengine TSDB + TDengine IDMP 的組(zu)合能夠(gou)為您帶(dai)來四大好處:

  1. 輕松完成數據導入:TDengine IDMP 與 TDengine TSDB 無縫集成,當監控數據寫入 TSDB 后,能夠快速導入 IDMP 并以樹形結構的方式展現被監控的物理機和虛擬機,IT 資產一目了然。
  2. 無問智推,數據自己說話:不用在 TDengine 側做任何配置,不用腳本,不用提問,IDMP 會基于采集的數據,自動判斷為 IT 監測場景,自動為您推薦面板和實時預警,服務器的運行狀態盡在掌控之中。
  3. 智能問數,隨問隨答:不用 SQL,不用任何腳本語言,你只要用自然語言說出感興趣的數據分析或監測面板,IDMP 將會自動幫您創建,把數據可視化與分析的使用門檻降為 0;
  4. 如果添加新的被監測的服務器,只要配置好 Telegraf, 在 TDengine 側不用做任何設置和操作,服務器就被自動的加入到監測的對象中,最大程度節省人力。

2. 前提條件

  • TDengine 云服務實例,如果您沒有可用的 TDengine 云服務實例,可以
  • 一個被監控的服務器,假設其具如下物理信息:
    • 所在位置:IDC01
    • 機架號:RACK02
    • 機架上的槽位號:SLOT03
    • IP 地址:192.168.1.123

3. 配置指南

3.1 創建 IDMP 云服務實例

  1. 使用您的賬號,登錄 ,在彈出的 TDengine 實例選擇框中,選擇“IDMP(工業數據管理平臺)”。
  2. 在實例配置頁面,分別配置 IDMP 實例和 TSDB 實例的信息和計費方案:
    • IDMP(工業數據管理平臺):
      • 實例名稱:telegraf-idmp
      • 計費方案:IDMP-入門版
    • TSDB(時序數據庫)
      • 實例名稱:telegraf-tsdb
      • 計費方案:入門版
  3. 等待 IDMP 實例啟動后,選擇加載一個場景的示例數據,即可進入 IDMP 云服務的主頁面。

說明:TDengine IDMP 服(fu)務默認使用 TDengine TSDB 作(zuo)為其數據源,在 IDMP 云服(fu)務實例創建(jian)過程中,會自(zi)動(dong)創建(jian)到上(shang)述 TSDB 的連接。

3.2 在 TSDB 云服務實例創建 DB

  1. 進入 IDMP 云服務實例的主頁面后,點擊右上角下拉菜單中的【管理后臺】。
  2. 在管理后臺頁面點擊【云資源管理】,進入云資源管理頁面。
  3. 在實例列表中,請記錄訪問 TDengine TSDB 實例的 Gateway URL 和令牌 (token),以備稍后配置 Telegraf 時使用。
  4. 在實例列表中找到 telegraf-tsdb 實例,點擊【TSDB 云服務】,進入 TSDB 云服務頁面。
  5. 在左側點擊【數據瀏覽器】,在數據瀏覽器頁面點擊【創建數據庫】。
  6. 設置數據庫名稱為 telegraf,完成 DB 創建。

3.3 在被監控服務器上安裝 Telegraf

在被監控的服務(wu)其上(shang),通過(guo)以下命令(ling),即可(ke)安裝 :

curl -sL //repos.influxdata.com/influxdb.key | sudo apt-key add -
echo "deb //repos.influxdata.com/ubuntu $(lsb_release -cs) stable" | \
  sudo tee /etc/apt/sources.list.d/influxdb.list
sudo apt-get update
sudo apt-get install telegraf

3.4 配置 Telegraf

執行以下命令(ling),生成 Telegraf 的配(pei)置文件:

cat << EOF | sudo tee /etc/telegraf/telegraf.conf
[global_tags]
  location = "IDC01"
  rack_num = "RACK02"
  slot_num = "SLOT03"
  ip_address = "192_168_1_123"
  servers = "IDC01.RACK02"



[agent]
  # 所有輸入的默認數據收集間隔
  interval = "10s"
  # Telegraf將指標發送到大多數metric_batch_size指標的批量輸出
  metric_batch_size = 1000
  # Telegraf將緩存metric_buffer_limit每個輸出的指標,并在成功寫入時刷新此緩沖區。這應該是倍數 metric_batch_size不能少于2倍metric_batch_size
  metric_buffer_limit = 10000
  # 集合抖動用于隨機抖動集合。插件在收集之前將在抖動內隨機休眠一段時間。可以用來避免許多插件同時查詢sysfs之類的東西,這會對系統產生可測量的影響。
  collection_jitter = "0s"
  # 所有輸出的默認數據刷新間隔。您不應將此設置為以下間隔。最大值flush_interval為flush_interval+flush_jitter
  flush_interval = "10s"
  # 將刷新間隔抖動一個隨機量。主要是為了避免運行大量Telegraf實例的用戶出現大量寫入峰值。
  flush_jitter = "0s"

[[inputs.cpu]]
  name_override = "server_cpu"
  percpu = false
  totalcpu = true
  [inputs.cpu.tags]
    metric_tag = "SLOT03_cpu"

[[inputs.mem]]
  name_override = "server_memory"
  fieldpass = ["used_percent", "available", "total", "used", "cached", "free"]
  [inputs.mem.tags]
    metric_tag = "SLOT03_memory"

[[inputs.disk]]
  name_override = "server_disk"
  fieldpass = ["used_percent", "available", "total", "used", "cached", "free"]
  [inputs.disk.tags]
    metric_tag = "SLOT03_disk"

[[inputs.nstat]]
  name_override = "server_network"
  fieldpass = ["TcpInSegs", "TcpOutSegs", "TcpRetransSegs", "UdpInDatagrams", "UdpOutDatagrams"]
  [inputs.nstat.tags]
    metric_tag = "SLOT03_network"

[[inputs.processes]]
  name_override = "server_processes"
  fieldpass = ["total", "running", "sleeping", "stopped", "zombies"]
  [inputs.processes.tags]
    metric_tag = "SLOT03_processes"

[[inputs.system]]
  name_override = "server_system"
  fieldpass = ["load1", "load5", "load15", "uptime", "n_cpus", "n_users"]
  [inputs.system.tags]
    metric_tag = "SLOT03_system"

[[outputs.http]]
  url = "//<gateway-url>/influxdb/v1/write?db=telegraf&token=<gateway-token>&table_name_key=metric_tag"
  method = "POST"
  timeout = "5s"
  data_format = "influx"
  [outputs.http.headers]
    Content-Type = "application/x-www-form-urlencoded"
EOF

說明:

  • 在 global_tags 小節,配置了服務器的基本信息,其中 path 標簽用來標識元素的路徑,例如這里設置的 IDC01.RACK02,導入 TDengine IDMP 后,在元素瀏覽器中,將以樹形結構展開為 IDC01 -> RACK02
  • 在 agent 小節,配置了 Telegraf 的采集頻率等信息。
  • 在輸入插件小節,開啟了對 CPU, 內存,磁盤等的監控,每個指標均配置了 metric_tag 標簽,其應具有唯一性,這里選用了 slot number + metric name 的形式,結合 global_tags 小節的 path, 即可唯一確定某個服務器的一個監控指標;
  • 在輸出插件小節,配置將監控指標通過 taosadapter 寫入 TDengine TSDB
    • 每種類型的輸入指標,在寫入 TSDB 時,都會寫入一個超級表 (stable)
    • url 中的 db 為在 3.2 小節創建的 DB 的 telegraf
    • url 中的 <gateway-url> 和 <gateway-token> 為訪問 TDengine TSDB 實例時所需的 Gateway 信息,請替換為 3.2 小節記錄的 TDengine TSDB 實例 Gateway 的 URL 和 Token
    • 參數 table_name_key=metric_tag 將把 metric_tag 作為子表名,寫入 TSDB 時將不再包含這個標簽

3.5 啟動 Telegraf

完成配置后(hou),使用以下(xia)命令啟動 Telegraf:

sudo systemctl start telegraf

使用以(yi)下命(ming)令,查看 Telegraf 服務狀態:

sudo systemctl status telegraf

如果服務的狀態為 active (running), 則說明 Telegraf 服(fu)務已啟動成功。

如果(guo)期望監(jian)控(kong)多(duo)個物理機或虛擬機,僅需重復以(yi)上步驟即可。

3.6 在 IDMP 中加載 Metrics 數據

通過以(yi)(yi)下步驟,將 TDengine TSDB 的數據加(jia)載至(zhi) TDengine IDMP 以(yi)(yi)創(chuang)建(jian)面板和(he)分(fen)析:

  • 登錄 IDMP 實例,在管理后臺找到 telegraf-tsdb 連接。
  • 在 telegraf-tsdb 連接頁面上方的導航欄中,選擇【數據導入】。
  • 在數據導入配置頁面,選擇 telegraf 數據庫。
  • 檢查所有超級表的 Tags 配置項,選擇 path 列做為每個超級表的 Tree。
  • 點擊【完成】,等待數據導入任務完成。

3.7 查看元素信息

導入至 TDengine IDMP 的(de)服務(wu)器監控指標,會以樹形(xing)結(jie)構的(de)方式展示,可以根據其物(wu)理信息一層(ceng)層(ceng)展開(kai),便(bian)于查看:

  • 看到導入完成的提示后,點擊主菜單【元素瀏覽器】,跳轉至元素瀏覽器頁面。
  • 在左側資源瀏覽器中,IDMP 會自動根據服務器的物理信息,以樹形結構的方式展示服務器的監控指標。在這里,依次展開 path -> IDC01 -> RACK02 -> SLOT03_cpu,通過上方路徑導航菜單選擇【屬性】,查看 TDengine TSDB 中存儲的 SLOT03 物理機 CPU 資源指標。

3.8 體驗 AI 生成面板

  • 在左側資源瀏覽器中,點擊 path -> IDC01 -> RACK02 -> SLOT03_cpu 元素,跳轉至該元素的 AI 推薦面板頁面。
  • 等待 AI 生成面板推薦后,您可根據需求進行選擇,例如:“過去一小時 CPU 空閑利用率(usage_idle)每分鐘的變化趨勢,折線圖”,在您感興趣的面板右上方的菜單中,點擊【生成】按鈕。
  • 等待面板生成后,在面板右下角點擊【保存】,即可在下方面板列表中查看 SLOT03_cpu 元素下對應的面板。
  • 面板生成后,您還可以在該面板的詳情頁面中,查看 AI 創建面板時,使用的 SQL 語句:
SELECT _wstart,AVG(`usage_idle`) AS `usage_idle`
FROM `idmp`.`vt_SLOT03_cpu_573105`
WHERE  _c0 >= now-1h and _c0 <= now INTERVAL(1m) SLIDING(1m) 

3.9 體驗 AI 分析

  • 在左側資源瀏覽器中,點擊 path -> IDC01 -> RACK02 -> SLOT03_cpu 元素,通過上方路徑導航菜單選擇【分析】,跳轉至該元素的 AI 推薦分析頁面。
  • 等待 AI 生成分析問題推薦后,您可以根據需求進行選擇,例如:“physical_cpu:SLOT03_cpu 的實時 usage_system 超過 80%持續超過 10 分鐘時,常規告警,計算平均 usage_system,事件窗口”,點擊您感興趣的問題鏈接,以進入分析編輯頁面,點擊頁面最下方的【保存】。
  • 退回到分析列表中,即可查看對應的分析。

4. 更多

除了使用云服務以外(wai),TDengine 還支持(chi)以私有化(hua)部署。為了簡化(hua)部署,我們提供了 Ansible, Docker/Dcoker Compose, Helm 等多(duo)種部署方式,詳見:

5. 配置 Telegraf 小技巧

  • 與正常配置 Telegraf 不一樣的是,需要把給監測的對象(服務器、虛擬機、應用等) 配置一個路徑標簽 (path),把資源的層次結構在標簽里描述出來,中間用 “.” 進行分割,比如 “IDC01.RACK02.SLOT01″, 這樣就可以對每一級的資源進行統計監測。而且還可以配置多個層次結構標簽,便于從不同維度進行管理,比如”OS.Linux.Ubuntu”, 從 OS 維度進行統計監測。
  • 在 Telegraf 的配置里,還需要配置好參數 metric_tag, 建議用一個有可讀性并具有唯一性的名字,它是被監測對象的名字。

6. 小結

本文以 Step by Step 的(de)方(fang)式,介紹了如何使用(yong) Telegraf + TDengine TSDB + TDengine IDMP 快速(su)搭建一(yi)個(ge) IT 監(jian)控(kong)系(xi)統(tong)。以往(wang)需(xu)(xu)要(yao)幾個(ge)小時、甚至幾天,并進行繁(fan)瑣的(de)配置(zhi)、調(diao)試(shi)才能(neng)搭建起來的(de)系(xi)統(tong),使用(yong) TDengine IDMP 后,僅需(xu)(xu)要(yao)幾分鐘即(ji)可(ke)搞定。日后,如果(guo)有新的(de)物理機、虛擬機需(xu)(xu)要(yao)被(bei)納入到監(jian)控(kong)系(xi)統(tong)中(zhong),只需(xu)(xu)在被(bei)監(jian)控(kong)系(xi)統(tong)部署 Telegraf 即(ji)可(ke)。

搭建整個監測系統的(de)工作(zuo)全部在(zai) Telegraf 的(de)配置上了,無(wu)需(xu)編寫復雜的(de) SQL 語句(ju),無(wu)需(xu)腳本(ben)和(he)其他配置,無(wu)需(xu)學習 Grafana, 無(wu)需(xu)了解多少(shao) IT 運維知識,即可輕(qing)松(song)掌握 IT 系統的(de)運行狀態,成為 IT 系統監測專家。