无码人妻精品一区二区三18禁,影音先锋男人AV橹橹色,污污污污污污www网站免费,日韩成人av无码一区二区三区,欧美性受xxxx狂喷水

一條SQL語句搞定半導體行業采集的μs級數據

潤石科技 Blues

2020-06-01 / ,

小 T 導讀:昆山潤石智(zhi)能科技(ji)是(shi)一(yi)家為半導體(ti)(ti)、泛半導體(ti)(ti)行(xing)業(ye)客(ke)戶提供智(zhi)能制造(zao)一(yi)站式解決方案。VMPC是(shi)潤石開發的(de)(de)智(zhi)聯網管(guan)理平(ping)臺,將IOT、BD、AI三環(huan)節打通、形(xing)成閉環(huan),從而解決數(shu)據(ju)孤島(dao)的(de)(de)問題。VMPC數(shu)據(ju)收集(ji)、業(ye)務邏輯(ji)、日志管(guan)理是(shi)分離的(de)(de),傳(chuan)感器采(cai)集(ji)的(de)(de)數(shu)據(ju),存儲在TDengine Database中(zhong)。潤石采(cai)用的(de)(de)傳(chuan)感器精度(du)很高,采(cai)集(ji)的(de)(de)數(shu)據(ju)是(shi)μs級別(bie)的(de)(de),TDengine Database是(shi)完全契合這一(yi)需求的(de)(de),支持(chi)時(shi)間精度(du)精確到μs。

場景介紹

VMPC是(shi)(shi)潤石(shi)開發的(de)(de)(de)智聯網管理(li)平(ping)臺,將集成(cheng)電(dian)路相關制(zhi)(zhi)程所需的(de)(de)(de)傳感器,依據實際(ji)工藝階段(duan)分門別類,將Leading Foundry的(de)(de)(de)經驗(yan)數字化、模型化,來滿足微(wei)影、蝕刻(ke)、薄膜(mo)、擴散(san)、離(li)子注(zhu)入(ru)、研磨(mo)、測(ce)試(shi)或是(shi)(shi)面板廠(chang)的(de)(de)(de)Array、Cell、CF、Module等物聯網需求,也對Facilities相關的(de)(de)(de)附屬設(she)備加以監控,以實現維護提醒(xing)、故(gu)障(zhang)報(bao)警(jing)和狀態預(yu)測(ce)等功能(neng)。VMPC是(shi)(shi)一(yi)套整體解決方案(an),更是(shi)(shi)一(yi)套定(ding)(ding)制(zhi)(zhi)化的(de)(de)(de)解決方案(an),最終的(de)(de)(de)方案(an)會根據工廠(chang)生產線和設(she)備的(de)(de)(de)實際(ji)情況,進(jin)行定(ding)(ding)制(zhi)(zhi)化的(de)(de)(de)二次開發。

潤石的(de)(de)(de)VMPC將IOT、BD、AI三環節打通、形成(cheng)閉環,從而(er)解決數(shu)據孤島的(de)(de)(de)問題。VMPC本質上是(shi)Data + Algorithm,Data是(shi)智聯網傳感器采集到(dao)的(de)(de)(de)數(shu)據,Algorithm是(shi)AI算(suan)法在特定領域創(chuang)新(xin)應(ying)用的(de)(de)(de)算(suan)法。可將流量(liang)(liang)、振動、壓力、溫(wen)度、速度等模(mo)擬量(liang)(liang),通過(guo)邊緣(yuan)端設(she)備進行采集,從來得到(dao)大量(liang)(liang)的(de)(de)(de)實(shi)時(shi)數(shu)據和(he)歷史數(shu)據,采用AI工(gong)具和(he)算(suan)法進行分析和(he)建模(mo),根據量(liang)(liang)測到(dao)的(de)(de)(de)數(shu)據監(jian)控設(she)備實(shi)時(shi)狀(zhuang)態,進而(er)做到(dao)預測維護(hu)。

一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
VMPC架構圖

VMPC數(shu)據收集、業務邏(luo)輯、日志管(guan)理是分離(li)的(de)(de),傳感器采集的(de)(de)數(shu)據,存儲在TDengine中(zhong),數(shu)據流向如(ru)下:

1)VBOX負責現場數據采集;

2)VBOX將數(shu)據(ju)發(fa)送到指定(ding)的(de)Server;

3)Server 后(hou)臺處理(li)程序(xu),將數據進(jin)行解析(xi)和處理(li);

4)根據(ju)(ju)客戶(hu)實際的場景選(xuan)擇算(suan)法模型,算(suan)法模型決定了(le)TDengine Database中庫和表的結構(gou)。解析和處理(li)之(zhi)后(hou)的數據(ju)(ju),存儲(chu)到TDengine中;

5)采集的數據一方面用來實時監控,另一方面用來報警和預測(ce)。

業務流程:

VMPC中AI的(de)Algorithm主要包括兩大類(lei),一是圖(tu)像(xiang)數(shu)據算法,二(er)是時序數(shu)據算法。如下(xia)圖(tu):

一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
圖像智能分析
一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
時序數據智能分析


而TDengine 時序數據庫專(zhuan)門(men)用于(yu)存(cun)儲(chu)時序數(shu)據。

良品率的(de)提升(sheng)涉及到(dao)查找(zhao)問題(ti)根因,根本原因隱藏在數(shu)據之(zhi)中。以時序數(shu)據場景為例(li),在設備(bei)的(de)眾多(duo)參數(shu)中,找(zhao)到(dao)關鍵參數(shu),從單一(yi)變量演化(hua)成多(duo)變量分(fen)析,從設備(bei)監(jian)視(shi)過渡到(dao)設備(bei)控制等。從針對某一(yi)類問題(ti)的(de)通用型產品,到(dao)可以定制化(hua)的(de)物聯網平臺。

業務流程抽象如下

生(sheng)產(chan)設(she)備 → 數據(ju)采集 → 實(shi)時展示 → 數據(ju)存儲(chu) → 數據(ju)分析 → 模型算法 → 生(sheng)產(chan)設(she)備

數據(ju)是模(mo)型和算(suan)法(fa)(fa)的(de)基礎,模(mo)型和算(suan)法(fa)(fa)挖(wa)掘(jue)數據(ju)的(de)價值。

快速實現MVP

舉一(yi)個項目作為示例(li):面板行業的(de)(de)(de)(de)Robot健康度管理及(ji)預測(ce)維(wei)護——對噪(zao)音(yin)、設備(bei)馬達(da)監控及(ji)預警。傳感器部署到(dao)(dao)現(xian)場控制設備(bei)上,收集(ji)設備(bei)的(de)(de)(de)(de)噪(zao)音(yin)與馬達(da)的(de)(de)(de)(de)振動的(de)(de)(de)(de)數(shu)(shu)據(ju)(ju),收集(ji)到(dao)(dao)的(de)(de)(de)(de)數(shu)(shu)據(ju)(ju)利用潤石自(zi)研的(de)(de)(de)(de)通訊(xun)技術(shu)(shu),將數(shu)(shu)據(ju)(ju)推(tui)送到(dao)(dao)存儲(chu)接(jie)口(kou),調用TDengine的(de)(de)(de)(de)jdbc的(de)(de)(de)(de)接(jie)口(kou)寫(xie)入(ru)(ru)數(shu)(shu)據(ju)(ju)。實(shi)時數(shu)(shu)據(ju)(ju)通過(guo)VMPC的(de)(de)(de)(de)應用軟件實(shi)現(xian)展(zhan)示。以上的(de)(de)(de)(de)流(liu)程可以很(hen)復雜,也(ye)可以很(hen)簡單。潤石已經(jing)有了一(yi)些(xie)積累,對于(yu)一(yi)些(xie)進入(ru)(ru)到(dao)(dao)某個行業的(de)(de)(de)(de)初創(chuang)企業,如果(guo)可以給(gei)一(yi)些(xie)建議的(de)(de)(de)(de)話,那就是(shi)快速的(de)(de)(de)(de)實(shi)現(xian)MVP,特別是(shi)在給(gei)客戶做PoC的(de)(de)(de)(de)階段。技術(shu)(shu)上需(xu)要哪幾部分呢?

1)傳感器,傳感器解析模(mo)塊;

2)TDengine,TDengine提(ti)供(gong)的寫入(ru)和查詢Demo;

3)Grafana,TDengine提(ti)供的Grafana插件。

一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
TDengine接口demo
一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
TDengine的Grafana DataSource插件

整個過程,真(zhen)正(zheng)需要寫的代(dai)碼(ma),不會超(chao)過500行(xing),然后通(tong)過一條(tiao)SQL語句,就完成了MVP的搭(da)建工作,也就可(ke)以是客戶(hu)演示了。

一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
Grafana中TDengine SQL查詢

數據的寫入和查詢

潤石采用的傳(chuan)感器精(jing)度(du)很高,采集(ji)的數據(ju)是μs級別的。TDengine默認的時間(jian)精(jing)度(du)為ms,只(zhi)需在(zai)建(jian)庫的時候(hou)指定precision us即(ji)可(ke)將時間(jian)精(jing)度(du)設置為μs,如下:


Create database testdb keep 365 precision ‘us’;

其中(zhong)keep 365表示保存一年的(de)數據,過期的(de)數據會被刪除,而(er)這個過程(cheng)全部由數據庫完成(cheng),不需要(yao)認為參與(yu)。只需要(yao)在項目之(zhi)初,硬(ying)件(jian)選型時預留足夠的(de)空間,就不用操心數據的(de)任何問題了。

由于業(ye)務(wu)的(de)具(ju)體場景(jing)不(bu)太(tai)方便過多(duo)的(de)設計,但是在使用TDengine的(de)過程中,使用超級表tag,僅需要一條SQL就可以(yi)檢索出需要的(de)數據,并進(jin)行對比:


select * from stb where ts > t1 and ts < t2 group by tag1;
一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
設備采集的數據

模型的訓練集

從(cong)事AI模(mo)型(xing)和算法(fa)研(yan)究的(de)人都比較清楚,數據處理的(de)流程如(ru)下。其中最寶(bao)貴的(de)就是數據的(de)訓練(lian)集(ji),訓練(lian)集(ji)的(de)好壞直接(jie)決定著(zhu)模(mo)型(xing)和算法(fa)的(de)成(cheng)敗。

一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
數據分析流程圖

很多公司新進入一個行業,最難(nan)的(de)不是(shi)技術(shu),而是(shi)拿到一些現(xian)場(chang)數據(ju)。如(ru)果有幸得(de)到PoC的(de)計劃(hua),有機會得(de)到實際生產(chan)環(huan)境(jing)中(zhong)的(de)數據(ju),如(ru)果數據(ju)量不足以(yi)訓(xun)練模(mo)型,TDengine的(de)降(jiang)維(down sample)聚合(he)功能可以(yi)用于(yu)產(chan)生訓(xun)練集數據(ju)。SQL語句如(ru)下(xia):

SELECT function FROM stb_name 
 [WHERE where_condition]
 INTERVAL (interval)
 [FILL ({ VALUE | PREV | NULL | LINEAR})]
 [GROUP BY tags]

聚合查詢中,當function取:avg、sum 、min、max、first、last、percentile的(de)(de)時候,就可以降頻之(zhi)后新的(de)(de)數(shu)據集。

原始數據如下

一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
原始數據

變換之后數據如下

一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
變換之后的訓練集(1)
一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
變換之后的訓練集(2)

在(zai)預測(ce)模(mo)型中,很(hen)多神經網絡模(mo)型都是Long Short Term Memory networks(以(yi)下簡稱LSTMs)的變換,LSTMs一種特殊的RNN網絡,該網絡設計出來是為(wei)了解(jie)決長依賴問題,非常適(shi)合設備維護和故障的預測(ce)。LSTMs的訓練(lian)集,通過TDengine做(zuo)降頻(pin)處(chu)理非常方便,可以(yi)在(zai)保證(zheng)樣本數的前提下,改變時間跨度:

一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
更改時間跨度的訓練集

TDengine應用中遇到的問題

1) 客戶端接口不是很方便

一條SQL語句搞定半導體行業采集的μs級數據 - TDengine Database 時序數據庫
C# 讀寫 demo 

2)指定是否可以顯示tag

我(wo)們查詢子表的時(shi)候,數據(ju)的tag是顯(xian)示不(bu)出來的。雖然可以使(shi)用group by tag將tag的值顯(xian)示出來,但(dan)是作為(wei)一個(ge)對(dui)技術有潔癖的工(gong)程師(shi)而言,我(wo)認為(wei)作為(wei)一個(ge)選項決定(ding)是否顯(xian)示tag值更為(wei)合(he)理(li)。

3)支持多表之間的聯合檢索

雖然內(nei)測的beta版功能(neng)已經實(shi)現(xian),希望(wang)盡快(kuai)發布出來,是用的人多了,產品才能(neng)更加穩(wen)定(ding)。

下一個發力點

潤石認為邊緣計算在半導體(ti)(ti)設(she)(she)備(bei)管(guan)理(li)上將(jiang)有更廣(guang)泛的(de)應用。整個(ge)半導體(ti)(ti)生產線(xian)離散程度高,各個(ge)設(she)(she)備(bei)間(jian)常存(cun)在兩兩互聯(lian)關系,而不(bu)管(guan)是設(she)(she)備(bei)之間(jian)還是單臺設(she)(she)備(bei)均需要較強的(de)算力來支持(chi)其(qi)反應速(su)度。

TDengine的(de)(de)ARM 32位(wei)版,為邊緣計(ji)算(suan)(suan)(suan)、嵌入式場景下(xia)時序數(shu)(shu)據(ju)的(de)(de)存儲、查詢、分(fen)析與計(ji)算(suan)(suan)(suan)提(ti)供一強(qiang)大的(de)(de)工(gong)具,以解決流(liu)行(xing)的(de)(de)SQLite在該場景下(xia)的(de)(de)諸(zhu)多不足,并(bing)且100%開源。并(bing)且提(ti)供數(shu)(shu)據(ju)庫遠程登錄(lu)功(gong)能、提(ti)供數(shu)(shu)據(ju)的(de)(de)生命周期管理(li)、提(ti)供流(liu)式計(ji)算(suan)(suan)(suan)、提(ti)供數(shu)(shu)據(ju)訂(ding)閱服(fu)務、支(zhi)持(chi)更好的(de)(de)并(bing)發等。

可以(yi)預見TDengine的ARM 32位版(ban)將(jiang)為VMPC的邊緣計算(suan)提(ti)供很多的便利。

作者簡介Blues,潤石科(ke)技(ji)解決(jue)方案工(gong)程師,主要負責技(ji)術架(jia)構、業務(wu)推廣(guang)等工(gong)作。

公司簡介:昆山潤石智能科技,是一家科技公司,嚴格來講是一家科技創新及應用為主的科技公司,為半導體、泛半導體行業客戶提供智能制造一站式解決方案,是全國領先的工業智能化解決方案供應商之一,公司集智能制造需求的軟硬件研發、銷售、服務于一體。團隊成員具備半導體與泛半導體產業資深背景,精通高端智能制造、制程(cheng)研(yan)發、整(zheng)合及半導體設備知識(shi),豐富的(de)研(yan)發、管理、營銷經驗。

原文首發于: