最近ChatGPT爆火,在文字和視覺內(nèi)容的AIGC方向,確實達(dá)到了某種臨界值,涌現(xiàn)出“智能”。
趁著這個熱度,AI方向也很火,最近看了幾個能源、電力方向的AI創(chuàng)業(yè)公司的BP,感覺就是“干啥都沒想明白,就出來融資了”。
電力AI的春天真的來了嗎?
(來源:微信公眾號“魚眼看電改” 作者:俞慶)
回歸本質(zhì),AIGC的奇點突破,個人覺得是三個因素的結(jié)合:
1、GPT是人類神經(jīng)元的仿生產(chǎn)物
NLP為代表的GPT類AI,是計算機(jī)神經(jīng)元網(wǎng)絡(luò)算法,其本質(zhì)是對人類大腦皮層的神經(jīng)元網(wǎng)絡(luò)模擬。
而語言、音樂、圖像,甚至味覺信息的處理和智能想象,都是人類大腦作為一種“蛋白質(zhì)計算機(jī)”,在長期進(jìn)化中積累出來的功能。
所以GPT作為仿生產(chǎn)物,自然最適合處理同類的信息,也就是非結(jié)構(gòu)化的語言、音樂、圖像。
其處理的機(jī)制,也不是意義的理解,而是一種提煉、識別、聯(lián)想。這就是非常吊詭的一件事。
早期的語音語義識別算法,本質(zhì)上是建立語法模型和語音庫,然后把語音對應(yīng)到詞匯,再把詞匯放到語法庫里去理解詞匯的意義,最后得到識別結(jié)果。
這種基于“邏輯機(jī)理”的語法識別,識別效率一直徘徊在70%左右,比如IBM在上世紀(jì)90年代推出的ViaVoice識別算法。
AIGC不是這么去玩,其本質(zhì)是不去管什么語法,而是建立一個神經(jīng)元網(wǎng)絡(luò)算法,讓計算機(jī)自己去統(tǒng)計不同詞匯之間的概率聯(lián)系,是神經(jīng)元的聯(lián)系,而不是語義的聯(lián)系。
很像我們小時候?qū)W母語,我們自然就學(xué)會了,而不是一開始去學(xué)習(xí)“主謂賓、狀定補(bǔ)”,然后去理解一段話。
這就是AI的思維模型,是識別,而不是理解。
這也是AI對所有經(jīng)典機(jī)理模型的顛覆意義——計算機(jī)不用在邏輯層理解這件事,而是識別、認(rèn)識到內(nèi)在信息之間的關(guān)聯(lián)關(guān)系,就知道了。
比如電網(wǎng)的潮流狀態(tài)和潮流預(yù)測,基于經(jīng)典電力網(wǎng)絡(luò)仿真,是建立機(jī)理數(shù)學(xué)模型,然后用矩陣算法去收斂。未來可能不需要了,AI直接就根據(jù)每個節(jié)點的狀態(tài)去識別和預(yù)測出某個模態(tài)班圖(Pattern)。
節(jié)點越多,而經(jīng)典矩陣算法越不喜歡,因為算法復(fù)雜度隨節(jié)點數(shù)量增加,幾何級數(shù)的增加,而AI偏偏喜歡超大規(guī)模的節(jié)點并發(fā),因為識別和預(yù)測最可能的網(wǎng)絡(luò)模態(tài)是AI擅長的。
無論是圍棋的下一步預(yù)測(AlphaGO可以預(yù)測后面幾十步,每一步都有無數(shù)種可能),還是天氣復(fù)雜系統(tǒng)的模態(tài)預(yù)測,AI的精確度都比機(jī)理模型高很多。
電網(wǎng)之所以目前不需要AI,是因為省級調(diào)度管理的220kV及以上的電力網(wǎng)絡(luò),節(jié)點數(shù)量不多,而且設(shè)置了很多條件對矩陣線性化,稀疏化,極大降低了機(jī)理模型的計算復(fù)雜度。
但是到了配網(wǎng)潮流階段,面對一個大型配電網(wǎng)里幾萬、幾十萬的電源節(jié)點、負(fù)荷節(jié)點、傳統(tǒng)矩陣算法是無力的。
我認(rèn)為未來AI在配網(wǎng)層面的模式識別將成為可能。
2、非結(jié)構(gòu)化信息的積累、訓(xùn)練與生成
AIGC之所以獲得突破,第二個原因是信息的積累程度。從語音的A/D轉(zhuǎn)換(麥克風(fēng)+PCM采樣),到圖像的A/D化(CMOS+色彩空間映射),人類過去幾十年,用極低成本的方式,積累了視覺、聽覺領(lǐng)域的全息數(shù)據(jù)。
尤其是攝像頭、智能手機(jī)的大規(guī)模普及,人類在視聽領(lǐng)域的,非結(jié)構(gòu)化數(shù)據(jù)積累幾乎零成本,互聯(lián)網(wǎng)上文字信息的爆發(fā)性積累,是AIGC訓(xùn)練的關(guān)鍵——訓(xùn)練數(shù)據(jù)集不要錢。
上圖是全球數(shù)據(jù)的增長趨勢,明顯呈現(xiàn)指數(shù)級趨勢,這種數(shù)據(jù)積累的非線性增長,是AIGC能力非線性增長的基礎(chǔ)。
BUT,這些數(shù)據(jù)大部分都是非結(jié)構(gòu)化的視聽數(shù)據(jù),是零成本積累的。
在電力領(lǐng)域,這點是做不到的,首先電力行業(yè)絕大多數(shù)是結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),比如電壓、電流,是時間序列的點數(shù)據(jù)集合,是半結(jié)構(gòu)化的。
結(jié)構(gòu)性數(shù)據(jù)集合,需要讓計算機(jī)理解,是需要“對齊”的,比如設(shè)備對齊——一個開關(guān)的電壓、電流、功率數(shù)據(jù),都需要對齊到這個節(jié)點上。
還有更麻煩的是時間對齊,要根據(jù)時標(biāo)去對齊電壓、電流、有功無功,這樣才能后續(xù)識別。還有正反向,是四象限的空間對齊。
不像文本數(shù)據(jù),不用對齊,一段話扔給計算機(jī)就行了,它自己去識別出可能的信息關(guān)聯(lián)。
為了對齊這件事,比如營配數(shù)據(jù)的設(shè)備對齊,而且是不斷需要對齊,因為中低壓配網(wǎng)每天都在增刪改設(shè)備和線路,電網(wǎng)公司花費(fèi)巨大的人工成本。
和“數(shù)據(jù)標(biāo)注”一樣,這件事計算機(jī)做不了。
其次,電力領(lǐng)域的數(shù)據(jù)獲取成本很高,都要裝傳感器,而不是有個手機(jī)就能說話拍照。電壓每降低一個等級(或者配電關(guān)系每降低一個層級),所需傳感器投資至少增加一個數(shù)量級,要做到負(fù)荷側(cè)(毛細(xì)血管末端)的感知,那更是天量的數(shù)字化投資。
如果要識別電網(wǎng)暫態(tài)模式,那需要高精度高頻采樣,那成本就更高。
因為數(shù)據(jù)獲取和數(shù)據(jù)對齊的邊際成本極高,導(dǎo)致電網(wǎng)目前無法積累足夠的、呈非線性增長的數(shù)據(jù)信息,去訓(xùn)練一個達(dá)到AI奇點的算法。
更別說數(shù)據(jù)的開放性,一個電力AI創(chuàng)業(yè)公司,是不可能拿到這些數(shù)據(jù)的。
所以AI之前,必先解決數(shù)據(jù)集的問題,否則通用AI代碼是訓(xùn)練不出一個好的AI的。
3、算力突破
AIGC的奇點突破,除了算法和數(shù)據(jù),還有就是算力突破,傳統(tǒng)CPU不適合做大規(guī)模并發(fā)的神經(jīng)元計算的,恰好是GPU在3D游戲和影視方面的應(yīng)用,使得大規(guī)模并行的浮點+流計算成為可能,摩爾定律更使得單位算力的計算成本下降。
電網(wǎng)AI,未來必然的趨勢
隨著大量分布式光伏、分布式儲能的并網(wǎng),以及負(fù)荷側(cè)虛擬電廠的應(yīng)用需求,客觀上需要對公共配電網(wǎng)系統(tǒng)、用戶配(微)電網(wǎng)系統(tǒng),進(jìn)行源、荷預(yù)測,以及配(微)網(wǎng)的實時潮流優(yōu)化。
配網(wǎng)側(cè)的計算復(fù)雜度其實高于輸電網(wǎng)調(diào)度,即使一個商業(yè)綜合體,負(fù)荷設(shè)備就可能幾萬幾十萬,開關(guān)成百上千,基于AI的微網(wǎng)/配網(wǎng)運(yùn)行控制需求將會出現(xiàn)。
而傳感器的低成本化,固態(tài)變壓器、固態(tài)開關(guān)、逆變器(變流器)等功率電子設(shè)備大量使用,在電網(wǎng)邊緣的感知-計算-控制融合也成為創(chuàng)新的趨勢。
所以電網(wǎng)的AIGC,是未來。只不過,今天需要的,不是馬上拿個AI算法出來圈錢,
而是先解決AI所需的數(shù)據(jù)基礎(chǔ)構(gòu)建問題
在AIGC的熱潮中,對電力AI的應(yīng)用水平與未來,需要有足夠的冷靜思考。
目前電力AI意義不大:比如一個預(yù)測精度90%的光伏算法,放到交易偏差門檻5%的現(xiàn)貨市場里,算法偏差就把交易利潤全部干完了。
數(shù)據(jù)是水,算法算力是渠,水到渠成。
評論