設置

第075章 小C:終究還是要對我下手了咩?

  蛻變后的CPA軟件已經可以初步完成一些簡單的模型代碼。

  目前支持的有深度神經網絡、梯度提升樹、線性回歸、樸素貝葉斯、隨機森林、組合模型等等監督模型。

  同時也引入了tensorflow等組件以支持直接在該軟件上使用深度學習算法。

  蘇航真的想搞一個語音識別裝上去。

  到時候一開機,說一句,小C,建模,然后嘩嘩嘩地模型就搞好了,多爽。

  但是這個要點時間,還得花精力去小C里面找接入口,話說蘇航還沒有查過小C的核心代碼,還不確定能不能看懂。

  雖然目前它也可以完成一些簡單的自動建模,這里的自動只是相對而言,嚴格地講,還是半自動的。

  因為有很多參數要手動設計,比如模型的個數和最長訓練時間。

  這個自然是越長越好,不過硬件跟不上軟件。

  就像某位前輩發現人類的身軀限制了自己實力的增長,果斷選擇不當人。

  蘇航感覺自己這臺移動工作站就限制了小C的成長。

  要是放到太湖之光上,豈不是…

  咳咳,這個想想就好。

  要是不限制最長時間和測試模型個數上限,小C就會跑程序跑個沒玩,當一些參數不滿足要求的時候,然后就一個個模型去試啊,最后發現過擬合了,又去拉更多的數據,又去換模型,或者自動對數據去清洗或者增加噪聲。

  然后就跑個沒完沒了,跑一晚上都是可能的。

  有個現代的偉人,忘了啥名字,就講過他上大學的那個時候的電腦不會識別死循環,然后他碼了個程序放那運行并設置自動打印結果,然后就走了,因為結束了會自動停止嘛,就沒管了。

  結果周一回來,被告知要繳納罰款,原因是微機房打印機的紙全打印完了,還好機子沒壞。

  現在計算機雖然會識別死循環,但是面對長時間的模型擬合還是會出現類似的情況。

  蘇航的小C就是如此。

  更進一步的,小C還可以自動進行模型組合,可以將所有訓練好的模型作為base model進行融合,也可以通過各個模型family中最好的那個模型作為base model進行融合,融合的方式默認為GLM線性回歸。

  此外,小C還有一個類似于Simulink一樣的建模板塊。

  可以更加簡單地建立模型,而不需要對R語言和Python了解太多。

  就是“托拉拽式建模”。

  像什么讀取數據集、讀取SQL表、將數據集劃分為訓練集和測試集等等,這個雖然簡單,但是命令語句不多。

  要進行大型、復雜的模型,這個還不夠。

  當然,對于建立CNN和RNN,小C還是不太好用,自動生成的代碼還需要一些微調。

  對蘇航而言,能夠替代一部分的勞動就足夠了。

  這一次,蘇航決定利用人工智能神經網絡和模糊邏輯等方式來對一些大型地下工程的土體變形進行預測,進一步實現通過對施工的技術參數調整,達到變形控制的目的。

  不要看現在科技多么發達,技術多么先進,高樓大廈那么高,地下工程那么多,其實人類對大地的了解還遠遠談不上深刻。

  一條幾公里的地鐵線路,在開挖前,地下是什么情況,誰也不知道。

  水、孤石等都是地下工程的大敵。

  就算是每隔50米進行一次鉆孔勘察,那一公里也就200來個點,要去預測1000米的路線上的地質情況。

  很難。

  死的人,很多。

  相關的研究也一直在做,但是一直都很難。

  常言道,三里不同風,十里不同俗。

  土壤也是這樣。

  你可以把地質歸類,但是不能說一類地質就是怎么樣的。

  這個東西它是混合物,今天下點雨,明天刮點風,來幾個人踩幾腳,力學性質也許就會發生改變。

  一些承載力公式怎么來的?

  不是實驗室算出來的,而是用命換來的經驗公式。

  比如某些個山地高原地區的隧道開挖,巖爆一死就是一個班。

  所以,將現代技術充分利用進去,這是非常有必要的。

  蘇航照例開始畫流程圖。

  采用多步滾動預測法,一次只預測一小段時間后的變形,然后逐步推進,像一個輪子一樣不斷向前推進。

  還要借用模糊數學中的隸屬度,通過層次分析法對地下工程開挖的關鍵技術參數進行敏感度分析。

  問題來了,何謂關鍵數據。

  蘇航頓筆。

  窗外的知了又叫了,就像是去年準備數學建模的時候一樣。

  人類是地球的關鍵生物嗎?

  文明是宇宙的關鍵數據嗎?

  如果是,誰來評判?

  如果不是,什么才是?

  那什么是眾多技術參數中的關鍵數據呢?

  怎么評判?

  蘇航轉動了一下手里的筆,沉思了一會。

  暫定,利用參數與變形值之間不同程度的相關性,按層級分析法逐個選出關鍵的參數。

  寫完,蘇航有點不放心,又用紅筆圈了一下,寫了一行字。

  “如果可以的話,找個機會把目前手段可以控制的參數進行一次全面的分析,再微小的參數,也會有自己的作用,就像宇宙長河里的文明一樣。”

  好了,跳過這個小插曲,蘇航繼續整理自己的思路。

  接下來就是對關鍵參數進行調整,計算它們的影響因子,在發生變形的時候進行智能控制。

  也即:原始數據輸入——>模糊化——>模糊推理—(數據庫資料支撐)—>清晰化——>控制輸出。

  這樣一來,就需要一個龐大的數據庫了。

  包含詳盡的工程監測數據、沿線地質水文資料、施工工藝資料、附近建筑物地下暗樁情況等等。

  還得有多組這樣的樣本數據來進行學習。

  以此“訓練”機器。

  所以,還是不能悄悄努力,然后驚艷所有人,畢竟是工科,要單打獨斗是不可能的。

  沒有強大的財力、物力和特色人情關系的支持,那就只能一言難盡。

  還得去找趙漢英老師要支持啊。

  蘇航開始整理代碼和目前完成的論文部分,主要還只是構思和基本算法框架。

  把這些東西一打包,發給趙老師,接下來等待趙老師的約見吧。

  不過,蘇航轉著的筆停下,突然想到,自己是不是可以多做一點呢?

  比如降低門檻,把小C的拖拽化和自動匹配模型功能整合進去,實現更加智能的風險智能預測。

  這樣的話,就算那個執行者看不懂模型和流程,也可以輕松地通過文字來實現對這一模型地運用。

  降低了入門門檻,又是一件大好事啊,蘇航滿意地在紙上寫寫畫畫,然后把魔爪伸向了小C。

  小C:ฅʕ•̫͡•ʔฅ…?

大熊貓文學    學習使我富裕