馬塞爾·施密特無論如何都不會想到,多年以后,當人工智能研究甚至開始占據諾貝爾獎和菲爾茲獎席位的時候,自己只是為了抬杠而脫口而出一句“神經網絡也是數學”將爆火出圈,并被該領域研究人員奉為圭皋。
甚至施密特本人也在某些安撫服務器機魂的儀式當中成為了被參拜的對象之一。
但這些都是后話了。
無論如何,在2004年末這個時間點上,《數學進展》選擇發表一篇與全局優化以及數據模型有關的論文,都屬于是可以讓業內輕微地震的大新聞。
好在論文的作者之一是上屆菲爾茲獎的得主,而且這還是其有據可查的第一篇合作論文。
因此業內的關注重點很快就從文章內容本身過渡到了常浩南所關注的研究方向上面——
大佬在頂級期刊上發表文章,本身就可以引領潮流。
而追熱點這種事,無論中外,都是絕大多數研究人員都不得不品嘗的特色…
荷蘭,代爾夫特理工大學。
約瑟夫·布拉特教授正站在一臺白光干涉儀前面,神情復雜地翻閱著電腦屏幕上顯示出的一系列測試結果。
而在距離不遠處,他的學生秦少鋒正在埋頭檢查剛剛被面前設備吐出來的一份測試報告。
“教授,結果已經對比過了…”
幾分鐘之后,秦少鋒把眼鏡摘掉放到一邊,語氣有些失落地開口說道。
不過,還沒來得及說出后面的內容,布拉特就提前打斷了他:
“應該跟前兩次測試都對不上?”
被直接猜出結果的秦少鋒先是一愣,接著點點頭:
“同樣的被測樣品,同樣的三維立體測量儀,但是三次測試中的峰谷值差距都在1μm以上,均方根也有0.3μm左右,完全達不到甲方的要求…”
作為一所坐落于低地小國,且所在城市也并不出名的高等學府,代爾夫特理工大學的名氣不僅遠不如哈佛、麻省、牛津這樣的龐然大物,就算是跟隔壁阿姆斯特丹大學相比都遠遠不如。
不過,它在光學和光學工程方面卻有著相當雄厚的實力。
而約瑟夫·布拉特,正是該領域最杰出的學者之一。
他在上世紀7080年代曾先后供職于飛利浦和ASML,并于1988年轉入學術界,隨后在光學成像、光存儲技術等領域繼續做出了一系列杰出貢獻。
并且是歐洲光學學會的創始人之一和現任主席。
目前他正在跟進的項目,就是受泰勒霍普森公司委托開發一種新的非接觸式三坐標測量技術,以對生產面形峰谷(PV)值優于0.1μm的非球面鏡片進行檢測。
這個精度對基于原子力分析的接觸式測量技術來說并不算夸張,但由于探針需要和工件表面接觸,因此并不適用于某些特別脆弱的光學元器件。
相比之下,采用干涉法和幾何光線法的非接觸測量顯然要友好得多。
當然,想要達到跟接觸式測量相當的精度,難度也要高得多。
面對已經記不清是這幾個月來第幾次的失敗,秦少鋒已經意識到,繼續進行重復性試驗已經沒有太大意義了。
現在需要的是更換一下思路:
“是不是考慮重新標定一下設備的公共觀測點,這樣位置偏移誤差或許能縮小一些?”
他首先提議道。
面形檢測過程中的誤差主要來源于三個方面:運動軸誤差、探頭誤差和位置偏移誤差。
前兩者對于接觸法和非接觸法來說并沒有太大差別,因此非接觸法的精度問題主要就出現在位置偏移誤差上面——
由于沒有一個可以直接接觸型面,并直接確定測量參考原點的探頭,所以非接觸設備捕獲到的誤差數據,本質上相當于面型誤差和位置偏移誤差的疊加。
只有通過算法分離掉后者,才能得到相對精確的結果。
所以秦少鋒的思路其實是沒錯的。
但重新標定觀測點這個辦法…
基本相當于電腦出故障以后的“重啟一下試試”。
算是實在找不出具體原因之后,帶著點玄學色彩的嘗試。
雖然有些時候確有奇效,但對于光學工程專業的研究人員來說,就有點上不得臺面了。
所以,幾乎是立即就被布拉特給否了:
“意義不大。”
他擺了擺手,接著直接開始給秦少鋒分析誤差原因:
“目前這套設備的校準邏輯是基于非球面二維模型的,雖然已經利用高斯牛頓法進行了一些修正,但本質上,測量得到的非球面中心仍然不是實際型面的中心,并且二維化之后得到的模型曲線也不是非球面的子午線,所以僅僅重置觀測點是不會有效果的…”
能在看到實驗報告之前就給出如此具體的解釋,讓后者不由得感慨,到底姜還是老的辣。
但這種情緒僅僅維持了不到兩秒鐘。
只聽到布拉特稍作停頓,接著繼續說道:
“而且更重要的是,我昨天晚上已經試過了,沒用…”
濾鏡瞬間破碎了。
當然,活還是得接著干。
一番思索之后,秦少鋒又想到了新的路子:
“那如果我們給這臺設備升級一部性能更好的控制計算機,是不是就可以略過二維模型計算這一步,直接用三維校正算法獲得空間內的圓心和非球型面坐標?”
這一次,倒是沒有被直接否決。
“三維校正算法的問題是容易出現局部收斂…導致出現誤差特別離譜的離群值,在工業化生產中非常難以接受…”
布拉特顯然已經思考過很長時間了:
“實際上,如果能克服局部收斂問題的話,那我們只需要通過仿真生成帶有位置誤差和面形誤差的三維非球面數據,接著把生成的坐標點跟標準的非球面方程作對比,得到各坐標點的誤差,最后再利用均方根誤差最小原理,就可以迭代優化出相應的位置誤差…”
實際上,非球面并不意味著毫無規律,其標準方程一般是二次曲面疊加高次項系數,在三維空間中只存在旋轉和平移,無需考慮沿z軸的旋轉,也就是僅存在6個自由度的變化,至于位置參數則可以用兩個包含二階偏導的三階矩陣和三個誤差項共同表示。
因此,最后的問題可以歸納為:利用一個合理的全局優化算法優化目標函數,使其誤差函數值最小。
而秦少鋒的基礎也確實扎實,在聽過導師的思路之后,很快就捕捉到了一些新的想法。
只不過,還隱約有些模糊:
“所以之前說二維模型經過優化之后仍然達不到效果,是因為高斯牛頓法在求解這個最優解的過程中不正定?”
“也不完全是。”
布拉特無奈地聳了聳肩:
“實際上,日本那邊已經有人將求解黑塞矩陣時正定的LevenbergMarquardt方法用于用于三維測量了,但效果還是達不到預期值。”
“LevenbergMarquardt方法…”
這個名詞終于讓秦少鋒徹底抓住了那一閃而過的靈感,整個人瞬間精神了起來:
“我前兩天聽一個數學專業的同學說起來過,好像是有個非常知名的學者剛剛發表了一篇跟這個算法有關的論文,就是改善局部虛假最優問題的…而且因為內容和純數學有點脫節,所以在他們那邊還引發了一些爭議…”
布拉特本人其實也有一定的數學功底,但確實和正經數學家沒得比。
但卻已經足夠讓他意識到這篇論文在光學領域的價值了。
“有沒有更詳細的信息,我我想去看一下這篇論文。”
他幾乎是兩眼冒光地問道。
“我有論文的網頁鏈接…”
秦少鋒說著摘掉手套,轉身準備去辦公室取電腦。
然而布拉特已經有些迫不及待,當即指了指旁邊自己的電腦:
“或許你可以直接用這個…”
幾分鐘后,一篇足有二十來頁厚度的論文便被交到了布拉特的手中。
“就一篇數學論文來說,篇幅確實有些太長了。”
他半開玩笑地接了過來。
秦少鋒的回答倒是頗為正經:
“我那個同學說,如果只對LevenbergMarquardt方法本身感興趣,那只需要看前半部分就行了…”
“知道了…”
布拉特甚至沒有抬起頭,只是朝著秦少鋒揮了揮手,示意后者可以先去休息了。
然而,長舒一口氣的秦少鋒才剛回到辦公室自己的座位上,旁邊的電話就突然響了起來。
“秦,你去幫我聯系一下泰勒霍普森公司。”
“就說我有個新的技術方案…但一些具體細節還沒有想通,可能需要和他們開會討論一下…”