本發明涉及工業機器人智能控制,尤其涉及基于深度學習的工業機器人軌跡優化控制方法。
背景技術:
1、在工業機器人軌跡優化控制領域,現有技術主要依賴基于精確動力學模型的在線優化算法或端到端深度神經網絡進行實時計算。這些方法需要在每個控制周期執行復雜的數值迭代或前饋推理,以生成控制指令。當任務環境動態變化或存在未建模干擾時,高計算負荷可能導致顯著的決策延遲,難以實現真正的實時響應,從而影響軌跡跟蹤的瞬時精度與穩定性。
2、現有方法在處理序列化軌跡校正時,通常獨立對待每個控制周期的調整量,或采用固定參數的濾波技術進行平滑。此類方式未能充分考慮前后調整動作之間的時序關聯與動態耦合效應。獨立處理可能引發控制信號的不連貫,而簡單濾波則可能掩蓋必要的快速響應,或引入相位滯后。這限制了控制系統從歷史調整序列中學習長期依賴關系的能力,最終影響軌跡收斂過程的平順性與整體性能。
3、需要一種能夠快速響應動態變化、并智能融合序列化校正歷史的軌跡優化控制方法,以克服現有技術中計算延遲與時序依賴處理不足的缺陷。
技術實現思路
1、本發明的目的是解決現有技術中存在的缺點,而提出的基于深度學習的工業機器人軌跡優化控制方法。
2、為了實現上述目的,本發明采用了如下技術方案:基于深度學習的工業機器人軌跡優化控制方法,包括:
3、通過獲取工業機器人在執行預設系列任務過程中產生的原始運動數據流,提取所述原始運動數據流中包含的關節位移片段集、關節力矩片段集以及末端位置片段集,并進行時間戳對齊與融合,形成時空同步的多維運動片段序列,對所述多維運動片段序列中的每一組運動數據進行鄰域連貫性評估,生成一致性特征向量;
4、將所述一致性特征向量作為查詢輸入,在預先生成的軌跡優化策略圖譜中進行多層級匹配檢索,所述軌跡優化策略圖譜由大量歷史優化策略節點及其關聯的穩定性特征向量構成,所述匹配檢索過程輸出一個與所述查詢輸入最適配的候選優化策略節點;
5、基于所述候選優化策略節點所定義的優化參數配置,對工業機器人當前執行的實時運動軌跡段進行增量式軌跡校正,產生由多個校正周期組成的軌跡校正記錄;
6、將所述軌跡校正記錄導入采用門控循環機制與注意力機制協同工作的深度時序學習模型,所述深度時序學習模型分析軌跡校正記錄中不同校正周期之間的依賴關系,最終輸出工業機器人的優化軌跡控制信號。
7、優選的,所述鄰域連貫性評估包括:
8、所述一致性特征向量包含軌跡連貫性評分、力矩連貫性評分與位置連貫性評分;
9、針對所述關節位移片段集,在時間維度上按預設的評估窗口長度將其劃分為連續的多個時間窗口;
10、在每個所述時間窗口內,計算關節位移在相鄰采樣點之間的位移變化率的絕對值,并對所述時間窗口內所有采樣點對的絕對值求和,將求和結果作為所述時間窗口內的位移波動值;
11、匯總所有時間窗口的位移波動值,計算其波動平均值,將所述波動平均值映射到一個設定的評分尺度上,得到所述軌跡連貫性評分;
12、對所述關節力矩片段集與末端位置片段集,同樣執行劃分時間窗口、計算波動值、求取平均值并進行評分映射的操作,分別得到所述力矩連貫性評分與位置連貫性評分。
13、優選的,所述時間窗口的劃分依據來源于對所述多維運動片段序列的周期性分析,所述周期性分析過程識別出序列中運動模式的重復間隔,并以所述重復間隔作為所述評估窗口長度。
14、優選的,所述軌跡優化策略圖譜的生成方法包括:
15、收集在多種工況下對工業機器人進行軌跡優化實驗所得的實驗數據,從每條所述實驗數據中解析出優化前的機器人狀態特征與所采用的優化策略;
16、對所述機器人狀態特征進行與所述鄰域連貫性評估相同的處理,得到用于圖譜構建的穩定性特征向量;
17、以所述穩定性特征向量作為節點標識,以對應的所述優化策略作為節點內容,構建所述軌跡優化策略圖譜的初始節點集合;
18、計算所述初始節點集合中任意兩個節點對應的穩定性特征向量之間的特征距離,并依據所述特征距離的大小在相應節點間建立連接邊,當特征距離小于預設的鄰接閾值時,則建立強連接邊,否則建立弱連接邊或省略連接,最終形成帶權連接的所述軌跡優化策略圖譜。
19、優選的,所述在預先生成的軌跡優化策略圖譜中進行多層級匹配檢索包括:
20、在所述軌跡優化策略圖譜中,以所述一致性特征向量為起點,尋找特征距離最近的初始匹配節點;
21、以所述初始匹配節點為核心,沿其強連接邊向外擴展搜索一層,獲得一個初始匹配節點集合;
22、計算所述一致性特征向量與所述初始匹配節點集合中每個節點的穩定性特征向量的綜合相似度;
23、選取所述綜合相似度最高的節點作為所述候選優化策略節點。
24、優選的,所述綜合相似度的計算過程結合了所述一致性特征向量與節點的穩定性特征向量在各維度上的歐氏距離,以及所述節點在所述軌跡優化策略圖譜中的連接度權重,所述連接度權重由與節點直接相連的強連接邊的數量決定。
25、優選的,所述對工業機器人當前執行的實時運動軌跡段進行增量式軌跡校正包括:
26、從所述實時運動軌跡段中截取與所述多維運動片段序列等長的待校正軌跡段;
27、讀取所述候選優化策略節點中包含的關節角調整量序列、運動速度調整比例因子以及加速度平滑約束條件;
28、按照所述關節角調整量序列,依次對所述待校正軌跡段中對應時刻的關節角度值進行疊加調整;
29、使用所述運動速度調整比例因子對調整后軌跡段中所有運動速度指令進行縮放;
30、依據所述加速度平滑約束條件,對縮放后軌跡段中相鄰速度指令進行過渡處理,確保加速度連續,產生所述軌跡校正記錄。
31、優選的,所述加速度平滑約束條件定義了在速度指令變化點上允許的最大加速度階躍值,所述過渡處理采用線性插值方法在速度指令變化點的前后采樣點之間插入新的速度指令,使得加速度值不超過所述最大加速度階躍值。
32、優選的,所述深度時序學習模型包含一個用于提取局部時間特征的門控循環編碼器,以及一個用于捕捉長周期依賴關系的多頭自注意力解碼器,所述軌跡校正記錄首先經過所述門控循環編碼器轉換為隱藏狀態序列,所述隱藏狀態序列再輸入至所述多頭自注意力解碼器生成最終的優化軌跡控制信號。
33、優選的,所述軌跡校正記錄首先經過所述門控循環編碼器轉換為隱藏狀態序列,具體包括:
34、將所述軌跡校正記錄按校正周期順序輸入至所述門控循環編碼器;
35、在所述門控循環編碼器的每個時間步,根據當前校正周期的數據與前一隱藏狀態計算更新門和重置門;
36、利用所述更新門控制前一隱藏狀態的保留程度,利用所述重置門控制前一隱藏狀態對當前候選隱藏狀態的貢獻;
37、根據所述更新門、所述重置門及當前輸入數據計算當前時間步的候選隱藏狀態;
38、結合所述更新門與所述候選隱藏狀態生成當前時間步的隱藏狀態;
39、遍歷所有校正周期后,輸出由每個時間步的隱藏狀態構成的隱藏狀態序列;
40、所述隱藏狀態序列再輸入至所述多頭自注意力解碼器生成最終的優化軌跡控制信號,具體包括:
41、將所述隱藏狀態序列作為輸入序列提供給所述多頭自注意力解碼器;
42、在所述多頭自注意力解碼器內,將所述輸入序列分別線性投影至多個不同的子空間,形成多組查詢向量、鍵向量和值向量;
43、在每組子空間內,計算所述查詢向量與所有鍵向量的點積,得到注意力權重分數;
44、對所述注意力權重分數進行縮放和歸一化處理,得到歸一化注意力權重;
45、使用所述歸一化注意力權重對對應的值向量進行加權求和,得到子空間的輸出;
46、將多個子空間的輸出進行拼接并再次線性投影,得到融合了全局信息的上下文向量;
47、將所述上下文向量通過前饋神經網絡進行非線性變換,輸出最終的優化軌跡控制信號。
48、與現有技術相比,本發明的優點和積極效果在于:
49、通過構建一個由歷史優化策略節點及其穩定性特征向量組成的軌跡優化策略圖譜,并將實時提取的一致性特征向量作為查詢輸入進行多層級匹配檢索,能夠直接從歷史經驗庫中快速定位到與當前運動狀態最適配的預定義優化策略。這一機制將在線軌跡優化問題轉化為高效的模式匹配與策略檢索過程,降低了傳統在線優化算法或復雜神經網絡模型帶來的計算開銷,實現了對工業機器人運動狀態的毫秒級策略響應,克服了因計算延遲導致的控制性能下降問題。
50、采用門控循環單元與注意力機制協同工作的深度時序學習模型來處理由多個校正周期組成的軌跡校正記錄。門控循環機制能夠捕捉校正記錄中的長程時序依賴,而注意力機制則動態分析并賦予不同校正周期以差異化的權重,識別出關鍵校正節點及其影響。這種協同工作方式使得模型能夠深入理解整個校正序列內部的復雜關聯,從而合成出更精準、平滑且前瞻性的最終軌跡控制信號。這不僅避免了因簡單疊加校正量可能引發的系統振蕩,還提升了控制系統對連續擾動的適應能力與軌跡的整體收斂質量。