[又名什邡站長網]關于profile的介紹和匯編代碼級的優化問題
今天,[又名什邡站長網]總結了一下《關于profile的介紹和匯編代碼級的優化問題》,下面就簡單來說說這兩個問題,希望對建站的朋友們有所啟示,謝謝大家瀏覽。
關于profile的相關介紹
C6x的Debug工具提供了一個profile界面。在圖9中,包括了幾個重要的窗口,左上角的窗口是顯示出我們寫的C語言,可以讓我們知道現在做到了哪一步。右上角的窗口顯示的是C6x所編譯出來的匯編語言,同樣的我們也可以知道現在做到了哪一步。左下角的窗口是命令列💛,是讓我們下指令以及顯示訊息的窗口。而中間的profile窗口就是在profile模式下最重要的窗口,它顯示出的項目如下表:
表5:profile的各項參數[8]
字段 意義
Count 被呼叫的次數
Inclusive 包含子程序的總執行clock數
Incl-Max 包含子程序的執行一次最大clock數Exclusive 不包含子程序的總執行c🌺lock數Excl-Max 不包含子程序的執行一次最大clock數利用這個profile模🐼式我們可以用來分析程序中每個函數被呼叫的次數、執行的時脈數等等。用這個分析的結果,程序員就可以知道哪個函數所花費的時脈最多,是可以再改進的,而針對它來作最佳化。
關于profile的介紹和匯編代碼級的優化問題
匯編代碼級的優化可能會遇到的問題匯總
在經過C代碼的優化之后,還不能滿足性能上的要求,則可以通過profile clock工具找出效率很低的部分,使用線性匯編重新改寫。再𝔍通𓆏過匯編優化器編譯,匯編優化器從輸入的線性匯編代碼中,完成以下功能:
● 尋找可以平行執行的CPU指令。
● 在軟件流水線期間,處理流水線標號。
● 分配寄存器的用法。
● 分配功能單元。
TI提供的匯編優化器可以得到很高的效率,一般可以滿足性能上的要求。
優化中的問題
在匯編代碼級的優化過程中,總是要對程序進行一定♈的改動的情況,這樣經常會出ꦐ現一些問題。問題匯總如下:
1)優化結果的驗證
優化過的程序往往不知道是否運行正確,這時就需要程序員來加以驗證。驗證時一般采用的辦法就是通過測試序列來驗證。測試序列指的是對于不💃同的算法所取的一組特殊的數據,這些數據可以準確的反映算法的特性。
測試序列中每組數據包括:輸入數據和輸出數據,通過對🃏輸入數據的運𓃲算,把結果與輸出數據進行比較,判斷程序的正確性。一些常見的算法,一般都提供了測試序列。還有一些,沒有測試序列。這時就需要根據算法的特點,自己構造測試序列,進行驗證。構造的時候,注意序列最好有幾組,數據最好有一定的長度,這樣驗證的更準確。
2)內存泄漏的問題
C64X系列DSP的內🐎部存儲空間有1MB,其中程序和數據還有CPU的二級緩存將共享這片空間,因此當程序的運行不正常時,很有可能就是內存泄漏造成的。因此,在程序設計中,應盡量不用指針,同時注意進行邊界檢測。
程序設計的一些方法
程序設計時,一切應以滿足實際的要求為目標。在實際的ܫ設計中,除了優化能夠提高性能以外,還可以采取其他的辦法,利用DSP的特性,提高程序的運行性能ඣ,滿足實際的設計要求。
1、把程序和經常要用的數據放入片內RAM
片內RAM與CPU——工作在同一▨時鐘頻率,比片外RAM性能高得多。因此把程序放在片內可以大大提高運行的速度。同時對于一些經常要用到的數據,放入片內🔜,也會節省處理時間。
2、通過DMA技術搬移數據
對于C64X芯片,其片內RAM有1MB,但是對于一些大型𒐪的圖像ও處理算法而言,仍可能是不夠的,因此經常通過DMA技術,把需要用到的數據搬入片內,把不需要的搬到片外,可以大大的提高程序的運行速度。
3、CACHE的使用
增大CACHE,可以明�𒈔�顯的提高性能。但是C64X系列DSP中程序和數據還有CACHE共享片內RAM,因此增大CACHE,就減小了實際的片內可用空間,設計中需要注意。
總結:以上就是[又名什邡站長網]整理的《關于profile的介紹和匯編代碼級的優化問題》全部內容,下希望對建站的朋友們有所啟示,謝謝大家瀏覽。如要關注更多網站建設、網站優化方面的知識請收藏本站。【angeluniverse.cn】