摘 要: 介紹了基于NIOS II和μclinux應用于工業CT的數據傳輸系統。將FPGA的嵌入式軟核作為數據傳輸系統的核心處理器,μclinux操作系統移植到嵌入式系統中,并加入并行處理模塊,使得系統不但發揮了FPGA的并行處理的能力和強可配置性,也利用了μclinux系統強大的網絡功能。
關鍵詞: NIOS II; μclinux; FPGA; 高速數據傳輸
在數據傳輸方面,網絡傳輸TCP/IP協議具有通用性和安全性上的優勢,而在數據處理方面,特別是高速數據的處理,FPGA一直是首選方案。通過硬件并行處理的速度在軟件看來是難以超越的。用FPGA作前級處理,而后通過DSP數字處理是國際上常用的做法。所以應用FPGA+MCU(或DSP)的做法很普遍,效果也很好。
在數據傳輸系統中,NIOS Ⅱ嵌入式處理器軟核能最大處理200DMIP,與ARM9相當。它最大的特點是可配置性高,可以在里面嵌入DSP硬件、各種存儲設備、I/O口以及可以定制用戶指令等。通過NIOS Ⅱ可以將FPGA+MCU+DSP系統有機地綜合起來,發揮它們各自的優勢,用一片FPGA完成系統的構建。從軟件上看,μclinux操作系統以高效、簡潔著稱,而在性能上又繼承了linux的高效、開放、實時性好、網絡功能強的特點。本系統正是基于NIOS Ⅱ和μclinux設計的,應用于工業CT機的數據傳輸系統中。
1 系統功能
如圖1所示,本系統的主要功能是將工業CT系統數據采集模塊得到的數字信號高速可靠地傳輸到圖像處理計算機。數據采集模塊的功能是將X(或γ)射線轉換為光信號后變為計算機可接收的數字信號。本系統要完成的工作就是高效可靠地接收工業CT需要的數百甚至上千通道的數字信號,并將這些信號有序準確地傳輸到圖像處理計算機。同時要求系統對數據有一定深度的緩沖,即本系統同時能存儲8次以上的工業CT系統采樣值。傳輸的方式采用基于TCP/IP的網絡協議,數據通過局域網傳輸。工業CT數據傳輸間隔時間最短約為3ms。
2 方案簡介
如圖2所示,系統主要是由片上系統和片外設備構成的嵌入式系統。而片上系統主要是由NIOS Ⅱ系統[1]和FPGA上的前級數據處理模塊構成。
NIOS Ⅱ系統使用了用戶自定義指令和DMA加速模塊來實現數據傳輸系統核心硬件的加速。用戶自定義指令是硬件化了的邏輯模塊,它嵌入到CPU中,形成了用戶的專用CPU。其作用是實現一個循環冗余碼校驗(CRC)。將一個64K字的緩沖區中實現CRC的邏輯塊作為一個定制的指令,這要比軟件快27倍[2]。DMA加速模塊的作用是將片上交換緩存(On-Chip RAM)的數據加載到SDRAM中去,這樣比使用CPU的指令傳輸要快得多。
FPGA前級數據處理模塊實現數據的前級數據處理:它將CT機的數據采集卡上的高速數據流并行接收到片上交換緩存中。在交換緩存中開辟兩片緩沖區,使用乒乓模式來實現數據存放。片外設備包括SDRAM、Flash和Ethernet網絡設備。SDRAM用于運行程序和存放待傳輸的數據。Flash用于存放系統kernal和filesystem。Ethernet網絡設備為smsc91c111,它是100M網絡傳輸設備,用于數據的網絡傳輸。
3 系統軟件
系統主要采用μclinux操作系統來實現,μclinux在嵌入式系統中非常穩定,并且有NIOS II專用kernal,這樣給系統的移植和驅動的編寫帶來了方便。在8MB的系統中,使用2MB裝載內核,6MB裝載文件系統。
引導程序U-boot的移植:
Bootloader的設計除了依賴于CPU的體系結構外,也依賴于具體的嵌入式板級設備的配置,對于兩塊不同的嵌入式板而言,即使它們是基于同一種CPU[3]構建的,在移植操作系統時,這部分代碼也需要修改。
Bootloader引導加載程序是系統加電后的第一段程序,系統通過它初始化硬件設備、建立內存空間映射,為調用內核做準備。U-boot是由早期的ppcboot發展而來,它的特點是開源、功能強大,下面作一簡要介紹。
首先通過NIOS-elf-tools建立交叉編譯環境,選擇U-boot-1.0.0.tar版的U-boot。本系統選擇μclinux-2.4.17-ucl.tgz版的μclinux版本。而后使用configure命令檢查宿主機上U-boot交叉編譯環境是否正確,并且通過configure文件的內容對U-boot各子目錄的makefile進行修改。這一步只要保證./configure通過就可以了。接下來通過交叉編譯環境對U-boot-1.0.0編譯。有了編譯環境后,就可以根據系統設備配置對U-boot源代碼進行移植。修改后,參考README中的內容重新把U-boot 建立起來,這是最終需要的可以在Flash中運行的代碼。
4 軟件實現
4.1 FPGA程序
如圖3所示,FPGA中的前級數據處理模塊主要完成數據串轉并,并使用乒乓模式緩存。在CT機的數據采集模塊中每秒鐘產生250次采集每次1 024路、每路20位、再加上各種表頭等,這樣每秒的數據量大約為5.2Mbit。模塊通過SOPC中的接口元件與NIOS Ⅱ處理器相連。
串轉并模塊的輸入為SDA和SCL的I2C標準總線。而后作為乒乓模式的兩個緩存將FIFO模塊的數據緩存到模塊中,每個模塊的大小為16KB。FIFO模塊將高速I2C的串行數據轉換成并行數據,并存入其中一個緩存。當數據存滿后產生中斷,CPU響應中斷后通過DMA方式將數據取走,并存入SDRAM中。在DMA傳輸過程中,實時數據則存放到另一塊緩沖區中。而后交替運行,提高DMA的使用效率。
4.2 下位機應用程序
下位機程序流程示意圖如圖4所示,在μclinux操作系統中,下位機程序的實現由兩個主要部分組成:循環傳輸部分和中斷部分。當FPGA中的前級數據采集模塊緩存完畢后,模塊將向ARM發送中斷信號,這時系統將進入中斷部分程序。中斷程序將FPGA中緩存的數據讀到ARM中并以文件的形式保存到SDRAM中,然后返回主程序循環傳輸。循環傳輸的作用是將文件數據傳輸到上位機,循環讀取中斷保存的文件,判斷文件的格式、順序等有沒有錯誤,如果有就提示出錯;如果文件沒有錯誤并且文件數量滿足傳輸條件,則由循環傳輸程序將需要傳輸的文件打包并傳輸到上位機。使用這種機制可以很好地響應中斷,并即時將SDRAM中的數據傳輸到上位機。
4.3 下位機驅動程序
下位機μclinux中的嵌入式驅動設計的目的:一是初始化I/O口,完成讀取FPGA 中乒乓緩存中的數據,二是完成緩存數據模塊發來的中斷信號。其中最重要的是網絡設備的驅動設計。設計用戶接口電路與91c111 連接, 采用Verilog HDL 編寫91c111和NIOS II[4]系統連接邏輯電路,實現高速以太網通訊。運行SOPC Builder 生成系統文件,創建在NIOS II 硬件系統上運行軟件系統所需的支撐文件,提供給軟件開發程序NIOS II 集成開發環境,同時生成硬件描述語言文件,描述系統的硬件信息。Quartus Ⅱ軟件使用這些文件來編譯整個FPGA設計項目。
使用SOPC Builder中的組件編輯器可以把用戶外設和系統連接起來。外設既可以放在NIOS Ⅱ系統中,也可以放在NIOS Ⅱ系統外部,這里采用91c111以太網控制器,使用片外方式。根據91c111各個引腳不同的功能和類型, 把91c111各個引腳和FPGA 的引腳連接;設定91c111為AVALON總線的從器件,通過AVALON總線與NIOS Ⅱ系統相連,而且用到了AVALON總線模塊的16位輸入輸出數據信號線、1位地址線、低電平有效的讀寫信號線、片選和復位信號線,以及中斷請求信號線。通過編寫Verilog HDL 程序,把這些信號線和91c111對應的數據線、命令信號線、讀寫信號線等連接起來。
4.4 上位機程序
上位機程序采用VC編寫,它為下一步數據處理做測試并提供一些API[5]接口,便于后續程序的調用。在ICT系統中,數據通過本系統傳輸到上位機作三維圖像重建。而這里的上位機程序的作用只是對數據傳輸系統的測試。上位機軟件采用基于TCP/IP[6]的socket編程,由于TCP/IP本身具有很好的安全機制,所以傳輸的準確性是可以保證的。而且TCP/IP的通用性好,便于移植。
上位機通過TCP/IP建立TCP server并監聽相應的端口,等待下位機傳輸請求。而后連接請求并實現接收和保存功能,為圖像的重建作準備。
通過對本系統的測試,能夠達到設計的5.2MB/s帶寬要求,并在傳輸帶寬上有很大的提升空間,可以達到6.8MB/s的帶寬。系統已成功應用于重慶大學ICT中心研制的CD-900型工業CT中。基于μclinux的下位機系統的移植性強,可以很方便地移植到其他平臺上,并作相應的性能提升。
參考文獻
[1] 彭澄廉.挑戰SOC——基于NIOS的SOPC設計與實踐[M].北京:清華大學出版社,2004.
[2] 姚天任,孫洪. 現代數字信號處理[M]. 武漢:華中科技大學出版社,1999.
[3] Altera公司.Nios Ⅱprocessor reference book[M]. NII5V2-5.1. 2005:25-75.
[4] Altera公司. Nios Ⅱsoftware developer’s hand-book[M].NII5V2-5.1. 2005:101-114.
[5] 孫鑫,余安萍.VC++深入詳解[M].北京:電子工業出版社,2006:35-99.
[6] 代擁,李昌禧.基于嵌入式以太網接口的數據采集處理系統.微機發展[J],2005,15(5):125-127.