編譯自: https://opensource.com/article/18/8/what-cicd 作者: Brent Laster譯者: pityonline在軟件開發中經常會提到 持續集成(Continuous Integration)(CI)和 持續交付(Continuous Delivery)(CD)這幾個術語。但它們真正的意思是什麼呢?在談論軟件開發時,經常會提到 持續集成(Continuous Integration)(CI)和 持續交付(Continuous Delivery)(CD)這幾個術語。但它們真正的意思是什麼呢?在本文中,我將解釋這些和相關術語背後的含義和意義,例如 持續測試(Continuous Testing)和 持續部署(Continuous Deployment)。概覽工廠裡的裝配線以快速、自動化、可重復的方式從原材料生產出消費品。同樣,軟件交付管道以快速、自動化和可重復的方式從源代碼生成發佈版本。如何完成這項工作的總體設計稱為“持續交付”(CD)。啟動裝配線的過程稱為“持續集成”(CI)。確保質量的過程稱為“持續測試”,將最終產品提供給用戶的過程稱為“持續部署”。一些專傢讓這一切簡單、順暢、高效地運行,這些人被稱為 運維開發(DevOps)踐行者。“持續”是什麼意思?“持續”用於描述遵循我在此提到的許多不同流程實踐。這並不意味著“一直在運行”,而是“隨時可運行”。在軟件開發領域,它還包括幾個核心概念/最佳實踐。這些是:頻繁發佈:持續實踐背後的目標是能夠頻繁地交付高質量的軟件。此處的交付頻率是可變的,可由開發團隊或公司定義。對於某些產品,一季度、一個月、一周或一天交付一次可能已經足夠頻繁瞭。對於另一些來說,一天可能需要多次交付也是可行的。所謂持續也有“偶爾、按需”的方面。最終目標是相同的:在可重復、可靠的過程中為最終用戶提供高質量的軟件更新。通常,這可以通過很少甚至無需用戶的交互或掌握的知識來完成(想想設備更新)。自動化流程:實現此頻率的關鍵是用自動化流程來處理軟件生產中的方方面面。這包括構建、測試、分析、版本控制,以及在某些情況下的部署。可重復:如果我們使用的自動化流程在給定相同輸入的情況下始終具有相同的行為,則這個過程應該是可重復的。也就是說,如果我們把某個歷史版本的代碼作為輸入,我們應該得到對應相同的可交付產出。這也假設我們有相同版本的外部依賴項(即我們不創建該版本代碼使用的其它交付物)。理想情況下,這也意味著可以對管道中的流程進行版本控制和重建(請參閱稍後的 DevOps 討論)。快速迭代:“快速”在這裡是個相對術語,但無論軟件更新/發佈的頻率如何,預期的持續過程都會以高效的方式將源代碼轉換為交付物。自動化負責大部分工作,但自動化處理的過程可能仍然很慢。例如,對於每天需要多次發佈候選版更新的產品來說,一輪 集成測試(integrated testing)下來耗時就要大半天可能就太慢瞭。什麼是“持續交付管道”?將源代碼轉換為可發佈產品的多個不同的 任務(task)和 作業(job)通常串聯成一個軟件“管道”,一個自動流程成功完成後會啟動管道中的下一個流程。這些管道有許多不同的叫法,例如持續交付管道、部署管道和軟件開發管道。大體上講,程序管理者在管道執行時管理管道各部分的定義、運行、監控和報告。持續交付管道是如何工作的?軟件交付管道的實際實現可以有很大不同。有許多程序可用在管道中,用於源代碼跟蹤、構建、測試、指標采集,版本管理等各個方面。但整體工作流程通常是相同的。單個業務流程/工作流應用程序管理整個管道,每個流程作為獨立的作業運行或由該應用程序進行階段管理。通常,在業務流程中,這些獨立作業是以應用程序可理解並可作為工作流程管理的語法和結構定義的。這些作業被用於一個或多個功能(構建、測試、部署等)。每個作業可能使用不同的技術或多種技術。關鍵是作業是自動化的、高效的,並且可重復的。如果作業成功,則工作流管理器將觸發管道中的下一個作業。如果作業失敗,工作流管理器會向開發人員、測試人員和其他人發出警報,以便他們盡快糾正問題。這個過程是自動化的,所以比手動運行一組過程可更快地找到錯誤。這種快速排錯稱為 快速失敗(fail fast),並且在抵達管道端點方面同樣有價值。“快速失敗”是什麼意思?管道的工作之一就是快速處理變更。另一個是監視創建發佈的不同任務/作業。由於編譯失敗或測試未通過的代碼可以阻止管道繼續運行,因此快速通知用戶此類情況非常重要。快速失敗指的是在管道流程中盡快發現問題並快速通知用戶的方式,這樣可以及時修正問題並重新提交代碼以便使管道再次運行。通常在管道流程中可通過查看歷史記錄來確定是誰做瞭那次修改並通知此人及其團隊。所有持續交付管道都應該被自動化嗎?管道的幾乎所有部分都是應該自動化的。對於某些部分,有一些人為幹預/互動的地方可能是有意義的。一個例子可能是 用戶驗收測試(user-acceptance testing)(讓最終用戶試用軟件並確保它能達到他們想要/期望的水平)。另一種情況可能是部署到生產環境時用戶希望擁有更多的人為控制。當然,如果代碼不正確或不能運行,則需要人工幹預。有瞭對“持續”含義理解的背景,讓我們看看不同類型的持續流程以及它們在軟件管道上下文中的含義。什麼是“持續集成”?持續集成(CI)是在源代碼變更後自動檢測、拉取、構建和(在大多數情況下)進行單元測試的過程。持續集成是啟動管道的環節(盡管某些預驗證 —— 通常稱為 上線前檢查(pre-flight checks) —— 有時會被歸在持續集成之前)。持續集成的目標是快速確保開發人員新提交的變更是好的,並且適合在代碼庫中進一步使用。持續集成是如何工作的?持續集成的基本思想是讓一個自動化過程監測一個或多個源代碼倉庫是否有變更。當變更被推送到倉庫時,它會監測到更改、下載副本、構建並運行任何相關的單元測試。持續集成如何監測變更?目前,監測程序通常是像 Jenkins 這樣的應用程序,它還協調管道中運行的所有(或大多數)進程,監視變更是其功能之一。監測程序可以以幾種不同方式監測變更。這些包括:輪詢:監測程序反復詢問代碼管理系統,“代碼倉庫裡有什麼我感興趣的新東西嗎?”當代碼管理系統有新的變更時,監測程序會“喚醒”並完成其工作以獲取新代碼並構建/測試它。定期:監測程序配置為定期啟動構建,無論源碼是否有變更。理想情況下,如果沒有變更,則不會構建任何新內容,因此這不會增加額外的成本。推送:這與用於代碼管理系統檢查的監測程序相反。在這種情況下,代碼管理系統被配置為提交變更到倉庫時將“推送”一個通知到監測程序。最常見的是,這可以以 webhook 的形式完成 —— 在新代碼被推送時一個 掛勾(hook)的程序通過互聯網向監測程序發送通知。為此,監測程序必須具有可以通過網絡接收 webhook 信息的開放端口。什麼是“預檢查”(又稱“上線前檢查”)?在將代碼引入倉庫並觸發持續集成之前,可以進行其它驗證。這遵循瞭最佳實踐,例如 測試構建(test build)和 代碼審查(code review)。它們通常在代碼引入管道之前構建到開發過程中。但是一些管道也可能將它們作為其監控流程或工作流的一部分。例如,一個名為 Gerrit 的工具允許在開發人員推送代碼之後但在允許進入( Git 遠程)倉庫之前進行正式的代碼審查、驗證和測試構建。Gerrit 位於開發人員的工作區和 Git 遠程倉庫之間。它會“接收”來自開發人員的推送,並且可以執行通過/失敗驗證以確保它們在被允許進入倉庫之前的檢查是通過的。這可以包括檢測新變更並啟動構建測試(CI 的一種形式)。它還允許開發者在那時進行正式的代碼審查。這種方式有一種額外的可信度評估機制,即當變更的代碼被合並到代碼庫中時不會破壞任何內容。什麼是“單元測試”?單元測試(也稱為“提交測試”),是由開發人員編寫的小型的專項測試,以確保新代碼獨立工作。“獨立”這裡意味著不依賴或調用其它不可直接訪問的代碼,也不依賴外部數據源或其它模塊。如果運行代碼需要這樣的依賴關系,那麼這些資源可以用 模擬(mock)來表示。模擬是指使用看起來像資源的 代碼存根(code stub),可以返回值,但不實現任何功能。在大多數組織中,開發人員負責創建單元測試以證明其代碼正確。事實上,一種稱為 測試驅動開發(test-driven develop)(TDD)的模型要求將首先設計單元測試作為清楚地驗證代碼功能的基礎。因為這樣的代碼可以更改速度快且改動量大,所以它們也必須執行很快。由於這與持續集成工作流有關,因此開發人員在本地工作環境中編寫或更新代碼,並通單元測試來確保新開發的功能或方法正確。通常,這些測試采用斷言形式,即函數或方法的給定輸入集產生給定的輸出集。它們通常進行測試以確保正確標記和處理出錯條件。有很多單元測試框架都很有用,例如用於 Java 開發的 JUnit 。什麼是“持續測試”?持續測試是指在代碼通過持續交付管道時運行擴展范圍的自動化測試的實踐。單元測試通常與構建過程集成,作為持續集成階段的一部分,並專註於和其它與之交互的代碼隔離的測試。除此之外,可以有或者應該有各種形式的測試。這些可包括:集成測試 驗證組件和服務組合在一起是否正常。功能測試 驗證產品中執行功能的結果是否符合預期。驗收測試 根據可接受的標準驗證產品的某些特征。如性能、可伸縮性、抗壓能力和容量。所有這些可能不存在於自動化的管道中,並且一些不同類型的測試分類界限也不是很清晰。但是,在交付管道中持續測試的目標始終是相同的:通過持續的測試級別證明代碼的質量可以在正在進行的發佈中使用。在持續集成快速的原則基礎上,第二個目標是快速發現問題並提醒開發團隊。這通常被稱為快速失敗。除瞭測試之外,還可以對管道中的代碼進行哪些其它類型的驗證?除瞭測試是否通過之外,還有一些應用程序可以告訴我們測試用例執行(覆蓋)的源代碼行數。這是一個可以衡量代碼量指標的例子。這個指標稱為 代碼覆蓋率(code-coverage),可以通過工具(例如用於 Java 的 JaCoCo )進行統計。還有很多其它類型的指標統計,例如代碼行數、復雜度以及代碼結構對比分析等。諸如 SonarQube 之類的工具可以檢查源代碼並計算這些指標。此外,用戶還可以為他們可接受的“合格”范圍的指標設置閾值。然後可以在管道中針對這些閾值設置一個檢查,如果結果不在可接受范圍內,則流程終端上。SonarQube 等應用程序具有很高的可配置性,可以設置僅檢查團隊感興趣的內容。什麼是“持續交付”?持續交付(CD)通常是指整個流程鏈(管道),它自動監測源代碼變更並通過構建、測試、打包和相關操作運行它們以生成可部署的版本,基本上沒有任何人為幹預。持續交付在軟件開發過程中的目標是自動化、效率、可靠性、可重復性和質量保障(通過持續測試)。持續交付包含持續集成(自動檢測源代碼變更、執行構建過程、運行單元測試以驗證變更),持續測試(對代碼運行各種測試以保障代碼質量),和(可選)持續部署(通過管道發佈版本自動提供給用戶)。如何在管道中識別/跟蹤多個版本?版本控制是持續交付和管道的關鍵概念。持續意味著能夠經常集成新代碼並提供更新版本。但這並不意味著每個人都想要“最新、最好的”。對於想要開發或測試已知的穩定版本的內部團隊來說尤其如此。因此,管道創建並輕松存儲和訪問的這些版本化對象非常重要。在管道中從源代碼創建的對象通常可以稱為 工件(artifact)。工件在構建時應該有應用於它們的版本。將版本號分配給工件的推薦策略稱為 語義化版本控制(semantic versioning)。(這也適用於從外部源引入的依賴工件的版本。)語義版本號有三個部分: 主要版本(major)、 次要版本(minor) 和 補丁版本(patch)。(例如,1.4.3 反映瞭主要版本 1,次要版本 4 和補丁版本 3。)這個想法是,其中一個部分的更改表示工件中的更新級別。主要版本僅針對不兼容的 API 更改而遞增。當以 向後兼容(backward-compatible)的方式添加功能時,次要版本會增加。當進行向後兼容的版本 bug 修復時,補丁版本會增加。這些是建議的指導方針,但隻要團隊在整個組織內以一致且易於理解的方式這樣做,團隊就可以自由地改變這種方法。例如,每次為發佈完成構建時增加的數字可以放在補丁字段中。如何“分銷”工件?團隊可以為工件分配 分銷(promotion)級別以指示適用於測試、生產等環境或用途。有很多方法。可以用 Jenkins 或 Artifactory 等應用程序進行分銷。或者一個簡單的方案可以在版本號字符串的末尾添加標簽。例如,-snapshot 可以指示用於構建工件的代碼的最新版本(快照)。可以使用各種分銷策略或工具將工件“提升”到其它級別,例如 -milestone 或 -production,作為工件穩定性和完備性版本的標記。如何存儲和訪問多個工件版本?從源代碼構建的版本化工件可以通過管理 工件倉庫(artifact repository)的應用程序進行存儲。工件倉庫就像構建工件的版本控制工具一樣。像 Artifactory 或 Nexus 這類應用可以接受版本化工件,存儲和跟蹤它們,並提供檢索的方法。管道用戶可以指定他們想要使用的版本,並在這些版本中使用管道。什麼是“持續部署”?持續部署(CD)是指能夠自動提供持續交付管道中發佈版本給最終用戶使用的想法。根據用戶的安裝方式,可能是在雲環境中自動部署、app 升級(如手機上的應用程序)、更新網站或隻更新可用版本列表。這裡的一個重點是,僅僅因為可以進行持續部署並不意味著始終部署來自管道的每組可交付成果。它實際上指,通過管道每套可交付成果都被證明是“可部署的”。這在很大程度上是由持續測試的連續級別完成的(參見本文中的持續測試部分)。管道構建的發佈成果是否被部署可以通過人工決策,或利用在完全部署之前“試用”發佈的各種方法來進行控制。在完全部署到所有用戶之前,有哪些方法可以測試部署?由於必須回滾/撤消對所有用戶的部署可能是一種代價高昂的情況(無論是技術上還是用戶的感知),已經有許多技術允許“嘗試”部署新功能並在發現問題時輕松“撤消”它們。這些包括:藍/綠測試/部署在這種部署軟件的方法中,維護瞭兩個相同的主機環境 —— 一個“藍色” 和一個“綠色”。(顏色並不重要,僅作為標識。)對應來說,其中一個是“生產環境”,另一個是“預發佈環境”。在這些實例的前面是調度系統,它們充當產品或應用程序的客戶“網關”。通過將調度系統指向藍色或綠色實例,可以將客戶流量引流到期望的部署環境。通過這種方式,切換指向哪個部署實例(藍色或綠色)對用戶來說是快速,簡單和透明的。當新版本準備好進行測試時,可以將其部署到非生產環境中。在經過測試和批準後,可以更改調度系統設置以將傳入的線上流量指向它(因此它將成為新的生產站點)。現在,曾作為生產環境實例可供下一次候選發佈使用。同理,如果在最新部署中發現問題並且之前的生產實例仍然可用,則簡單的更改可以將客戶流量引流回到之前的生產實例 —— 有效地將問題實例“下線”並且回滾到以前的版本。然後有問題的新實例可以在其它區域中修復。金絲雀測試/部署在某些情況下,通過藍/綠發佈切換整個部署可能不可行或不是期望的那樣。另一種方法是為 金絲雀(canary)測試/部署。在這種模型中,一部分客戶流量被重新引流到新的版本部署中。例如,新版本的搜索服務可以與當前服務的生產版本一起部署。然後,可以將 10% 的搜索查詢引流到新版本,以在生產環境中對其進行測試。如果服務那些流量的新版本沒問題,那麼可能會有更多的流量會被逐漸引流過去。如果仍然沒有問題出現,那麼隨著時間的推移,可以對新版本增量部署,直到 100% 的流量都調度到新版本。這有效地“更替”瞭以前版本的服務,並讓新版本對所有客戶生效。功能開關對於可能需要輕松關掉的新功能(如果發現問題),開發人員可以添加 功能開關(feature toggles)。這是代碼中的 if-then 軟件功能開關,僅在設置數據值時才激活新代碼。此數據值可以是全局可訪問的位置,部署的應用程序將檢查該位置是否應執行新代碼。如果設置瞭數據值,則執行代碼;如果沒有,則不執行。這為開發人員提供瞭一個遠程“終止開關”,以便在部署到生產環境後發現問題時關閉新功能。暗箱發佈在 暗箱發佈(dark launch)中,代碼被逐步測試/部署到生產環境中,但是用戶不會看到更改(因此名稱中有 暗箱(dark)一詞)。例如,在生產版本中,網頁查詢的某些部分可能會重定向到查詢新數據源的服務。開發人員可收集此信息進行分析,而不會將有關接口,事務或結果的任何信息暴露給用戶。這個想法是想獲取候選版本在生產環境負載下如何執行的真實信息,而不會影響用戶或改變他們的經驗。隨著時間的推移,可以調度更多負載,直到遇到問題或認為新功能已準備好供所有人使用。實際上功能開關標志可用於這種暗箱發佈機制。什麼是“運維開發”?運維開發 (DevOps) 是關於如何使開發和運維團隊更容易合作開發和發佈軟件的一系列想法和推薦的實踐。從歷史上看,開發團隊研發瞭產品,但沒有像客戶那樣以常規、可重復的方式安裝/部署它們。在整個周期中,這組安裝/部署任務(以及其它支持任務)留給運維團隊負責。這經常導致很多混亂和問題,因為運維團隊在後期才開始介入,並且必須在短時間內完成他們的工作。同樣,開發團隊經常處於不利地位 —— 因為他們沒有充分測試產品的安裝/部署功能,他們可能會對該過程中出現的問題感到驚訝。這往往導致開發和運維團隊之間嚴重脫節和缺乏合作。DevOps 理念主張是貫穿整個開發周期的開發和運維綜合協作的工作方式,就像持續交付那樣。持續交付如何與運維開發相交?持續交付管道是幾個 DevOps 理念的實現。產品開發的後期階段(如打包和部署)始終可以在管道的每次運行中完成,而不是等待產品開發周期中的特定時間。同樣,從開發到部署過程中,開發和運維都可以清楚地看到事情何時起作用,何時不起作用。要使持續交付管道循環成功,不僅要通過與開發相關的流程,還要通過與運維相關的流程。說得更遠一些,DevOps 建議實現管道的基礎架構也會被視為代碼。也就是說,它應該自動配置、可跟蹤、易於修改,並在管道發生變化時觸發新一輪運行。這可以通過將管道實現為代碼來完成。什麼是“管道即代碼”?管道即代碼(pipeline-as-code)是通過編寫代碼創建管道作業/任務的通用術語,就像開發人員編寫代碼一樣。它的目標是將管道實現表示為代碼,以便它可以與代碼一起存儲、評審、跟蹤,如果出現問題並且必須終止管道,則可以輕松地重建。有幾個工具允許這樣做,如 Jenkins 2 。DevOps 如何影響生產軟件的基礎設施?傳統意義上,管道中使用的各個硬件系統都有配套的軟件(操作系統、應用程序、開發工具等)。在極端情況下,每個系統都是手工設置來定制的。這意味著當系統出現問題或需要更新時,這通常也是一項自定義任務。這種方法違背瞭持續交付的基本理念,即具有易於重現和可跟蹤的環境。多年來,很多應用被開發用於標準化交付(安裝和配置)系統。同樣, 虛擬機(virtual machine)被開發為模擬在其它計算機之上運行的計算機程序。這些 VM 要有管理程序才能在底層主機系統上運行,並且它們需要自己的操作系統副本才能運行。後來有瞭 容器(container)。容器雖然在概念上與 VM 類似,但工作方式不同。它們隻需使用一些現有的操作系統結構來劃分隔離空間,而不需要運行單獨的程序和操作系統的副本。因此,它們的行為類似於 VM 以提供隔離但不需要過多的開銷。VM 和容器是根據配置定義創建的,因此可以輕易地銷毀和重建,而不會影響運行它們的主機系統。這允許運行管道的系統也可重建。此外,對於容器,我們可以跟蹤其構建定義文件的更改 —— 就像對源代碼一樣。因此,如果遇到 VM 或容器中的問題,我們可以更容易、更快速地銷毀和重建它們,而不是在當前環境嘗試調試和修復。這也意味著對管道代碼的任何更改都可以觸發管道新一輪運行(通過 CI),就像對代碼的更改一樣。這是 DevOps 關於基礎架構的核心理念之一。via: https://opensource.com/article/18/8/what-cicd作者: Brent Laster 選題: lujun9972 譯者: pityonline 校對: wxy本文由 LCTT 原創編譯, Linux中國 榮譽推出點擊“瞭解更多”可訪問文內鏈接
本文出自快速备案,转载时请注明出处及相应链接。