云端遷移過程中的技術問題和解決思路

發布時間:2022-07-12作者:小編閱讀:0

某省級綜合三甲醫院,開放床位 3092 張,開設住院病區 78 個,設有 38 個臨床科室, 15 個醫技科室。2019 年,醫院完成年門急診量 250.7 余萬人次,出院 11.9 余萬人次,完成手術 3.5 萬臺,平均住院日 8.8 天,屬于中等規模的大型三甲醫院。醫院建設有 2 個機房,分別🦋位于兩棟不同的大樓中通過光纖相連接,院內共有 45 個各類信息系統,共有實體服務器及虛擬化服務器 200 余臺。2019 年,根據省衛建委要求,所有醫療機構不建議新建機房,所有服務都應遷移至云端,至此醫院決定將院內所有系統遷移至云端。

云端遷移過程中的技術問題和解決思路

經過調研分析后,選擇國內大型 ISP 商,距醫院 15 公里外的核心機房中構建一個私有云,共需約 8 架 4KW 機柜,含 9 臺計算節點服務器和 10 臺存儲節點服務器、 4 臺管理監控服務器、 4 臺數據庫物理服務器、 1 臺災備前置機服務器、 2 臺集中式雙活存儲、 2 臺光纖交換機,配套網絡設備 2 臺四槽位核心交換機,萬兆交換機 4 臺、千兆交換機 3 臺,并附有等保涉及的安全設備一并規劃,安ౠ全設備將按照等保三標準統一༺建設。項目在建設過程中面臨的技術問題和解決方案如下。

一、 網絡問題

1) 端口管控:醫院計劃與云機房用 40G 帶寬 4 路光纖專線連接。出于安全考慮,與云端的所有連接都要經過端口管控。醫院經過十幾年信息化的發展,也有著自己原本的網絡構架,因為做了內外網隔離,所有院內系統都是在內網中傳輸,只需要設定好 IP 地址就不需要考慮端口的問題。經過云端的端口管控,所有的信息系統都要對端口進行整體測試。私有云的底層架構中網卡的所有配置需要在底層運維人員的修改處理,所有網卡地址的修改都伴隨著端口的統一管理,遷移后要與開發♉廠商共同協調各類端口。對于這個復雜的工作,整個遷移༒項目中采用初期調研,詳細記錄好所有系統及設備的端口使用情況,在云端先建立測試機,與廠商協同測試好相應網卡及端口配置,在系統測試成功后再進行遷移。

問題總結:該問題說明在一個單位將整個系統遷移到云端時一個微小的網絡變動可能會帶來巨大的工作量,由于端口管控符合三級等保要求,且醫院未來的安全管理有賴于端口管控的實施,只能由前期💟充分的調研工作來減輕后期遷移的工作壓力。

2)防火墻設置:信息系統上云后,所有數據將通過醫院內的防火墻和云端的防火墻,防火墻的型號、支持的功能都有不同。醫院內部因為歷史原因,造成的復雜的網絡構架,醫院內網 190.1.240.0/20 網段的地址分布在 vlan1 與 vlan80🌃 內,由于內網啟用了 mux-vlan ,功能院內內網 vlan1 與 vlan80 的 190.1.240.0/20 網段內可以二層互通。隨著業務逐步遷移至云端( vlan80 的部分業務),造成院內 vlan1 中的 IP 地址無法與云端 vlan80 的地址進行二層通信,給正常業務造成影響。解決方案是醫院內 vlan1 發起的流量訪問至云端 vlan80 主機時,在云端核心交換機與防火墻對接鏈路的入接口上,配置基于源、目標 mac 地址的 vlan 映射。根據訪問源、目 mac 地址,將 vlan1 內源主機的 mac 與訪問到目的業務的虛機的 mac 進行匹配,并將該流量進行 vlan tag 映射,將 vlan1 轉換 vlan80 ,達到 vlan1 與 vlan80 互通需求。

問題總結:在將信息系統遷移到云端時,如果是新建私有云,那么最好盡量保證網絡設備能夠使用同廠家、型號🐷,以💎免在后期工作因網絡問題延緩工作進度。

二、 服務器

1)服務器的配置:項目開始初期,云端廠商做了大量的前期調研。整理了醫院現有系統使用的 CPU 、內存、存儲和數據庫等相關信息。醫院原有的無論實體機還是虛擬機都是按照 CPU🍬 核數 1 :1 比例的配置,遷移至云端后,因為🌱云計算資源調配的靈活性, CPU 核數并非按照 1 :1 比例配置。初期云端廠商使用 6 臺服務器做虛擬化計算資源,院方認為醫院內的信息系統比較復雜,有些應用系統對資源的需求量很高,云端如果按照 1 :3 的虛擬 CPU 核數將無法達到院內需求,甚至影響醫院未來信息化發展。通過與云端廠商的討論研究,最終云端廠商同意將計算節點服務器由 6 臺增至 9 臺,并把虛擬 CPU 核數的虛擬比例由 1 :3 降低至 1 :2 ,為此擴容工作將工期多拖延 2 個月。

問題總結:在做私有云規劃時一定與♍云端廠商做好充分溝通,做好需ꦚ求定位的工作,大型廠商的采購流程繁瑣,臨時擴容就會拖延工期甚至影響正常業務。

2)操作系統的安裝:醫院現有服務器有實體的、有使用 ctrix 為底層的 XEN 構架的虛擬機。而云端使用的是使用 openstack+KVM 做虛擬機的構架。整體遷移方案時采用在云端重新安裝操作系統、重新部署應用和安裝數據庫,這樣在將醫院系統遷移至云端就存在很多問題,一些常用的操作系統🦹可以通過直接安裝來解決,而院內虛擬機環境中有些系統是定制化的系統, openstack 支持 qCOW2 格式的虛擬機, XEN 架構只有 ova 或 ovf 格式的虛擬機,面對這樣的定制系統時,如果原始系統安裝鏡像 iso 不能很好的轉換成 qCOW2 格式,那么服務器的基本安裝都存在問題。醫院在遷移中就遇到因操作系𒐪統無法安裝,導致一個重要的系統遲遲不能遷移,后來由云端廠商進行技術攻關才解決此問題。

問題總結:在遷移過程中,操作系統的安裝是十分重要的一步,要考慮還原有系統環境,與🧸院內系統廠商做好溝通,盡量使用原廠 ISO ,當系統廠商沒有上云的經驗,不能提供云端虛擬機能夠正常安裝的鏡像文件時,只能完ꦰ全依靠云端廠商技術攻關解決問題。

3)數據的遷移:能夠保證遷移數據完整性和一致ꦦ性的整機遷移需要通過停機后才可以遷移,而因為醫療行業的特殊性,業務系統的運行不能中斷,醫院也存在各類占用極大空間的數據,使得整體遷移并不能通過短暫停機來實現。

經過論證最終遷移使用的方案就是在源服務器和目標服務器同時安裝數據遷移代理軟件,通過建立好互通的網絡鏈路,架設一臺用于遷移數據的控制服務器對數據進行傳輸校驗。首先在云端建立全新目標機虛擬機,安裝相同的操作系統、預留相同的磁盤空間、部署相同的環境,根據不同應用系統要求在后臺傳輸目標服務器所需要數據,待數據傳輸完成經過校驗后,將源服務器暫時🦂停機數據庫導出通過遷移代理傳輸至目標服務器,目標服務器將數據庫導入恢復,將網絡配置更改后關閉源服務𒀰器,啟用新服務器。數據遷移的過程中一定要注意以下原則,以防目標服務器不可用時產生臟數據。

1. 確保業務系統平穩順利遷移為最根本原則。

2. 在遷移工程中,不進行任何系統架構的調整或變更,以避免項目交叉導致的業務風險。

3. 制定相應的遷移方案,確保宕機時間可控。

4. 需要對遷移前后的應用服務器性能進行對比分析,保證資源利用率的合理性以及 IOPS 要求。

問題總結:數據遷移🌃是整個遷移項目最重要的一環,為保證系統正常運行,數據遷移的每一步都要充分考慮做好相應的應急預案,根據不同的應用系統及環境做有針對性的措施。

三、 存儲

醫院的存儲基本是用服務器自帶硬盤(包括 SAS , SATA 和 SSD )和多個品牌型號的集中存儲。云端使用的是 Ceph 存儲,使用大量服務器插滿硬盤做分布式存儲,這樣不同的存儲方式🀅也帶來不同的問題。Ceph 本身就是分布式存儲構架,優勢在于能夠動態地伸縮、再均衡和修復,醫院內系統應用♒的復雜導致存儲數據的格式差異非常大,如有需要實時讀取的小碎片 XML 文件,也有體積巨大的 DCom 影像文件,而且不同的系統對文件存儲響應時間要求也不同。項目初期時是使用 SAS 和 SATA 硬盤作為存儲,院方與云端廠商提出不同系統的 IO 需求時,云端廠商使用 SSD 硬盤擴容,用于影像系統這類對 IO 要求較高的系統。

問題總結:云端廠商為保證靈活性和性價比,使用分🌳布式存儲,醫院則需要強調院內應用系統的不同需求,如果有對 IO 性能要求較高的系統時,一定保證要有 SSD 以防未來出現瓶頸。

四、 災備

當醫院的所有信息系統遷移至云端后,所有的業務都通過光纖專線進行ܫ傳輸。盡管有 🍷4 條專線,但仍舊存在光纖故障導致醫院業務停滯的可能。

基于以上考慮,這次遷移后將對醫院原有服務器進行充分利舊,做成一個緊急災備機房🥂,將核心業務系統在醫院內做應用級備份。當線路出現故障♏時第一時間能夠啟用醫院內的災備應用,保障醫院所有業務的正常運行。

本次信息系統的數據備份均🅰采用網絡方式進行數據備份,根據醫院需求本次數據備份數據量共計 100TB ,容災數據 15TB 。初期要分別對院內所有需求進行容災和備份的業務系統進行調研并定級,在制定完善調研表后,其中 HIS 、 LIS 等核心系統需要實時數據保護, PACS 系統業務自身為冗余互備模式,不需要使用容災系統,只需對部分數據做定期備份。根據對各業務系統的定級,確定每臺服務器的災備策略,并與各業務系統廠商確認要備份的文件目錄和業務類型,如數據庫或普𝓀通文件等,在災備策略中進行配置。根據業務系統的要求配置對應的備份策略和數據保留策略,啟動容災備份服務,對核心系統(如 HIS , EMR , PACS,LIS, 集成平臺等)建立應用級災備,保證因為網絡問題連接中斷時在院內原有系統可以順利接管。

問題總結:對不同業務系統要制定相應的災備方案,在災備資源有限的前提下要保證業務的正常運行才是災備的核心ꦕ,同時充分利舊院內原有設備也能節約成本。

五、 結語

整體業務全部遷移到到云端是個復雜而龐大的工程,一定要有前期的充分調研,明確的需求定位,與云端廠商和系統廠商的充分交流溝通。即便如此在遷移的過程中仍舊會遇到各種預料不到的技術問題,所以當決定系統整體遷移的時候,務必規劃好工期進度以及軟硬💫件的需求,充分考慮好未來的擴容的需求,內外網互訪,安全管理,災備等方面內容。

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,請🍷聯系站長郵箱:[email protected]進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

標題:云端遷移過程中的技術問題和解決思路

TAG標簽:企業上云

地址://beijingyml.cn/article/20210712171545.html

上一篇:X86 服務器常見故障解決
下一篇:云架構的五項關鍵技術
返回頂部