2024云棲大會(huì) 阿里云彈性計(jì)算演講材料合輯-部分2_第1頁
2024云棲大會(huì) 阿里云彈性計(jì)算演講材料合輯-部分2_第2頁
2024云棲大會(huì) 阿里云彈性計(jì)算演講材料合輯-部分2_第3頁
2024云棲大會(huì) 阿里云彈性計(jì)算演講材料合輯-部分2_第4頁
2024云棲大會(huì) 阿里云彈性計(jì)算演講材料合輯-部分2_第5頁
已閱讀5頁,還剩691頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大幅簡(jiǎn)化的集群創(chuàng)建流程·大幅簡(jiǎn)化的集群創(chuàng)建流程·提供30余項(xiàng)默認(rèn)最佳實(shí)踐配置彈性伸縮彈性伸縮節(jié)點(diǎn)管理可觀測(cè)從控制面免運(yùn)維到大規(guī)模節(jié)點(diǎn)自動(dòng)化運(yùn)維,大幅簡(jiǎn)化運(yùn)維負(fù)擔(dān)··支持節(jié)點(diǎn)OS與Kubelet批量配置變更·更靈活的維護(hù)周期策略·聯(lián)動(dòng)ECS主動(dòng)運(yùn)維事件,降低業(yè)務(wù)中斷風(fēng)險(xiǎn)置(即將上線)運(yùn)維職責(zé)下移至阿里云策路controller結(jié)合領(lǐng)域經(jīng)驗(yàn)和大模型,定義新的集群運(yùn)維方式在生產(chǎn)環(huán)境中使用Kubernetes生態(tài)遇到的挑戰(zhàn)*很難選擇和驗(yàn)證大量云原生生態(tài)系統(tǒng)中的組件配置問題導(dǎo)致合規(guī)性和可用性問題超過60%的受訪者正在來采用AIOps提高服務(wù)和應(yīng)用程序的可用性和性能**難以妥善防范安全漏洞許多Kubernetes生態(tài)系統(tǒng)組件缺乏企業(yè)級(jí)技術(shù)支持置*TheSpectroCloud2024StateofProductionKubernetes容器服務(wù)AI助手Enhanced診斷成功率>80%根因定位率>診斷成功率>80%根因定位率>70%EWNEWVEWEW集群規(guī)劃輔助生成智能體檢集群&應(yīng)用優(yōu)化集群規(guī)劃輔助生成應(yīng)用層智能診斷成本優(yōu)化應(yīng)用安全分析集成模型層容器領(lǐng)域大模型ACK專家知識(shí)庫數(shù)據(jù)層安全套件成本套件集群巡檢可觀測(cè)性AI配置優(yōu)化建議優(yōu)化建議優(yōu)化建議8.在nodepools'中啟用等保加固或阿里云OS加·實(shí)例規(guī)格:配ecs.g6.xlarge*.二resource"auicloudcansged_xunt1.224-atin.ChecxthelatesteyNginx鏡像,并確保該部署具備一定的安全性和穩(wěn)定性,同YAML生成結(jié)果以下是一個(gè)基本的YAML示例,它包含了Deployment和yamlyaml□nathe"Astaraap"NES存上應(yīng)用YAML安全分析您的集群gitop-hal的健康分?jǐn)?shù)如下:集群智能體檢能力,結(jié)合容器服務(wù)領(lǐng)先的結(jié)合容器服務(wù)領(lǐng)先的可觀測(cè)體系、專家經(jīng)型,幫助用戶提前發(fā)將從集群隱定性風(fēng)險(xiǎn)、集群容量風(fēng)險(xiǎn)、集群安全風(fēng)險(xiǎn)、將從集群隱定性風(fēng)險(xiǎn)、集群容量風(fēng)險(xiǎn)、集群安全風(fēng)險(xiǎn)、集群PoweredbyTongyi容器領(lǐng)域大模型ACK專家知識(shí)增強(qiáng)20+領(lǐng)域?qū)<医?jīng)驗(yàn)檢查項(xiàng)1.穩(wěn)定性風(fēng)險(xiǎn)FinOpsFinOps成本套件檢查發(fā)現(xiàn)以下集群組件需要更新版本alicloud-disk-controller,nginx-Ingress-contro使用過時(shí)的組件可能導(dǎo)致安全漏洞、功能缺失或性能問建議在組件管理頁面升級(jí)這些組件到最新版本件容器鏡像掃描件容器鏡像掃描·集群工作負(fù)載配置風(fēng)險(xiǎn)用戶界面診斷場(chǎng)景覆蓋NEWNEW數(shù)據(jù)采集/分析控制臺(tái)一鍵診斷問題分析問題根因求。修復(fù)操作建議現(xiàn)關(guān)鍵異常場(chǎng)景全覆蓋,診斷成功率80%,根因定位率>70%,幫運(yùn)行時(shí)安全問題運(yùn)行時(shí)安全問題錯(cuò)誤配置檢測(cè)CVE漏洞修補(bǔ)CVE漏洞修補(bǔ)鑒權(quán)/認(rèn)錯(cuò)錯(cuò)誤為此,AI助手增強(qiáng)了安全方面的感知,進(jìn)一步降低安全風(fēng)險(xiǎn)管理的門檻智能安全分析集群安全數(shù)據(jù)采集集群安全風(fēng)險(xiǎn)分析自然語言安全報(bào)告穩(wěn)定性大模型驅(qū)動(dòng)安全分析安全分析采集采集評(píng)評(píng)群未能項(xiàng)功全風(fēng)助息群未能項(xiàng)功全風(fēng)助息性,性基于容器服務(wù)的集群安全能力、專家知識(shí)、容器領(lǐng)域大模型,幫助用戶快速發(fā)現(xiàn)集群安全風(fēng)險(xiǎn)整體的分析、總結(jié)CVE-2023-20569,CVE-2023-20592,均為中等風(fēng)險(xiǎn)級(jí)些漏洞均未報(bào)告有實(shí)際利用案例,且官方已提供補(bǔ)丁。漏洞名稱:allinux3:3:ALI是否需要重啟修復(fù):否-Cvss分?jǐn)?shù):6.2-CVE描述:關(guān)于AMD處理器的返回地址預(yù)測(cè)器的漏洞,具利用ACK(阿里云容器服務(wù)Kubernetes版)的安全策略功能。以下是具體的步驟開啟名為ACKServicesDeleteProtection的安全策略【Constraint】name:service-e-deledescription:"Protecttodeletparar智能成本優(yōu)化用戶界面應(yīng)用成本分析應(yīng)用成本分析創(chuàng)建時(shí)間創(chuàng)建時(shí)間量智能優(yōu)化)/aegistration:y0.6.0-710集群成本分析m容器領(lǐng)域大模型ACK專家知識(shí)增強(qiáng)資源畫像閑置資源檢查成本分析應(yīng)用成本分析報(bào)告應(yīng)用成本分析報(bào)告·Usage:0.3cor···集群成本分析報(bào)告集群成本分析報(bào)告根據(jù)提供的JSON數(shù)據(jù)中的信息,有一個(gè)診斷項(xiàng)指出了一個(gè)問題:一個(gè)名為1-bp?3gqzikzetfiajpzmy的實(shí)例被標(biāo)記為"dleNode",但是這個(gè)實(shí)例并不屬于當(dāng)前集群(EcsIsNatFronNode),并且這個(gè)問題被標(biāo)記為錯(cuò)誤級(jí)別。這種情況可能會(huì)對(duì)成本產(chǎn)生以下影響1.資源浪費(fèi)。如果實(shí)例被錯(cuò)誤地娜定到了集群資源標(biāo)簽上,但實(shí)際上并不屬于集群的一部分,那么這意味著它可能沒有被充分利用。這會(huì)導(dǎo)致資源的浪資,因?yàn)槟憧赡茉谥Ц兑粋€(gè)沒有得到充分利用或完全未使用的實(shí)例的費(fèi)用。2.計(jì)費(fèi)不準(zhǔn)確:。由于實(shí)例不屬于集群,它的計(jì)算資源、存儲(chǔ)和其他相關(guān)服務(wù)的使用情況可能沒有被正確地統(tǒng)計(jì)到集群的成本中。如果集群的成本優(yōu)化策略依賴于準(zhǔn)確的資源使用統(tǒng)計(jì),那么這種錯(cuò)誤的綁定可能導(dǎo)致成本優(yōu)化措施失效3.管理復(fù)奈度增加:。錯(cuò)誤的資源標(biāo)簽可能導(dǎo)致管理和監(jiān)控工具濕淆,使得難以追蹤實(shí)際的資源使用情況和成本分配。這會(huì)增加成本分析的復(fù)雜度,并且可能導(dǎo)致額外的人力成本用于排查問題最佳實(shí)踐:阿里云容器服務(wù)ACK/ACR/ASM供應(yīng)鏈安全產(chǎn)品能力發(fā)布及實(shí)踐演示匡大虎(長(zhǎng)慮)黃竹剛(竹剛)馬元元(法茲)程濤(秋覺)目錄容器供應(yīng)鏈安全形勢(shì)和規(guī)范標(biāo)準(zhǔn)匡大虎(長(zhǎng)慮)源自redis-py代碼庫的異步邏輯漏洞導(dǎo)致OpenAIChatGPTPlus泄露用戶詳細(xì)信息洞,直接導(dǎo)致KuhemetesEnvoy,gRPC,Jetty等火熱開源社區(qū)發(fā)布緊急修復(fù)版本針對(duì)Polyfllio的軟件供應(yīng)鏈攻擊危及10萬個(gè)npm倉庫中的一系列軟件包被發(fā)現(xiàn)包含外泄Kubernetes配置和SSH密鑰的后門CVSS10分高危漏洞GVE-2024-2094針對(duì)XZ和liblzma的定向后門供應(yīng)鏈攻擊,漏同利用者可以繞過認(rèn)證進(jìn)行主機(jī)SSH登錄,還可以以root權(quán)限遠(yuǎn)程執(zhí)行命令2023.9202自2019年以來,軟件供應(yīng)鏈攻擊平均每年增加742%。sOURCETHREATS運(yùn)行時(shí)威脅分析和防護(hù)運(yùn)行時(shí)威脅分析和防護(hù)制品安全掃描/測(cè)試/分析主動(dòng)掃描&威脅分析倉庫和制品掃描分析運(yùn)行時(shí)工作負(fù)載掃描倉庫和制品掃描分析運(yùn)行時(shí)工作負(fù)載掃描Kubernetes安全態(tài)勢(shì)管理云安全態(tài)勢(shì)管理云基礎(chǔ)設(shè)施訪問控制基于ACK容器服務(wù)構(gòu)建企業(yè)應(yīng)用端到端供應(yīng)鏈安全匡大虎(長(zhǎng)慮)黃竹剛(竹剛)容器供應(yīng)鏈安全產(chǎn)品能力升級(jí)更標(biāo)準(zhǔn)、更易用、更智能策略治理可信生產(chǎn)新特性策略治理可信生產(chǎn)深勢(shì)科技基于容器服務(wù)的策略深勢(shì)科技基于容器服務(wù)的策略置安全風(fēng)險(xiǎn)的主動(dòng)防御和安全審計(jì)機(jī)密計(jì)算零信任機(jī)密計(jì)算零信任可信管理2可信分發(fā)可信分發(fā)最小化授權(quán)更標(biāo)準(zhǔn)、更易用、更智能容器供應(yīng)鏈安全能力流程圖供應(yīng)鏈全生命周期安全產(chǎn)品能力布局和增強(qiáng)構(gòu)建構(gòu)建&分發(fā)部署運(yùn)行時(shí)名名·SBOM收集&分析通用加簽方案升級(jí)保護(hù)安全監(jiān)控告警機(jī)密計(jì)算安全監(jiān)控告警機(jī)密計(jì)算安全概覽安全巡檢憑據(jù)管理網(wǎng)絡(luò)微隔離安全加固安全加固基于OClv1.1的通用云原生制品完整性和安全防護(hù)簽簽名驗(yàn)簽成本降低,兼用社區(qū)通用規(guī)范成本降低,兼用社區(qū)通用規(guī)范持續(xù)收斂RAM和RBAC授權(quán)風(fēng)險(xiǎn)臨近過期賬號(hào)離職或刪除綁定cluster-admin集群內(nèi)K8s資源云資源回收站⑨⑤⑤⑨采集掃描清理關(guān)聯(lián)采集漏洞庫eBPF程序盤占用百分比(80%-85%)進(jìn)行·防止過大鏡像(大模型場(chǎng)景)占用Nodescription,website,ortop曰Custompropertiescmd/notation-alibabacloud-secret-manadocsinterna.gitignoreaddalibabacloudseOMakefileREADME,mdaddalSECURITY.mdaddalibabacloudsecretman基于OCIVL1規(guī)范使用服務(wù)網(wǎng)格實(shí)現(xiàn)應(yīng)用無感的零信任安全馬元元(法茲)構(gòu)建高效、透明的容器應(yīng)用安全體系:以服務(wù)網(wǎng)格為中心的零信任安全策略實(shí)施ACK集群-1業(yè)務(wù)容器開箱即用,應(yīng)用無感,范圍靈活業(yè)務(wù)容器書·網(wǎng)格代理使用簽發(fā)到的證書進(jìn)行ASMASM控制平面應(yīng)用、運(yùn)維角色分離,支持多種協(xié)議,訪問審計(jì)后拼圖后拼圖4.授權(quán)策略業(yè)務(wù)容器業(yè)務(wù)容器5.目標(biāo)規(guī)則ACK集群服務(wù)ACR軟件供應(yīng)鏈安全產(chǎn)品能力發(fā)布及實(shí)踐程濤(秋覺)內(nèi)容洞察,生成標(biāo)準(zhǔn)容器鏡像構(gòu)建智能診斷能力全新發(fā)布構(gòu)構(gòu)建智能診斷風(fēng)險(xiǎn)利用業(yè)務(wù)鏡像敏感信息權(quán)限漏洞風(fēng)險(xiǎn)透?jìng)魅萜麋R像構(gòu)建構(gòu)建異常信息殘留特權(quán)身份構(gòu)建失敗風(fēng)險(xiǎn)隱患錯(cuò)誤指令敏感信息特權(quán)指令部署硬編碼的敏感信息、特權(quán)指硬編碼的敏感信息、特權(quán)指令和高危依賴可能存在隱患的外部依賴訪問風(fēng)險(xiǎn)con風(fēng)文于提供明確的問題根因和修復(fù)建議結(jié)合大模型使和修復(fù)方案容器鏡像軟件物料清單能力全新發(fā)布一目了然,分析和識(shí)別容器鏡像內(nèi)容構(gòu)成支持自動(dòng)、手動(dòng)觸發(fā)容器鏡像內(nèi)容分析,識(shí)別操作系統(tǒng)、軟件包等詳細(xì)信息,洞察容器鏡像內(nèi)容物料清單,可集成進(jìn)軟件供應(yīng)鏈容器鏡像軟件物料清單(SBOM)舉一反三,快速定位問題容器鏡像支持全球化分發(fā)場(chǎng)景支持對(duì)接自定義支持對(duì)接自定義KMS密鑰對(duì)容標(biāo)準(zhǔn)化管理和使用軟件供應(yīng)鏈安全產(chǎn)物生態(tài)工具完全兼容產(chǎn)品能力全面支持生態(tài)工具完全兼容產(chǎn)品能力全面支持〔-〕同里云容器鏡像服務(wù)/實(shí)例列表/交付鏈容器鏡像服務(wù)/實(shí)例列表/執(zhí)行記錄/詳情基本信息交付鏈記錄只交付鏈話OCIv1.1支持云原生Al加速生成式人工智能應(yīng)用的部署構(gòu)建Kubernetes正成為數(shù)字化、智能化應(yīng)用的云原生基礎(chǔ)設(shè)施ZooZoo-高性能網(wǎng)絡(luò)高性能存儲(chǔ)高性能網(wǎng)絡(luò)高性能存儲(chǔ)異構(gòu)算力WhichdatsworkloadsookBsWhichdatsworkloadsookBsIDC預(yù)測(cè):到2025年,幾乎50%的用于性能密集型計(jì)算(如AIusedtotrainnotableartificialObjectNeirnatormerlogalattentonDeooupledwelghtdeoayregularlzationGPT3:175B參數(shù),單次訓(xùn)練使用45TB數(shù)據(jù),近干卡A100/1個(gè)月,成本數(shù)百萬美元。NLBOPT資源浪費(fèi)資源浪費(fèi)啟動(dòng)耗時(shí)長(zhǎng)0啟動(dòng)耗時(shí)長(zhǎng)0彈性滯后彈性滯后606606固定實(shí)例數(shù)固定實(shí)例數(shù)一自動(dòng)彈性一推理服務(wù)大模型推理需要基于請(qǐng)求數(shù)的自動(dòng)彈性策略基于GPU的彈性,并不能完全反映業(yè)務(wù)的真實(shí)使用情況,而基于并發(fā)數(shù)或者每秒處理請(qǐng)求(QPS/RPS),對(duì)于推理服務(wù)Serving提供了基于請(qǐng)求的自動(dòng)彈性能力來說更能直接反映服務(wù)性能,Serving提供了基于請(qǐng)求的自動(dòng)彈性能力ActivatorActivatoron/offPod數(shù)=并發(fā)請(qǐng)求總數(shù)/(Pod最大并發(fā)數(shù)*目標(biāo)使用率)特定離線推理場(chǎng)景需要縮容到0KnativeServing中定義了2種請(qǐng)求訪問模式Y(jié)YActivatorAutoscalerACKACSACK彈性容器實(shí)例ECI公共云、專有云標(biāo)準(zhǔn)化高集成產(chǎn)品化差異性高可用通過保留資源池降低資源使用成本常態(tài)情況下使用ECS資常態(tài)情況下使用ECS資源請(qǐng)求數(shù)請(qǐng)求數(shù)時(shí)間以通過保留資源池實(shí)現(xiàn)資時(shí)間固定實(shí)例數(shù)HPACronHPA固定實(shí)例數(shù)HPACronHPA智能彈性智能彈性實(shí)時(shí)生效Pod生命周期實(shí)時(shí)生效AHPA彈性預(yù)測(cè)AHPA彈性預(yù)測(cè)目標(biāo)GPU使用率/RT/QPS等根據(jù)POD生命周期計(jì)算POD冷啟動(dòng)時(shí)間Pod數(shù)Pod數(shù)指標(biāo)資源指標(biāo)伸縮對(duì)象2.固定實(shí)例數(shù)+彈性兜底。3.需要推薦實(shí)例數(shù)配置降級(jí)保護(hù)主動(dòng)預(yù)測(cè)3.需要推薦實(shí)例數(shù)配置降級(jí)保護(hù):9443/api/v1/prometheus/da9d7dece?f1db4c95b9c40e93e/1581204543170042/417d182c6d430fb062ec364e6dfb(HuggingFace,Tensorflow,PyTorch,SAliyunOSs/AliyunNAS/HadoopFileSystem/S3核心功能:vLLM模型推理服務(wù)啟動(dòng)耗時(shí)(單位:秒)水平擴(kuò)容模型存儲(chǔ)水平擴(kuò)容AlAl應(yīng)用側(cè)模型文件預(yù)讀FluidSDK在AI應(yīng)用Pod中多線程并速模型加載過程彈性伸縮的分布式緩存彈性伸縮的分布式緩存可用帶寬,支撐模型加載過程的高帶寬需求·LLM模型參數(shù)大多以Safetensors文件格式分發(fā)存算分離架構(gòu)下文件系統(tǒng)實(shí)現(xiàn)影響,I/O效率低下?!?機(jī)器節(jié)點(diǎn)帶寬利用率不到20%)·將模型參數(shù)文件提前預(yù)讀到隨機(jī)讀友好的本地內(nèi)存緩存·多線程并行順序預(yù)讀,節(jié)點(diǎn)帶寬利用率提升至80%以上·Knative應(yīng)用的靈活彈性->存儲(chǔ)側(cè)供給帶寬的靈活彈性·存儲(chǔ)系統(tǒng)聚焦于數(shù)據(jù)持久化可靠性、穩(wěn)定性,往往無法提供彈性帶寬的靈活選擇?!ぴ贙ubernetes集群內(nèi)構(gòu)建可彈性擴(kuò)縮容的計(jì)算側(cè)分布式·支持主動(dòng)擴(kuò)縮容:根據(jù)業(yè)務(wù)場(chǎng)景主動(dòng)執(zhí)行擴(kuò)縮容操作ge緩存運(yùn)維帶來的復(fù)雜度·一次AI應(yīng)用擴(kuò)容/更新的流程:緩存擴(kuò)容->緩存數(shù)據(jù)預(yù)熱->擴(kuò)容/更新AI應(yīng)用->等待AI應(yīng)用就緒->緩存縮容·如何簡(jiǎn)化、自動(dòng)化AI應(yīng)用的擴(kuò)容和更新發(fā)布流程?擴(kuò)容/更新AI應(yīng)用flow.run(f"publish-model-{datetime.now().strftime('%Y%m%方案容器服務(wù)-ACKOne莊宇(宇匯)目錄目錄02注冊(cè)集群-接入并管理不同供應(yīng)商K8s集群03邊緣集群一接入和管理不同位置計(jì)算資源04多集群艦隊(duì)-統(tǒng)一管理多個(gè)K8s集群多集群ACK注冊(cè)集群NodeNode多集群多集群全局可觀測(cè)多集群作業(yè)調(diào)度多集群應(yīng)用分發(fā)多集群·使用云上ECS/ECl彈性擴(kuò)展IDC集群算力合規(guī)能力·接入分散算力資源實(shí)現(xiàn)容器化管理·支持邊緣自治與高性能容器網(wǎng)絡(luò)·統(tǒng)一控制面,簡(jiǎn)化多集群運(yùn)維目錄01分布式云容器平臺(tái)ACK目錄02注冊(cè)集群-接入并管理不同供應(yīng)商K8s集群03邊緣集群一接入和管理不同位置計(jì)算資源04多集群艦隊(duì)-統(tǒng)一管理多個(gè)K8s集群云上彈性非阿里云畫阿里云的產(chǎn)品和服務(wù)可以運(yùn)行在備份恢復(fù)(跨云遷移):ACK-Fluid分布式云ACKOne-注冊(cè)集群-云上彈性混合云彈性-ECS/ECI·云上ECS節(jié)點(diǎn)支持自動(dòng)彈性伸縮,應(yīng)對(duì)業(yè)務(wù)流量高峰·云上虛擬節(jié)點(diǎn)支持Pod極致彈性,啟動(dòng)快,無需管理節(jié)點(diǎn)收益:彈性獲取云上萬核計(jì)算資源,徹底解決IDC資源焦慮,綜合成本降低聘智聯(lián)招聘分布式云ACKOne-注冊(cè)集群-可觀測(cè)性與FinOps開箱即用可觀測(cè)大盤:事件,監(jiān)控,日志,成本ObservabilityAgents注冊(cè)集群非阿里云CC分布式云ACKOne-注冊(cè)集群-備份中心存儲(chǔ)(PV)目錄目錄02注冊(cè)集群-接入并管理不同供應(yīng)商K8s集群03邊緣集群一接入和管理不同位置計(jì)算資源04多集群艦隊(duì)-統(tǒng)一管理多個(gè)K8s集群分布式云ACKOne-邊緣集群-云邊協(xié)同一體化在線音視頻直播云游戲在線教育物流零售電商文娛自動(dòng)駕駛邊緣自治異構(gòu)資源網(wǎng)絡(luò)協(xié)同OTA升級(jí)流量復(fù)用單元化管理云原生Al套件云安全云上彈性云存儲(chǔ)可觀測(cè)云網(wǎng)絡(luò)Network公網(wǎng)跨地域ECS跨地域ECS邊緣計(jì)算設(shè)施/分布式云邊緣設(shè)備/智能設(shè)備分布式云ACKOne-邊緣集群-管理本地?cái)?shù)據(jù)中心算力云端節(jié)點(diǎn)池(集群同VPC)云端節(jié)點(diǎn)池(集群同VPC)邊緣自治可觀測(cè)性接入云云本地?cái)?shù)據(jù)中本地?cái)?shù)據(jù)中心·云邊流量復(fù)用,大幅度降低大規(guī)模業(yè)務(wù)發(fā)布時(shí)帶來的流量ACKEdge+ACK云原生ACKEdge+ACK云原生Al套件云邊協(xié)同IDC節(jié)點(diǎn)通過專線接入痛點(diǎn)數(shù)據(jù)加載慢專線優(yōu)勢(shì)優(yōu)勢(shì)目錄目錄02注冊(cè)集群-接入并管理不同供應(yīng)商K8s集群03邊緣集群一接入和管理不同位置計(jì)算資源04多集群艦隊(duì)-統(tǒng)一管理多個(gè)K8s集群多集群多集群應(yīng)用分發(fā)多集群多集群多集群ACK注冊(cè)集群r互聯(lián)網(wǎng)游戲金融制造跨集群資源分發(fā)New效率—鍵實(shí)現(xiàn)批量應(yīng)用的全球多地效率質(zhì)量多維度調(diào)度策略多維度調(diào)度策略ACKCluster集群中無可用GPU資源圖例:/密鑰服務(wù);分布式云ACKOne-艦隊(duì)-多集群全局監(jiān)控、全局FinOps0AlibabaCloud分布式云ACKOne-艦隊(duì)-多集群組件管理組件基線定義多個(gè)組件版本,AlibabaCloudAlibabaCloudACK組件通過批次部署實(shí)現(xiàn)集群間灰度發(fā)布和異?;貪L通過批次部署實(shí)現(xiàn)集群間灰度發(fā)布和異常回滾目錄目錄02注冊(cè)集群-接入并管理不同供應(yīng)商K8s集群03邊緣集群一接入和管理不同位置計(jì)算資源04多集群艦隊(duì)-統(tǒng)一管理多個(gè)K8s集群podpod容器爭(zhēng)搶計(jì)算和存儲(chǔ)資源,內(nèi)存可用區(qū)1可用區(qū)2可用區(qū)2·成本優(yōu)化-自動(dòng)選擇多AZ/地域彈性算力,優(yōu)化成本與效率·集成與被集成-云產(chǎn)品集成,通過API與SDK集成業(yè)務(wù)系統(tǒng)全托管ServerlessArgo工作流集群優(yōu)勢(shì)簡(jiǎn)單易用、穩(wěn)定高性能、專業(yè)支持深勢(shì)科技使用全托管Serverless深勢(shì)科技使用全托管ServerlessArgo工作流集群,編排科學(xué)計(jì)算任務(wù),使用數(shù)萬核資源運(yùn)行大規(guī)模工作流,系統(tǒng)穩(wěn)定性大幅提高?!の宸昼婇_始提交您的工作流·完全免運(yùn)維,兼容開源,輕松遷移·修復(fù)社區(qū)版本穩(wěn)定性問題··單工作流2萬子任務(wù),并行4萬子任務(wù)·支持大規(guī)模科學(xué)計(jì)算工作流編排·眾多領(lǐng)域最佳實(shí)踐、構(gòu)建高效工作流·專業(yè)團(tuán)隊(duì)的支持,只需關(guān)注業(yè)務(wù)創(chuàng)新·Serverless方式成本低,計(jì)算資源按使用計(jì)費(fèi),無需預(yù)留資源,無需維護(hù)閑時(shí)資源0集、算法訓(xùn)練開發(fā)、3D環(huán)境生成等流程串ACKOneACKOne客戶交流群398人邊緣集群注冊(cè)集群邊緣集群阿里云彈性計(jì)算「2024云棲大會(huì)」精彩回放助力企業(yè)更好的上云、用云、管云林小平(洛蒙)如何落地可執(zhí)行、可復(fù)用實(shí)踐方案?License管理治理合規(guī)中心團(tuán)隊(duì)/業(yè)務(wù)部門責(zé)任平衡多云治理合規(guī)中心團(tuán)隊(duì)/業(yè)務(wù)部門責(zé)任平衡多云遷移上云超六層企業(yè)關(guān)注基礎(chǔ)設(shè)施安全成本連續(xù)2年成為云上Top1的問題不足2成企業(yè)自動(dòng)化優(yōu)秀級(jí)頭部企業(yè)關(guān)注上云彈性開發(fā)運(yùn)維關(guān)注Top1的問題-預(yù)付費(fèi)+按量+搶占式6.5-大數(shù)據(jù)-倚天g8y實(shí)例-數(shù)據(jù)庫-Intelg8i實(shí)例-搜推廣-AMDg8a實(shí)例率費(fèi)用中心支持標(biāo)簽維度查看賬單,實(shí)現(xiàn)精細(xì)化分賬我的視角多維度/多視圖可復(fù)用不同維度不同維度某客戶管理幾十個(gè)地域,幾十款產(chǎn)品百來種資源類某客戶管理幾十個(gè)地域,幾十款產(chǎn)品百來種資源類比如xx-service等應(yīng)用資源批量運(yùn)維;應(yīng)用分賬視圖;管理:應(yīng)用資源管理;比如xx-service等應(yīng)用資源批量運(yùn)維;應(yīng)用分賬視圖;管理:應(yīng)用資源管理;比如Lina.Lin等歸屬者分賬避免資源浪費(fèi);資源歸屬者管理;資源基于歸屬者權(quán)限管理;資源基于環(huán)境權(quán)限訪問控制;規(guī)?;瘡?fù)用比如Product、Stage比如Product、Stage、UAT等環(huán)境資源自動(dòng)化發(fā)現(xiàn);基于環(huán)境資源批量操作;比如E-Commercial等√集體詳盡是指所有資源對(duì)象都須綁定已規(guī)劃的標(biāo)簽鍵及其對(duì)成本業(yè)務(wù)責(zé)任制;業(yè)務(wù)單元的資源管理;基于業(yè)務(wù)單元資源訪問控制;比如E-Commercial等√集體詳盡是指所有資源對(duì)象都須綁定已規(guī)劃的標(biāo)簽鍵及其對(duì)成本業(yè)務(wù)責(zé)任制;業(yè)務(wù)單元的資源管理;基于業(yè)務(wù)單元資源訪問控制;比如飛天項(xiàng)目等成本項(xiàng)目責(zé)任制;項(xiàng)目資源管理;基于項(xiàng)目資源訪問控制;比如淘寶、阿里云等成本部門責(zé)任制;部門資源管理;基于部門資源訪問控制;比如淘寶、阿里云等成本部門責(zé)任制;部門資源管理;基于部門資源訪問控制;精簡(jiǎn)標(biāo)簽鍵設(shè)計(jì)原則√在規(guī)劃標(biāo)簽時(shí)同時(shí)考慮后續(xù)工作中增加或者減少賬單賬單資源目錄成員/標(biāo)簽值企業(yè)業(yè)務(wù)分區(qū)多公司架構(gòu)部門公司內(nèi)組織架構(gòu)應(yīng)用資源目錄標(biāo)簽規(guī)范個(gè)AUTOA(預(yù)付費(fèi)/RI+按量)B(預(yù)付費(fèi)/RI+按量+搶占式)多可用區(qū)伸縮模式多實(shí)例規(guī)格E(按量+搶占式)F(全搶占式)數(shù)據(jù)庫關(guān)注利用云上工具提升效能成熟度成熟度交付部署資源編排借助資源管理TAG+系統(tǒng)運(yùn)維管理00S+彈性伸縮ESS+ECS云助手實(shí)資源持續(xù)發(fā)布與部署執(zhí)行執(zhí)行下一批重試回滾繼續(xù)/..云助手下發(fā)執(zhí)執(zhí)行下一批日常運(yùn)維介續(xù)費(fèi)業(yè)務(wù)負(fù)載資業(yè)務(wù)負(fù)載利用彈性伸縮的自動(dòng)擴(kuò)縮容來實(shí)現(xiàn)成本優(yōu)化利用0OS/API利用彈性伸縮的自動(dòng)擴(kuò)縮容來實(shí)現(xiàn)成本優(yōu)化故障運(yùn)維補(bǔ)丁基線掃描/修復(fù)補(bǔ)丁管理補(bǔ)丁管理利用0OS補(bǔ)丁管理實(shí)現(xiàn)安全補(bǔ)丁修復(fù)保障系統(tǒng)安全利用利用0OS補(bǔ)丁管理實(shí)現(xiàn)安全補(bǔ)丁修復(fù)保障系統(tǒng)安全標(biāo)簽規(guī)范管理(新)資源管理-標(biāo)簽策略標(biāo)簽策略策略創(chuàng)建之后0定義規(guī)范作用范圍增量治理標(biāo)簽策略客戶痛點(diǎn)·云上管理無法保障資源新增符合標(biāo)準(zhǔn)。需要大量人力投入治理?!ぴ粕喜环蠘?biāo)準(zhǔn)的存量資源修正規(guī)范需要大量人力投入。要多個(gè)賬號(hào)希望符合一套標(biāo)準(zhǔn),管理復(fù)雜度成倍遞增?!て髽I(yè)存在多賬號(hào)資源管理,需要對(duì)于不同賬號(hào)執(zhí)行不同標(biāo)定義規(guī)范標(biāo)簽策略.基于資源關(guān)系繼承標(biāo)簽節(jié)省管理成本(新資源管理-標(biāo)簽-關(guān)聯(lián)資源標(biāo)簽設(shè)置解決方案解決方案情況1:情況2:產(chǎn)品界面磁盤從主從客戶痛點(diǎn)客戶痛點(diǎn)·虛擬機(jī)與其相關(guān)資源標(biāo)簽屬性一致性管理挑戰(zhàn)。云原生場(chǎng)景的客戶,特別關(guān)注ACK(阿里云容器服務(wù)Kubernetes版)集群及其下掛的各類資源(如ECS實(shí)消息客戶希望有效管理Kafka實(shí)例及其衍生資源(如Topic與消費(fèi)者組)。尋求一種機(jī)制,能確保Kafka實(shí)ACK集群場(chǎng)景消息場(chǎng)景優(yōu)勢(shì)開啟后標(biāo)簽繼承存在幾分鐘延時(shí)。開啟后標(biāo)簽繼承存在幾分鐘延時(shí)。構(gòu)建自動(dòng)化資源編排配置模版(新)客戶痛點(diǎn)客戶痛點(diǎn)解決方案Al解決方案Al生產(chǎn)模版□僅需輸入資源需求,可選口基于大模型,綜合阿里云口多種自動(dòng)修復(fù)方式提升生□僅需輸入資源需求,可選口基于大模型,綜合阿里云口多種自動(dòng)修復(fù)方式提升生←創(chuàng)建模板回口要了解架構(gòu)中不同種類資源對(duì)應(yīng)的ROS回口需要處理不同資源間的關(guān)口人工定義參數(shù)和輸出,尤系統(tǒng)運(yùn)維管理00S幫助擴(kuò)展程序快速部署(新)擴(kuò)展程序&快速部署擴(kuò)展程序·主機(jī)管理公共擴(kuò)展·公共擴(kuò)展自定義應(yīng)用·周期性帶寬升級(jí)自定義應(yīng)用mmmM00w·地域配置同步M00w實(shí)例運(yùn)維通道-助力云上運(yùn)維自動(dòng)化智能化朱明(靜須)操作復(fù)雜統(tǒng)一簡(jiǎn)單的操作,覆蓋所有終端統(tǒng)一簡(jiǎn)單的操作,覆蓋所有終端全等端登錄累用戶超過百萬級(jí)云助手包括終端登錄和命令執(zhí)行云助手包括終端登錄和命令執(zhí)行客戶端工具現(xiàn)在還沒有大規(guī)模推廣,但是還是客戶端工具現(xiàn)在還沒有大規(guī)模推廣,但是還是簡(jiǎn)化運(yùn)維操作,提高自動(dòng)化能力Workbench的一鍵式j(luò)ava應(yīng)用運(yùn)維能力支持更多語言Golang/C/Rust的自動(dòng)Perf能力!現(xiàn)在借助阿里云ATP平臺(tái)實(shí)現(xiàn)Java的一鍵自動(dòng)化運(yùn)維能力最早我們支持用戶自定義任務(wù)計(jì)劃>0OS借助Tag實(shí)現(xiàn)運(yùn)維批次>0OS借助云助手實(shí)現(xiàn)服務(wù)自啟動(dòng),實(shí)現(xiàn)應(yīng)用實(shí)時(shí)監(jiān)控,動(dòng)態(tài)機(jī)器的擴(kuò)容和摘除9Nase:describeInstancAction:'ACS::ExecuteAAPI:DescribeInstancValueselector:'Instances.Instance[].InstancyValue:ldescribeInstances.Instancelds}}通知00s>免去切換界面,操作簡(jiǎn)單自動(dòng)喚起自動(dòng)喚起Copilot自助診斷>情景喚起,無需額外操作 >InstaLoginlnfoAccountStructure8.登錄成功賬號(hào)用賬號(hào)用周下載量超過2500+周活超過4400+日均調(diào)用500+累計(jì)調(diào)用超過30000+周下載量超過2500+周活超過4400+日均調(diào)用500+累計(jì)調(diào)用超過30000+trooteizbp134eyushr?I實(shí)例運(yùn)維通道助力自動(dòng)化智能化運(yùn)維總結(jié)更加更加智能化能力圍繞用戶應(yīng)用的Perf,dump能力陸續(xù)開放中Cloudshell,開發(fā)機(jī)陸續(xù)開放中擴(kuò)大編程式交互的半徑,Client開放更多的運(yùn)維能力事前預(yù)防事中修復(fù)事后改進(jìn)故障預(yù)防故障發(fā)現(xiàn)故障定位故障恢復(fù)復(fù)盤改進(jìn)1.故障隱患規(guī)避2.故障快速恢復(fù)3.持續(xù)跟蹤云上業(yè)務(wù)系統(tǒng)可靠性的困難和挑戰(zhàn)異常識(shí)別異常識(shí)別容器/PAAS層基基礎(chǔ)設(shè)施層實(shí)例穩(wěn)定性問題實(shí)例性能問題實(shí)例性能問題應(yīng)用層業(yè)務(wù)層阿里云自研|云原生Prometheus實(shí)例健康狀態(tài)|計(jì)算存儲(chǔ)|網(wǎng)絡(luò)·支持秒級(jí)采集,免費(fèi)提供分鐘級(jí)指標(biāo)操作系統(tǒng)操作系統(tǒng)宿主機(jī)3分鐘是否100%性能水位指標(biāo)(%)是否100%性能水位指標(biāo)(%)構(gòu)建更多自動(dòng)化恢復(fù)場(chǎng)景能力ECS節(jié)點(diǎn)觸發(fā)條件運(yùn)維模版公網(wǎng)帶寬自適應(yīng)調(diào)整實(shí)例重部署+重置系統(tǒng)盤(響應(yīng)Redeploy事件)識(shí)別更多復(fù)雜業(yè)務(wù)場(chǎng)景持續(xù)循環(huán)持續(xù)循環(huán)1.新建任務(wù)2.定義觸發(fā)策略選擇公網(wǎng)利用率指標(biāo)定義靜默策略定義靜默策略3.關(guān)聯(lián)實(shí)例關(guān)聯(lián)實(shí)例資源關(guān)聯(lián)實(shí)例資源◎手動(dòng)選擇實(shí)例○指定實(shí)例標(biāo)簽4.設(shè)置執(zhí)行動(dòng)作定義執(zhí)行參數(shù)穩(wěn)定性性能自動(dòng)化新增實(shí)例狀態(tài)檢查指標(biāo),更全ACK高可用穩(wěn)定性和應(yīng)用數(shù)據(jù)災(zāi)備最佳實(shí)踐目錄目錄集群高可用集群高可用高可用架構(gòu)容災(zāi)設(shè)計(jì)是高可用架構(gòu)容災(zāi)設(shè)計(jì)是K8s系統(tǒng)穩(wěn)定性的基石接下來,我們一起探討針對(duì)如下案例問題的最佳實(shí)踐..案例二:集群節(jié)點(diǎn)多可用區(qū)部署,業(yè)務(wù)Pod案例二:集群節(jié)點(diǎn)多可用區(qū)部署,業(yè)務(wù)Pod沒有配置按可用區(qū)打散下線。案例一:集群節(jié)點(diǎn)單可用區(qū)部署,可用區(qū)級(jí)別異常導(dǎo)致服務(wù)下線案例四:多集群的應(yīng)用分發(fā)、流量控制以及高可用管理復(fù)雜案例四:多集群的應(yīng)用分發(fā)、流量控制以及高可用管理復(fù)雜案例三:對(duì)集群應(yīng)用可用性、可用區(qū)維度節(jié)點(diǎn)可用性的健康監(jiān)控告警不足單集群高可用最佳實(shí)踐-節(jié)點(diǎn)/可用區(qū)高可用topologyKey:"kubernetes.lo/hostname"topologyKey:“kubemnetes.lo/hosthame”topologyKey:"topology,kubernotos.lo/z部署集節(jié)點(diǎn)反親和含topologyKey:"kubernetes.lo/hostname"topologyKey:“kubemnetes.lo/hosthame”topologyKey:"topology,kubernotos.lo/z部署集節(jié)點(diǎn)反親和含理機(jī)級(jí)別高可用。單集群高可用最佳實(shí)踐-工作負(fù)載高可用配配置Pod反親和配置Pod拓?fù)浞植技s束配配置Pod健康檢測(cè)與自愈單集群高可用最佳實(shí)踐-.io/alibaba-cloud-loadbalancerone-naps:.io/alibaba-cloud-loadbalancerone-naps:s[zone-A}:SUvsW-A],5(zone-B):5(vsw-B},s(zone-C):S單集群高可用最佳實(shí)踐-應(yīng)用可用性和可用區(qū)內(nèi)節(jié)點(diǎn)可用性的監(jiān)控告警(應(yīng)對(duì)問題案例三場(chǎng)景)-alert:HealthyNodePercentagePerZoneLesummary:"zone={{slabels,zone}}:可用區(qū)內(nèi)健廉節(jié)for:5mkube_deployment_status_replickube_daemonset_status_numkube_statefulset_status_replicas_available來聚合分析應(yīng)用負(fù)載Deployment/Statefulset/Daemonset的不可用副本數(shù)、副本多集群高可用最佳實(shí)踐-(應(yīng)對(duì)問題案例四場(chǎng)景)安全策略全局監(jiān)控安全策略全局監(jiān)控應(yīng)用分發(fā)流量控制公有云公有云/本地?cái)?shù)據(jù)中心集群容災(zāi)應(yīng)用容災(zāi)流量容災(zāi)(在3AZ地域,SLA為99.95%;對(duì)于不具備3AZ的地域,SLA是2.支持應(yīng)用Pod高可用配置(打散規(guī)則、PDB、探針)5.支持多集群管理的ACKOneFleet產(chǎn)品形態(tài)從高可用到災(zāi)備00ACK備份中心—鍵備份—鍵備份·支持命名空間、標(biāo)簽、資源類型等維度選擇需要備份的應(yīng)用,及對(duì)應(yīng)掛載的存儲(chǔ)卷數(shù)據(jù)·命名空間、鏡像倉庫地址映射·復(fù)用或新建負(fù)載均衡實(shí)例維度選擇需要備份的存儲(chǔ)數(shù)據(jù)·支持從完整備份中選擇部分應(yīng)用或存儲(chǔ)卷恢復(fù)·自動(dòng)調(diào)整資源恢復(fù)順序及部分配置,兼容ACK系統(tǒng)組件與阿里云生態(tài)K8s資源災(zāi)備難點(diǎn)及解決方案資源遺漏導(dǎo)致無法拉起保密配置跟跟據(jù)K8s資源定義,備份時(shí)追加依賴資源。容器Job..優(yōu)先部署控制器動(dòng)態(tài)創(chuàng)建的資源,配置文件賬密啟動(dòng)配置賬密啟動(dòng)配置對(duì)象存儲(chǔ)對(duì)象存儲(chǔ)塊存儲(chǔ)塊存儲(chǔ)有狀態(tài)應(yīng)用災(zāi)備的組成有狀態(tài)應(yīng)用災(zāi)備的組成備份倉庫完整的有狀態(tài)應(yīng)用塊存儲(chǔ)數(shù)據(jù)保護(hù)完整的有狀態(tài)應(yīng)用存儲(chǔ)卷數(shù)據(jù)存儲(chǔ)卷數(shù)據(jù)存儲(chǔ)類型轉(zhuǎn)換文件系統(tǒng)數(shù)據(jù)保護(hù)通過單個(gè)備份即可對(duì)集群資源、塊存儲(chǔ)和文件系統(tǒng)的數(shù)據(jù)同時(shí)進(jìn)行保護(hù),且周期、TTL等策略一致,保證應(yīng)用恢復(fù)的完整。創(chuàng)建備份倉庫備份計(jì)劃備份記錄制定備份策略恢復(fù)某個(gè)備份到某個(gè)集群容災(zāi)上云場(chǎng)景Demo:遷移業(yè)務(wù)實(shí)現(xiàn)集群大版本跨度無縫升級(jí)系統(tǒng)組件版本應(yīng)用apiVersion為extensions/v1beta1應(yīng)用掛載云盤和OSS,僅需要備份云盤數(shù)據(jù)·應(yīng)用恢復(fù)至apps/v1·端口服務(wù)負(fù)載均衡實(shí)例一致,但流量未自動(dòng)切換·云盤存儲(chǔ)使用新實(shí)例,OSS存儲(chǔ)指向舊掛載點(diǎn)Demo演示視頻1:/ContainerNative業(yè)務(wù)災(zāi)備——應(yīng)對(duì)人為誤操作等導(dǎo)致的故障ACK備份中心——ContainerNative的一站式災(zāi)備方案·以應(yīng)用(工作負(fù)載)為核心>通過云盤快照、云備份服務(wù)提供安全、可靠的數(shù)據(jù)保護(hù)服務(wù)>均支持增量備份,大幅降低周期性備份的成本>云上災(zāi)備能力助力線下集群,簡(jiǎn)便的上云方案杜文彬目錄02用戶踐行ECS穩(wěn)定性最佳實(shí)踐03穩(wěn)定性最佳實(shí)踐插件工具應(yīng)用為何要踐行ECS實(shí)例穩(wěn)定性最佳實(shí)踐用好ECS發(fā)揮云上優(yōu)勢(shì)夯實(shí)穩(wěn)定性底座穩(wěn)定性重保體系事件驅(qū)動(dòng)的客戶聯(lián)動(dòng)體系事件驅(qū)動(dòng)的客戶聯(lián)動(dòng)體系線上守護(hù)體系故障快恢能力異常調(diào)度能力監(jiān)控診斷能力灰度發(fā)布能力智能故障預(yù)測(cè)故障快恢能力異常調(diào)度能力監(jiān)控診斷能力灰度發(fā)布能力智能故障預(yù)測(cè)事件響應(yīng)事件訂閱事件中心事件響應(yīng)事件訂閱事件中心數(shù)據(jù)和算法中臺(tái)基礎(chǔ)設(shè)施支撐體系用戶踐行ECS穩(wěn)定性最佳實(shí)踐滿足SLA之上穩(wěn)定性訴求風(fēng)險(xiǎn)規(guī)避問題容典型場(chǎng)景樣例-實(shí)例Panic風(fēng)險(xiǎn)消除Crash報(bào)錯(cuò)影響業(yè)務(wù)運(yùn)行連續(xù)性GuestOS內(nèi)部異?,F(xiàn)場(chǎng)debug現(xiàn)場(chǎng)debug依賴客戶授權(quán)與配合用戶視角配置KdumpInstanceFailure.Reboot事件實(shí)例Panic異常檢測(cè)與事件通知異常監(jiān)測(cè)與上報(bào)采集系統(tǒng)日志客戶側(cè)事件通知事件通知事件通知終端用戶登錄查看直接調(diào)用控制臺(tái)OpenAPI事件事件查詢推送云監(jiān)控上報(bào)事件ECS事件服務(wù)數(shù)據(jù)源異常事件原始數(shù)據(jù)InstanceFailure.Reboot事件上報(bào)事件來源訓(xùn)練集案例分享-某制造業(yè)客戶Panic風(fēng)險(xiǎn)消除平均值-平均值-8820240115202401182024011920240124202401252024012620240222升級(jí)Alinux3升級(jí)Alinux3可修復(fù)用戶自診斷ACK資源池滾動(dòng)升級(jí)ACK資源池滾動(dòng)升級(jí)線上同類panic線上同類panic消除案例分享-某制造業(yè)客戶Panic風(fēng)險(xiǎn)消除遷移向?qū)MC操作指南在線支持遷移向?qū)MC操作指南在線支持遷移前準(zhǔn)備升級(jí)操作系統(tǒng)求場(chǎng)景客戶無需開發(fā)可直接執(zhí)行學(xué)習(xí)成本低求場(chǎng)景客戶無需開發(fā)可直接執(zhí)行學(xué)習(xí)成本低響應(yīng)主動(dòng)運(yùn)維事件云助手簡(jiǎn)介運(yùn)維編排云助手簡(jiǎn)介運(yùn)維編排阿里云00阿里云00s代碼開源執(zhí)行簡(jiǎn)單客戶側(cè)最佳實(shí)踐工具場(chǎng)景運(yùn)維事件客戶運(yùn)維系統(tǒng)客戶運(yùn)維系統(tǒng)事件插件宿主機(jī)事件插件宿主機(jī)NodoNodoAutoscaleracs-plugin-manager--exec--plugin=ecs-tool-event母能入內(nèi)地燥已保凈的使用數(shù)acs-plugin-managerremovepluginACs-ECS-Gpucheckacs-plugin-anager-xec…plugtnACS-FCS-時(shí)時(shí)間acs-plugin-manager--exec--plugin=ACS-ECS-GpuCheck檢測(cè)GPU的DoubleBitErr檢測(cè)GPU的eRDMA網(wǎng)卡狀檢源Fabomanagor組件運(yùn)行狀態(tài)9啟動(dòng)Fabricmangor件會(huì)向用戶發(fā)送適維通知.檢測(cè)GPUxidorror異常情況不向time=“2024-07-18T10:26:25+08:”tevelEinfoBsg=℃opleteGPUhealth·業(yè)務(wù)進(jìn)程業(yè)務(wù)進(jìn)程連續(xù)性故障注入等故障注入等系列插件是是水k水a(chǎn)cs-plugin-manager--exif[$(cat/proc/sys/kernecho"SysRqnotenabled,use'echo1>/proc/sys/kernel/sysrq'tosync-f/usr/local/share/aliyuacs-plugin-manager--acs-plugin-manager--exec--pluginC石/server/region/cn-wulanchabu?i工作臺(tái)目賬號(hào)全部資源Q華北6(烏蘭察布Q搜費(fèi)用ICP備案服務(wù)器實(shí)例設(shè)置全局標(biāo)簽②幫助文檔ops(公)45(私有)<用戶踐行ECS穩(wěn)定性最佳實(shí)踐滿足SLA之上穩(wěn)定性訴求風(fēng)險(xiǎn)規(guī)避問題容錯(cuò)問題診斷方位診斷本和穩(wěn)定方位診斷本和穩(wěn)定控制臺(tái)AI助手與簡(jiǎn)捷體驗(yàn)吳平目錄全鏈路AI助手能力03簡(jiǎn)捷版控制臺(tái)視覺反饋視覺交互引導(dǎo)交互功能體驗(yàn)-因人而異控制臺(tái)體驗(yàn)沒有標(biāo)準(zhǔn)答案,因人而異,資源體量不同管控需求也不同個(gè)人開發(fā)者個(gè)人開發(fā)者··功能龐雜,無法快速找到入口太多多—鍵發(fā)現(xiàn)和解決問題的能力·開放更多監(jiān)控參數(shù)和·提供更豐富的問題自資源管理員雜,架構(gòu)選型和部署雜,架構(gòu)選型和部署·我想將本地服務(wù)打成·提供更完善的批量和jar包,然后上傳到oss上,后續(xù)在ecs實(shí)例上啟動(dòng)服務(wù),這個(gè)模板怎么寫?簡(jiǎn)單易用,快速上手功能豐富,可定制化簡(jiǎn)單易用,快速上手功能豐富,可定制化體驗(yàn)-貫穿全鏈路售后(運(yùn)維)云助手規(guī)格推薦Web應(yīng)用處理器類型Web應(yīng)用Yitian規(guī)格對(duì)比推薦最佳規(guī)格方案,助力用戶通過自然語言高效進(jìn)行產(chǎn)品精細(xì)化選型。格新功服務(wù)器ECS快速購(gòu)買自定義購(gòu)買遐回舊版節(jié)省計(jì)劃晶產(chǎn)品價(jià)格C購(gòu)買云盤產(chǎn)品控制臺(tái)配置概要華東1(杭州)=39格新功服務(wù)器ECS快速購(gòu)買自定義購(gòu)買遐回舊版節(jié)省計(jì)劃晶產(chǎn)品價(jià)格C購(gòu)買云盤產(chǎn)品控制臺(tái)配置概要華東1(杭州)=39華北2(北京)=2網(wǎng)絡(luò)及可用區(qū)②o0實(shí)例和鏡像購(gòu)買實(shí)例數(shù)量號(hào)95.7/月購(gòu)買時(shí)長(zhǎng)2vCPU4GiB自動(dòng)續(xù)費(fèi)□啟用自動(dòng)續(xù)費(fèi)請(qǐng)輸入關(guān)鍵詞(例如Uburtu)快速查找鍵像薦:△7884位控制臺(tái)診斷工具LLM模型平臺(tái)方案輸出哪里不懂劃哪里,您的控制臺(tái)AI專業(yè)向?qū)ЬW(wǎng)絡(luò)及可用區(qū)①實(shí)例和鏡像華東1(杭州)=39華東1(杭州)=39華北2(北京)=2o創(chuàng)建專有網(wǎng)絡(luò)o創(chuàng)建專有網(wǎng)絡(luò)yCPU4Gi日nbeyCPU4Gi日nbe5.7目請(qǐng)輸入關(guān)鍵詞(例如Ubuntu)快速查找鏡像鏡像目錄貴:貴:AlibabaCloudLin..2.1903LTS64位2019數(shù)據(jù)中心版64位..2.1903LTS64位3.2104LTS備案實(shí)例(含續(xù)費(fèi))點(diǎn)擊下單即表示作日時(shí)長(zhǎng)需在3個(gè)月,了解1個(gè)月彈性伸縮□9回@26試通您參加云服務(wù)器ECS體驗(yàn)調(diào)研。僅需3-5分鐘。有機(jī)會(huì)獲得100-200元無門檻代金券。您的意見對(duì)我們至關(guān)重要!進(jìn)入問卷導(dǎo)出數(shù)據(jù)導(dǎo)出數(shù)據(jù)已過期近陰創(chuàng)建0遷移上云胺10.名稱P若屬性項(xiàng)相據(jù)索云服務(wù)器事個(gè)關(guān)鍵字用英文道號(hào)(.)分屋已照已華北2(北京西南1(成都華東2(上海華北3(張家口華北3(張家口00云網(wǎng)絡(luò)E2E測(cè)試-天問2(呼和浩特2)0華中1(武漢-本地地域)0云網(wǎng)絡(luò)E2E測(cè)試-天問2(呼和浩特2)0華中1(武漢-本地地域)ECSA)助手×無法遠(yuǎn)程連的ECS實(shí)例0命令來源可語O系統(tǒng)下一次啟動(dòng)后〇系統(tǒng)每次啟動(dòng)后〇定時(shí)執(zhí)行md_2024-06-24_13-57.4.rootoizbp1j7mmp35I部署部署運(yùn)維部署部署輸出是是輸出編編(-阿里云近白動(dòng)行功功自動(dòng)執(zhí)行白定義任自動(dòng)執(zhí)行9白動(dòng)執(zhí)行2024年9月4日管理xec-f49107d683124d3自動(dòng)執(zhí)行0成功oxac-a4tbo5573a4f4bEnerypiOata自動(dòng)執(zhí)行9月3日aoe-170937oolelc446自動(dòng)執(zhí)行9月3日9月3日目標(biāo)用戶:保有實(shí)例5臺(tái)以下點(diǎn)不常用功能可以在更多中展歡迎體驗(yàn)ECS控制臺(tái)一簡(jiǎn)捷版0費(fèi)用工單備案服務(wù)0實(shí)例件西用中kB例中同800中k00●c中6BB藍(lán)接配e軟件的試錯(cuò)成本高渠道建設(shè)成本高軟件使用者的痛點(diǎn)軟件提供者的挑戰(zhàn)熱度規(guī)模計(jì)計(jì)算巢產(chǎn)品集成方案銷售客戶軟件方案計(jì)算巢最終客戶技術(shù)集成計(jì)算巢最終客戶阿里云容易被用戶感知計(jì)算巢基于開源的商業(yè)軟件服務(wù)計(jì)算巢端到端商業(yè)軟件服務(wù)(基礎(chǔ)軟件、應(yīng)用軟件、通用軟件、行業(yè)軟件)開源軟件軟件服務(wù)構(gòu)建軟件服務(wù)管理服務(wù)運(yùn)營(yíng)應(yīng)用與數(shù)據(jù)互聯(lián)服務(wù)安全與合規(guī)軟件服務(wù)構(gòu)建開放接口服務(wù)目錄服務(wù)目錄資源分賬軟件服務(wù)管理服務(wù)發(fā)布服務(wù)發(fā)布軟件服務(wù)構(gòu)建服務(wù)構(gòu)建服務(wù)交付&部署服務(wù)管理服務(wù)運(yùn)維服務(wù)運(yùn)營(yíng)√傳統(tǒng)軟件SaaS化支持私有化部署:最終用戶保有云資源阿里云中心云機(jī)房阿里云中心云機(jī)房云云盒VPC打通私有部署服務(wù)用戶私有環(huán)境用戶私有環(huán)境租戶托管環(huán)境中心化服務(wù)私有部署服務(wù)用戶私有環(huán)境用戶私有環(huán)境商務(wù)流程商務(wù)流程資源采買軟件部署業(yè)務(wù)使用系統(tǒng)自動(dòng)初始化系統(tǒng)自動(dòng)初始化成本成本用戶數(shù)成本用戶數(shù)幫助ISV、分銷伙伴轉(zhuǎn)型云服務(wù)公司商業(yè)模式升級(jí)分銷商·軟件和云服務(wù)分開采購(gòu)變成統(tǒng)一采購(gòu)·軟件分銷商變成服務(wù)提供商商業(yè)模式升級(jí)分銷商·軟件和云服務(wù)分開采購(gòu)變成統(tǒng)一采購(gòu)·軟件分銷商變成服務(wù)提供商·一次性交易變成長(zhǎng)期服務(wù)客戶·最終用戶可以直接通過計(jì)算巢在ISV的賬號(hào)下創(chuàng)建其應(yīng)用所需的資源·最終用戶可以通過計(jì)算巢查看專屬的軟件部署環(huán)境和服務(wù)商的運(yùn)維操作應(yīng)用軟件云服務(wù)(長(zhǎng)期訂閱)計(jì)算巢價(jià)值警,保證客戶業(yè)務(wù)持續(xù)在線;·成本分析:可精細(xì)化計(jì)算每一個(gè)客戶在基礎(chǔ)設(shè)施上花費(fèi)的成本;本,另一方面也展示出托管模式下的架構(gòu)優(yōu)勢(shì)式,不再擔(dān)心賬期問題·資源信息可查:包括確認(rèn)客戶所購(gòu)買機(jī)型,配置,數(shù)量等資源基礎(chǔ)信息;數(shù)hu①用友數(shù)hu①用友神策數(shù)據(jù)深切科技維帽表極狐消費(fèi)者增長(zhǎng)解決方案提供商,通過整合軟件產(chǎn)品和專業(yè)服務(wù)的一體化解決方案,支持品牌零售企業(yè)建AKSworkininody-htpool自動(dòng)化部署極簡(jiǎn)運(yùn)維安全審計(jì)極致彈性·降低使用門檻:一棧式云上HTAP數(shù)據(jù)庫方案,與線下方案相比使用門檻降低1悅數(shù)圖數(shù)據(jù)庫悅數(shù)圖數(shù)據(jù)庫是基于NebulaGraph開發(fā)化管理產(chǎn)品。用戶可以在幾分鐘內(nèi)創(chuàng)建一個(gè)圖數(shù)據(jù)悅數(shù)圖數(shù)據(jù)庫速(5~10分鐘)搭建悅數(shù)圖數(shù)據(jù)庫。審計(jì)審計(jì)用戶2集群用戶2集群阿阿客戶數(shù)據(jù)應(yīng)用案例解析BYOC形態(tài),數(shù)據(jù)主權(quán)有保障v數(shù)據(jù)不出VPC,無跨網(wǎng)絡(luò)通信計(jì)算巢助力AutoMQBYOC走向全托管用戶2用戶2計(jì)算巢助力涂鴉邁向產(chǎn)業(yè)物聯(lián)網(wǎng)涂鴉IoT產(chǎn)業(yè)化探索上云實(shí)踐目錄01物聯(lián)網(wǎng)行業(yè)發(fā)展趨勢(shì)階段3阿里云發(fā)展物聯(lián)網(wǎng)發(fā)展趨勢(shì)先摘取“低垂的果實(shí)”,再“架梯子”摘取更高的果實(shí)階段3階段2酒店、社區(qū)、建筑為代表的人居工程傳統(tǒng)行業(yè)。城市,交道,電力,能階段2酒店、社區(qū)、建筑為代表的人居工程階段1以全屋智能為代表的消費(fèi)電子物聯(lián)網(wǎng)發(fā)展等開發(fā)者開發(fā)者中邊緣計(jì)算涂鴉涂鴉節(jié)點(diǎn)物聯(lián)網(wǎng)設(shè)備設(shè)備計(jì)算巢資源編排ROS計(jì)算巢開放接口資源獨(dú)占獨(dú)占所有計(jì)算資源,拒絕共用。-數(shù)據(jù)安全性更高-不會(huì)產(chǎn)生多主體間穩(wěn)定性問題-更有針對(duì)性的優(yōu)化措施以公有云的價(jià)格,獲得獨(dú)占型的服務(wù)-通過技術(shù)優(yōu)化,降低成本全托管從計(jì)算資源到監(jiān)控運(yùn)維全托管。省去后顧之憂高可用集群化部署,提供高可用承諾99.95%的可用性-擁抱阿里云資源SaaSSaaS服務(wù)的信任成本資本市場(chǎng)更青睞資本市場(chǎng)更青睞標(biāo)準(zhǔn)化和更低的邊際成本標(biāo)準(zhǔn)化和更低的邊際成本監(jiān)控和運(yùn)維難度手段較弱支付-升級(jí)-訂閱-過期04云市場(chǎng)效果量12個(gè)月使用余額使脹戶余額低扣(當(dāng)前賬戶余額×7448)元如果均有正在使用中的后付需產(chǎn)品,請(qǐng)保證有足略宗脫抵扣:¥0.00選擇支付方式支付:¥16.082.00本產(chǎn)品是集成了設(shè)備接入,設(shè)備管理,數(shù)據(jù)安全遏信、消息訂閱、消應(yīng)轉(zhuǎn)發(fā)和數(shù)據(jù)服務(wù)等能力的一體化平臺(tái)。向下支持連接海肅設(shè)備數(shù)據(jù)上云;向上提供云端API,服務(wù)端可通過云鴻SDK凋用云端AP將指令下發(fā)至設(shè)備端,實(shí)現(xiàn)遠(yuǎn)程控制。依托涂鴉析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論