华为云发布全球最大盘古大模型:2.2亿美元培育沃土


    物联网智库 整理发布
    转载请注明来源和出处
    导  读
    全面云化已不可阻挡,云是ICT产业的未来,也是企业数字化转型的底座,开发者是产业发展的灵魂。华为将继续开放技术创新能力,携手开发者、伙伴共同加速行业全面云化和智能升级。
    
    4月25日上午,华为开发者大会2021(Cloud)主题论坛如期召开。会上,华为常务董事、华为云CEO、消费者业务CEO余承东发表了重磅演讲,这是继本月初,华为内部进行组织架构调整以来,余承东以华为云CEO身份进行的首次演讲。
    在本次演讲中,余承东首先分享了华为云去年的发展情况,据他介绍,华为云2020年在云服务市场份额增速第一,鲲鹏/昇腾增长600%,存储中国市场份额第一,伙伴应用与认证解决方案9000+,开发者240万+,合作伙伴20000+。
    
    余承东表示,华为云未来的战略是:做智能世界的黑土地。
    云优先:坚持云解决方案优先,云服务商业模式优先,云伙伴优先;
    聚焦:聚焦系统创新、架构创新;
    生态:支持开发者构建面向千行百业的应用和解决方案。
    伴随着坚定地战略,余承东还一口气重磅发布了6大创新产品及服务,包括云基础设施——华为云CCE Turbo容器集群、应用使能——CloudIDE智能编程助手、数据使能——GaussDB(for openGauss)数据库、数据使能——可信智能计算服务TICS、AI使能——华为云盘古系列大模型(包含全球最大规模的中文NLP大模型及CV大模型等)、多样性计算基础软件等。
    同时,华为宣布将在2021年向“沃土计划2.0”投入2.2亿美元,包括全新发布的“沃土云创”计划,以及鲲鹏众智计划和昇腾众智计划等,围绕华为云、鲲鹏和昇腾持续推动产业生态发展。
    AI:华为发布全球最大“大模型”
    余承东在演讲中表示,今天AI已经成为了新的生产力,进入了企业的生产系统和作业流程,根据GIV数据预测显示,2025年大企业AI使用率将达到97%,企业生产流程AI使用率将达到75%。
    过去的4年,围绕AI战略,华为推出了华为云EI、HiAI能力开放平台、昇腾处理器、全场景AI计算框架MindSpore、Atlas 900集群等一系列全球领先的产品和服务。在此次发布会上,华为全栈全场景AI解决方案则迎来一款在AI产业界非常、非常、非常震撼的产品——华为云盘古大模型。
    
    余承东介绍称,华为云盘古大模型是今天最重磅的产品。据他介绍,这是业界首个千亿级生成与理解中文NLP大模型,也是业界最大的CV大模型。
    
    具体而言,盘古NLP大模型在三个方面实现了突破性进展:
    第一,具备领先的语言理解和模型生成能力:在权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,向人类水平(85.61)迈进了一大步。
    第二,盘古NLP大模型在预训练阶段沉淀了大量的通用知识,既能做理解又能做生成。除了能像GPT-3等仅基于端到端生成的方式以外,大模型还可以通过少样本学习对意图进行识别,转化为知识库和数据库查询。通过功能的模块化组合支持行业知识库和数据库的嵌入,进而对接行业经验,使能全场景的快速适配与扩展。比如在华为云和循环智能合作构建的金融客服场景中,盘古NLP大模型能更好地赋能销售环节,帮助服务人员快速提升业务水平,重塑消费者体验。
    第三,盘古NLP大模型采用大模型小样本调优的路线,实现了小样本学习任务上超越GPT系列。比如在客户需求分析场景中,使用盘古NLP大模型生产语义标签时,得到目标结果所需的样本量仅为GPT系列模型的十分之一,即AI生产效率可提升十倍。
    
    当然,作为华为云本次大会的最重磅产品,华为云盘古大模型不仅仅是拿了第一这么简单。对于传统的“作坊式AI”,所需工作往往繁重复杂,甚至需要开发者手工编写大量的并行、切分和通讯代码。而华为云盘古大模型配备有“预训练+下游微调”,能够做到“举一反三”,还可以在少量样本的情况达到高精度,真正助力走向“工业化AI”。
    此外,盘古CV大模型提供模型预训练、微调、部署和迭代的功能,形成了AI开发完整闭环,极大提升AI开发效率。目前,盘古CV大模型已经在医学影像、金融、工业质检等100余项实际任务中得到了验证,不仅大幅提升了业务测试精度,还能平均节约90%以上的研发成本。
    沃土计划2021:投入2.2亿美元
    作为华为使能开发者的重要举措,沃土计划于2015年正式推出,并在2019年发布了“沃土计划2.0”。
    长期以来,沃土计划的目标都非常明确,即:坚持“硬件开放、软件开源、使能伙伴、发展人才”,推动产业繁荣发展,5年发展500万开发者。
    而据华为Cloud BU总裁张平安介绍,2020年,华为在沃土计划2.0计划上,总投入已经达到了2亿美元 (约13亿人民币)的规模,目前拥有240万开发者,9000+伙伴应用与认证解决方案,120个华为云创新中心,24个鲲鹏/昇腾创新中心。
    
    此次发布的沃土计划2021,将包括鲲鹏众智、昇腾众智和沃土云创三个子项目。其中,“沃土云创”计划投入1亿美元,面向ISV和SaaS伙伴,提供云资源、技术和商业推广支持,涉及覆盖容器/微服务、SaaS化、大数据、AI、视频、智能边缘等6大技术领域。
    鲲鹏众智、昇腾众智包含了500多项任务,将提供2000万美元的激励基金,汇聚产业界智慧和力量,共同开发加速库、基础算子、网络模型,促进多样性计算产业发展和人工智能生态发展。
    
    “2021年,我们希望与华为云黑土地上的开发者一起前进,一起进行深度的技术融合。通过深度技术融合,能够帮助合作伙伴商业快速增长,和让合作伙伴、开发者来一起帮助客户持续获得商业成功。我们对2021年充满了期待。”张平安说道。
    云原生:华为对数智化的底层抓手
    在今日发布的所有新品与战略的背后,云原生可谓是华为云最为关键的底层抓手。在今天的演讲一开始,余承东就表示,云一定是ICT产业的未来,是每一个企业数字化转型的底座。“没有云原生,就没有真正的数字化和智能化”。
    云原生是近来云计算领域的热词,所谓云原生,是Cloud+Native的组合词。Cloud表示应用程序位于云中,Native表示应用程序从设计之初即考虑到云的环境,原生为云而设计。长期以来,华为都对其给予着高度重视。
    因此,华为此次也在云原生应用方面进行了重点开发,预计2023年云原生应用占比将达到80%。这样资源部署的效率、开发的效率都会得到显著提升。
    
    事实上,华为云在去年年底就曾发布云原生产业白皮书、云原生2.0全景图和行动计划,这些共同构成了华为云原生的“三驾马车”:
    华为云发布云原生产业白皮书:该白皮书通过聚焦云计算基础设施及云原生应用开发及业务管理人员在引入、应用云原生技术过程中面临的挑战和需求,展现中国应用云原生技术进行应用开发的现状及未来,并提出相应的战略建议。
    华为云大秀云原生2.0全景图:为赋能新云原生企业智能升级,实现“资源高效、应用敏捷、业务智能、安全可信”,华为云原生基础设施全面升级,让云原生成为企业应用内生的能力。
    华为云启动云原生2.0行动计划:华为云首席数字化转型官苏立清表示,按照计划,华为云将重点打造“创原会”等云原生交流平台,持续开源社区贡献,通过云原生2.0产业峰会等多种方式全面技术赋能,促进云原生产业发展。
    
    借助这三驾马车,华为已经实现了超大规模企业云原生研发应用,重构了研发作业模式,大幅提升效率、资源复用率提升3倍、部署效率提升10倍。同时,华为实现了LAAS(Lab as a Service)实验室服务化,敏捷实现实验室作业的“数字孪生”。此外,华为研发的桌面云还可让全球研发人员的开发、构建、测试等全部云化,云下无代码,实现无感安全。另外,通过华为云ROMA和ModelArts,华为实现大量AI应用,比如财务报销自动化、合同签章真伪识别、站点交付智能验收等。由此可见,云原生已经成为华为最不可或缺的底层基础技术。
    结语
    据Gartner介绍,2020年,华为云全球IaaS市场排名上升至中国前二、全球前五,主流厂商增速最快,成为全球五朵云之一。如此高的评价,背后的支撑是华为云多年来的高速增长。据悉,华为云所保持的增速高达168%,而且已经连续四个季度位居中国公有云服务市场第二。
    在后手机时代,华为急需寻找新的增长点,而无论是今日焦点的云业务,亦或者上周“轰炸”上海车展的搭载华为技术的各大企业新车型,都意味着华为在相关领域稳扎稳打,快速前行。
    以下为余承东演讲全文:
    各位来宾,各位开发者朋友,大家早上好,欢迎参加我们的开发者大会。借此机会也特别感谢深圳市政府、深圳大学城提供这么好的场地。希望大家这几天能够在青春、美丽的大学城,开启一段难忘的旅程。
    我们也在全球40座城市的华为云、鲲鹏、昇腾创新中心和高校,开设了超过70个分会场,线上同步直播,欢迎全球开发者一起参加这场年度盛会。
    因为有你,虽然艰难
    但仍昂首向前
    2020年在十分困难的情况下,华为云逆风飞翔。感谢全球超过20000家合作伙伴,超过240万开发者的支持。因为有你,虽然艰难,但我们仍昂首向前。谢谢大家!
    在市场进展上,鲲鹏/昇腾增长了六倍,存储也继续位居中国市场份额第一、全球前四。华为云继续保持全球主流云服务厂商中的最高增速(168%)。Gartner公有云全球IaaS市场报告显示,2020年,华为云全球IaaS市场排名上升至中国前二、全球前五,成为全球五朵云之一。
    华为云:做智能世界的黑土地
    华为云的战略是做智能世界的黑土地,致力于为开发者打造最佳应用构建平台,让应用茁壮成长。
    坚持云优先,优先选择用云方式为客户提供IT基础平台服务,具体来说就是云解决方案优先、云服务商业模式优先、云伙伴优先。
    持续聚焦系统和架构创新,强化软件,让黑土地更肥沃。
    全力支持开发者基于“黑土地”构建面向千行百业的应用。
    根植沃土
    每一个开发者都能了不起
    根植华为云的黑土地,每一个开发者都能了不起。
    基于华为云ModelArts平台,西安交通大学第一附属医院的开发者,用AI筛选超级抗菌药,有望解决广谱抗菌药物研发的世界难题。
    基于华为云AI技术,哈尔滨亿时代数码科技的开发者,开发了“畅听无碍”应用,让2780万听障人士沟通更容易。
    云是ICT产业的未来
    企业数字化转型的底座
    全面云化已不可阻挡,云一定是ICT产业的未来,是每一个企业数字化转型的底座。
    到2025年,全球企业云技术使用率将达100%;Gartner预测企业传统数据中心将关闭90%。所以,云一定是未来的趋势。
    没有云原生
    就没有真正的数字化和智能化
    《经济学家》杂志曾经评价说“没有集装箱,就没有全球化”。同样,没有云原生,就没有真正的数字化和智能化。
    华为流程IT全面运用云原生技术,新应用100%采用容器,研发系统部署和资源使用率提升10倍以上。预计到2023年,云原生应用占比将达80%。
    AI已成为新的生产力
    全面进入企业的生产系统和作业流程
    2018年,华为成立AI使能部,每年投入十亿美金,当前已在所有主业务流程和场景应用。2025年,大企业AI使用率将达97%,企业生产流程AI的使用率也将达到75%。
    举个例子,华为每年交付站点300多万,超过5000万安装项需要验收。过去需要分批上站,多次检查,费时费力。引入AI后,单站点验收效率提升8倍,年节约成本超过60亿人民币。
    千行百业加速智能升级
    迈向全场景智慧
    去年华为全联接大会,我们发布了政企智能升级参考架构:智能体。
    在智能升级的过程中,我们认为有三大趋势:
    应用现代化:应用的架构、开发和运营全面现代化。
    数据资产化:数据从资源变为资产,实现数据驱动。
    AI工业化:让AI可以真正普惠千行百业,成为新生产力。
    发布6大创新技术
    帮助开发者抓住智能升级的黄金机会
    为了帮助开发者抓住智能升级的黄金机会,今天我们带来6大创新技术发布:
    
    1.云基础设施——华为云CCE Turbo
    以容器为核心的云原生基础设施,不仅让资源利用率更高,还能解放运维人员,聚焦应用和业务创新。但是,容器的规模化应用,也对性能、弹性、调度能力提出了更高要求。
    没有容器化,就没有应用现代化。以容器为核心的云原生基础设施,不仅提供更高效的资源,还能把开发运维人员从资源的调配和运维中解放出来,聚焦于应用和业务创新。容器全面规模化应用的同时也对性能、弹性、调度能力提出了更高的要求。
    今天我们带来一款革命性的容器集群——华为云CCE Turbo。
    
    华为云CCE Turbo容器集群在计算、网络和调度上全方位加速,让容器真正成为企业应用创新的强劲引擎。
    计算加速:业界独家实现容器100%卸载,让VIPKID音视频服务性能提升40%,在线课堂零卡顿。
    网络加速:独创容器直通网络,两层网络变一层,实现秒级扩容千个容器,业界最高,帮助新浪平稳应对每一次热点事件。
    调度加速:感知AI、大数据、Web等不同应用特征,实现混合业务智能调度,让美图容器集群资源利用率提升40%。
    2.应用使能——华为云CloudIDE
    二十几年前,我加入华为的第一份工作就是写代码,搞开发。相信每一个开发者都有一个梦想,能否有个开发工具,让程序自己写程序?今天很高兴,梦想成为现实。
    华为云CloudIDE是为开发者而生的智能编程助手,可以为开发者提供轻量、随时随地的在线智能编程体验。
    
    基于智能代码补全技术,华为云CloudIDE可以找到所有的补全结果,大幅提升代码的准确性;其次,支持复杂上下文进行补全;第三,避免推荐过期、弃用、危险的API。华为云CloudIDE,让代码更健壮、更安全。
    3.数据使能——华为云GaussDB(for openGauss)
    企业上云,实现数据驱动,核心是数据库上云。为了帮助企业开发者更好的应对几何级增长的数据规模和数据流量洪峰,让业务“始终在线”无中断,今天,我们正式发布企业核心数据上云的信赖之选——华为云GaussDB(for openGauss)数据库。
    
    它经受了金融业务全场景的严苛考验,在性能、可用性、弹性方面全面提升:
    高性能:交易型事务处理能力比友商高出54%,复杂查询时延比友商低82%。
    高弹性:面对流量洪峰,可实现秒级扩容,业务无感。
    高可用:单点故障10秒内切换,只有友商不到三分之一的时间。举个例子,在工商银行,GaussDB已全面应用到A类到D类全场景业务,稳定服务于上亿用户。
    4. 数据使能——TICS可信智能计算服务
    数据作为关键生产要素,一定要流动才能发挥更大的价值。释放数据价值的关键是可信安全流通,但开放难、共享难、流通难是亟需解决的三大挑战。
    今天,我们发布TICS可信智能计算服务,使能数据可信流通,安全释放数据价值。
    
    它具有以下三大特性:
    基于多方数据联邦探查和建模,让隐私数据不出域,可用不可见。
    通过联邦AI算法和同态加密算法协同,实现模型批量计算,训练性能提升10倍,无须加速卡,也能大幅提升计算性能。
    支持主流大数据源,无须转换即可适配。
    5. AI使能——华为云盘古大模型
    今天的AI开发仍处于作坊式,我们认为,未来的AI开发必须告别作坊式,走向工业化、通用化。
    过去的4年,围绕华为AI战略,我们推出了华为云EI、HiAI能力开放平台、昇腾处理器、全场景AI计算框架MindSpore、Atlas 900集群等一系列全球领先的产品和服务。
    今天,华为全栈全场景AI解决方案迎来一款在AI产业界非常、非常、非常震撼的产品——华为云盘古大模型。
    
    它具备极强的泛化能力,一个模型适用大量复杂行业场景,少量样本也能达到高精度;基于预训练+下游微调的工业化AI开发模式,让全球领先的AI真正进入千行百业。
    华为云盘古大模型包括4大系列:业界首个千亿级生成与理解中文NLP大模型、业界最大的CV大模型,未来我们将持续推出多模态和科学计算大模型。
    华为云盘古NLP大模型在中文语言理解测评中,在总榜、分类榜、阅读理解榜获得三项第一,大幅刷新业界纪录。总排行榜领先第二名1分,这是什么概念?就如同百米赛跑的世界纪录,每次0.01秒的突破,都是在超越极限。
    
    6. 计算基础软件持续创新,使能多样性算力
    根深方能叶茂,云的创新离不开操作系统、数据库、中间件等基础软件根技术的支撑。如果说处理器是计算产业的“心”,基础软件就是计算产业的“魂”。
    
    我们会坚定不移的,在操作系统、数据库、AI计算框架等全套计算基础软件栈上持续投入,使能多样性算力,支撑华为云的产品和服务创新。
    创新无止境,让黑土地更肥沃
    与开发者一样,创新一直是华为的DNA,华为公司的成长史就是一部创新史。开放华为三十多年积累的创新能力,华为云持续投入,不断进步,为开发者提供更加肥沃的黑土地。
    今天,我们发布6大创新技术,希望能够帮助开发者抓住智能升级的黄金机会,站在华为的肩膀上创造未来。
    最强的智,是众智;
    最大的力,是合力。
    每一个开发者,
    都在创造一往无前的奔腾时代。
    世界有你,了不起!