文心大模型扬起新“帆”，产业应用大潮已至

2024.03.22 Alter聊IT

    刚刚结束的2022百度世界大会上，百度CTO王海峰在演讲中展示了这样一个场景：随着画卷的缓缓展开，一幅“补全”后的《富春山居图》出现在身后的屏幕上，并借鉴古人喜欢题字的“传统”，在画卷上题了一首小诗。
    正如很多人所熟知的，因为历史上的种种原因，元代名家黄公望的《富春山居图》被一分为二，“前段”被后人命名为《剩山图》，“后段”被称为《无用师卷》。前后两段画卷曾在台北故宫合璧展出，可缺失的部分成了近四百年的遗憾。
    许多人不知道的是，“补全”黄公望传世名作的，不是钻研古画几十年的匠人，而是有中国传统文人风骨的文心大模型。
    01 近四百年遗憾，一秒钟被满足
    2022百度世界大会期间，百度推出的H5《AI画笔连接爱》在不少人的朋友圈里刷了屏，只需要在中间空白处简单勾勒几笔，AI就能自动“补全”《富春山居图》残缺部分的内容，前后用时不到一秒钟。
    对于这样的玩法，一些人可能并不陌生：诸如AI复原老照片、让古画中的人物“活”起来、AI化身“绘画大师”等等，过去几年中已经屡见不鲜，甚至在有些情况下已经难以分辨一幅作品到底是人类所作还是AI生成。
    但文心大模型“补全”的《富春山居图》和以往有很大的不同，确切地说存在三个方面的严格挑战：
    一是高清晰度。很多AI修复的画作往往清晰度不高，虽然可以模仿出原作的风格，细节上却经不起推敲。文心大模型则是对《富春山居图》进行了高清尺寸的补全，勾勒的每一笔线条，每一棵树木都清晰可见。
    二是高还原度。名列“元四家”之首的黄公望，开创了“浅绛山水”的画法，但传世的作品并不太多。在只有一幅《富春山居图》残卷的条件下，仍要高度还原一代书画大师的作品，对模型的迁移学习能力要求极高。
    三是全民参与。不同用户勾勒的线条各不相同，有些可能就是在屏幕上随意画了个不规则的圆圈，文心大模型照旧可以实时生成画作并高度还原，同时满足无数用户多样化的创作期望和天马行空的创意想法。
    就最终的结果来看，文心大模型的创作得到了黄公望纪念馆负责人毛传镔的高度评价：“与现存真迹风格一致，使两岸画卷走出博物馆实现了合璧，光线风格统一，山水脉络和谐，不仅符合原画审美特点，视觉上还同样具有观赏价值”。
    需要思考的是，百度CTO王海峰为何要在一年一度的百度世界大会上展示“补全”后的《富春山居图》？答案绝不是纯粹为了“秀技”，即便文心大模型具备这样的技术实力。
    早在2019年的网络春晚上，百度AI就展示过“看脸”对春联的绝活儿，用户可以通过填字乃至刷脸的方式，自动生成专属的春联；到了2020年初，百度研究院上线了智能视频合成平台VidPress，一键输入图文内容即可智能生成短视频；2022年5月文心·旸谷社区正式上线，官方定位是文心大模型创意社区……
    把这些线索稍作串联的话，文心大模型瞄准的可能是AIGC，即运用人工智能技术自主生产内容。百度创始人、董事长兼首席执行官李彦宏也在百度世界的演讲中提到，AIGC是继UGC、PGC之后一种新的内容生产方式，它不仅能提升内容生产的效率，也会创造出有独特价值和独立视角的创意内容。
    02 既能补全名画，也能探测深空
    在2022百度世界大会的直播中，不少网友纷纷以弹幕的方式留言，直呼写诗作画的文心大模型“太凡尔赛了”。然而文心大模型不只有文艺范儿的基因，同时也是一位有钻研精神的“理工男”。
    时间回到2021年12月，百度正式成为“中国探月航天工程人工智能全球战略合作伙伴”。根据当时公开的信息，双方将在包括月球探测、行星探测等在内的深空探测领域，开展航天技术与人工智能技术的相关合作。外界的好奇心也由此萌生：人工智能和深空探测到底有哪些合作的空间？
    2022百度世界大会上，答案被正式揭晓：百度与航天合作研发了世界上第一个航天领域的大模型——航天－百度·文心大模型，航天－百度·文心大模型可以将航天领域的数据和知识融合学习，对航天数据进行智能的采集、分析和理解，助力深空智能感知、规划和控制等技术突破。
    想要理解文心大模型在航天领域的应用潜力，似乎有必要梳理下人工智能在航天探索过程中的重要性：
    首先是数据层面。对尺度比地球大无数倍的广阔空间中进行探索，不但拥有一般大数据的数据量大、类型多、要求高的特点，还需要对数据进行实时处理。如果没有及时而精确的数据分析，哪怕是一个小数点的错误，都可能影响全局的成败。
    其次是应用层面。以往航天数据的处理主要是人工分析，由于航天器数据下传的周期和距离成正比，依靠地面进行数据判断的方式，已经无法满足航天器在轨快速状态监测和故障诊断的需要，必须要提高航天器在轨自监测、自诊断等能力。
    再次是价值层面。航天大数据的应用不应止于数据分析，对历次飞行数据进行记录、存储和学习，可以深度模拟航天器的运行状态，对修正控制、改进设计等提供依据，持续反哺航天器的设计、制造、保障等服务，提升航天工程的整体效率。
    而文心大模型的切入逻辑在于，航天飞行任务规划是一个典型的知识处理过程，千亿级参数的大模型不仅可以即时优化飞行轨道与姿态控制，最大限度规避飞行中的风险，还可以帮助飞行器自主规划探测路线、自主选择探测目标。抑或是整合现有的海量资料及资源，加速太空智能感知、太空智能规划、太空智能交互等工作的进程。
    按照中国探月工程副总指挥、国家航天局探月与航天工程中心主任刘继忠的介绍，国家已经制定出了深空探测未来十年的规划，涉及到探月工程和行星探测工程，将在十年内实现火星采样、小行星采样、木星系的环绕探测等重要任务。深入航天行业核心环节的文心大模型，也将沿着国家深空探测的步伐走向星辰大海。
    03 深耕产业刚需，释放技术红利
    无论是内容创作上的独树一帜，还是在航天领域的另开生面，文心大模型都表现出了产业落地的雄心。在一些大模型还在盲目追逐模型参数、笃信“大力出奇迹”的环境下，走出了产业化的新路径。
    其中的底层逻辑离不开“大模型”本身的特质。传统的模型训练需要大量的数据标注才能训练出足够精确的模型，但预训练大模型采用的是自监督学习的方式，可以对海量无标注数据中的规律和知识进行提炼、学习。当面向任务和场景应用时，只需少量的任务标注数据，通过微调就可以得到在应用场景中非常好用的模型。
    同时也离不开百度AI的独立思考。预训练大模型打破了数据标注的瓶颈，对产业落地越来越友好，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜据此做出了一个不同于行业内其他厂商的判断：“今年是大模型的落地关键年。大模型历经了前几年的探索期、突破期，已经在一定程度上到达推广期”。
    折射到具体的落地环节，文心大模型瞄准了产业刚需。
    比如《富春山居图》残卷的补全，对应的是内容生产的缺口，文心大模型的跨模态综合技术能力，为降低内容制作成本、提升内容多样性打通了新的途径；再比如WAVE SUMMIT 2022上首发的行业大模型，在通用大模型的基础上挖掘行业数据，通过“行业知识增强”进一步提升大模型对行业应用的适配性。
    厘清了大模型落地的思路，还需要解决另一个问题，即配套的工具和平台，继而全方位降低大模型的应用门槛。对应的有文心大模型开发套件、API，以及内置了文心大模型能力的EasyDL和BML开发平台。
    可以找到的落地案例有很多。
    2022年高考期间，文心大模型加持的AI数字人度晓晓挑战高考作文，围绕“本手、妙手、俗手”写出了题为《苦练本手，方能妙手随成》的作文。根据历年情况，度晓晓的作文得分超过75％的高考考生。
    国家电网和百度联合研发的国网－百度·文心大模型，在海量数据中挖掘电力行业数据，引入电力业务积累的样本数据和特有知识，并且在训练中结合双方在预训练算法和电力领域业务与算法的经验，在国网场景的应用效果显著提升。
    按照相似的思路，百度与浦发银行也联合研制了金融行业大模型。浦发·百度－文心大模型结合浦发场景积累的行业数据与知识，双方技术和业务专家一起设计了针对性的财报领域判别、金融客服问答匹配等预训练任务，让文心大模型学习到金融行业的知识，并在浦发典型任务应用上提升效能。
    正是一个接一个的产业应用案例，让外界对大模型的认知正在重构：不再是高不可攀的殿堂级技术，而是普罗大众随手可用的创作工具；大模型正在走进产业深处，解决行业的核心问题；大模型的使命是降低技术门槛，让AI走向通用型技术……
    文心大模型的产业应用图景也越来越清晰，正迈过前沿技术与应用场景间的鸿沟，让技术在落地应用中产生真实价值，向千行百业释放技术红利。
    04 写在最后
    可以看到，百度对于文心大模型的建设思路和飞桨一样，都是为了加速人工智能的落地，践行产业智能化的使命。
    截至目前，文心大模型已经发布了20多个大模型，涵盖基础大模型、任务大模型和行业大模型，构建了一套完整的大模型生态体系，并通过飞桨、百度智能云等逐步走进工业、能源、金融、通信、媒体、教育等场景。
    补全名画、探测深空等新技能，既是百度AI产业智能化进程的里程碑，也进一步诠释了产业化破局的初心和恒心。