文心大模型再发力,重构百度网盘

时间:2023-05-31       来源: TechWeb       阅读量:9345   

5月25日在百度举办的万象大会上,百度网盘宣布将基于文心大模型进行全面升级。

这也意味着,中国云存储平台正在迈入一个新纪元。

在2007年的Mac world大会上,一部具有时代意义的设备宣布诞生。苹果创始人乔布斯当时拿着第一款iPhone向世界豪迈宣布:“苹果重新定义了手机”。

如今,网盘也在呈现出这样的趋势,成为一项基础设施。2016年后,网盘行业大洗牌,包括360、新浪、迅雷、金山、华为、UC等多家网盘企业宣布转型或者关闭部分功能。前360副总裁沈海寅曾经这么表示,“没人知道这些数据的价值究竟是什么,也没人知道怎么变现。”

2023年,大模型兴起,甚至被视为将掀起整个人工智能的技术革命。百度作为中国首个发布对标ChatGPT大模型的厂商,在发布“文心一言”大模型后,也将这一模型逐步应用到自家产品当中。

目前,百度网盘已经拥有8亿的个人用户,服务超过30万企业。尽管如此,百度网盘依旧面临如何将信息化转变为知识化的难题。

“业界有一种说法,大模型时代来了,每一个产品都值得重做一遍。但谁真正重新做了一遍呢?百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!”

百度掌门人李彦宏的这番话意味深长,这也意味着网盘领域面临重构,AI+网盘的结合将是一个新故事。

藏在AI宇宙里的网盘

5月24日,微软宣布旗下的Windows 11将成为第一个为客户提供生成式AI的PC平台,通过ChatGPT与自家产品全面打通,进一步拓展微软AI宇宙。

次日,百度网盘宣布将结合文心大模型升级,推出“云一朵”智能助理,并为企业和个人打造“第二大脑”。可见,国内外厂商都在探索,如何用大模型在AI宇宙里维持先发优势。

在百度文库、如流内测接入文心大模型后,百度网盘结合大模型的升级并不意外。

从定位来看,百度网盘目前主要服务两种人群,一是个人用户,二是企业用户。个人用户数超过8亿,企业客户超过30万,总数据规模达到千亿GB,单个活跃用户的文件数量达到数万级别。

一旦结合大模型,百度网盘所面向的学习、办公、生活场景都将会有更大的效能提升及新需求的诞生。

IDC数据显示,到2025年,全球创建、获取和复制的数据量将增至175ZB,其中,企业存储的数据量将超过全球总数据量的80%。这也表明企业正迅速成为产生数据和管理数据的主要载体,海量数据将为企业带来更大的存储困难。

面对不断增长的海量数据,怎么进行存储管理?又如何将这些海量数据转变为有价值的知识,让个人和企业都能用起来?

人机交互是关键,李彦宏这么描述:

“对于人类而言,最自然的交流方式就是语言沟通。如果一句话就能让电脑帮你整理数据绘制图表,当然会比手动点开一大堆数据页面再逐个整理分析高效得多。”

如何为我们所用?

通过与百度网盘“云一朵”智能助理的自然对话,用户可以在海量信息中快速查找信息,实现转化文档、找图、摘要、翻译的功能。

大模型的出现,真实传递出一个信号:网盘正在迎来重要拐点,进入3.0阶段。

回顾网盘的发展史:1.0阶段,网盘主要围绕文件,提供数据管理服务,核心作用是存储;2.0阶段,网盘已经开始提供综合云服务;而3.0阶段,网盘将围绕用户与客户建立链接,逐步实现知识化。

百度网盘向B端深化

“我们早在几年前就判断,数据+AI一定是我们非常关键的方向,AI能够让数据实现结构化,大大降低用户使用数据的门槛,为用户提供有用的知识。” 百度智能云网盘技术部总经理唐海浩谈道。

2013年,为抢夺市场各厂商开始了轰轰烈烈的免费战,那个时候,数据备份存储、共享数据成了对网盘的定义。

但现在,AI的出现将重新颠覆网盘行业,激发和创造一些过去没有的需求。究竟什么样的需求仍未被发现和满足?

从网盘当前的商业模式来看,横向是进行功能重组、生态合作,以单点功能输出的形式嵌入软件或硬件终端;纵向是打造场景化产品,基于特定场景从基础网盘中孵化出新的功能型产品来,以减少基础网盘产品的臃肿程度。

在这个基础上,百度网盘做了两件事,一是升级百度网盘企业版,其中升级智能知识管理与智能多模态加工两大应用;二是升级百度网盘开放平台,对开发者、生态伙伴以及有技术能力开发的企业提供多类场景解决方案,包括摄影、教育、电商、生命科学等重点行业。

首先是企业版,面向企业办公常用的合同票据、设计素材等57个场景定制分类标签,可实现企业文件的快速管理与查找。多模态加工方面,则进行商业级的图像处理,对人像、物品进行一键AI抠图、修图、换背景。

而在生态开放平台端,摄影、生命科学、智能硬件行业通过大模型实现了效率的提升和体验的优化。

像摄影行业,百度网盘推出了“即拍即选”服务,实现一键上传、AI修图、自动套版、生成网盘链接分享等功能。与传统的摄影机构相比,大模型的结合使得单客服务成本降低75%,效率提升超过30倍。

在智能硬件行业,百度网盘通过集成网盘能力连接用户网盘的数据和知识,将网盘的语音转写、视频转音频等能力赋能到智能音箱、阅读器、听力机、词典笔等硬件上。

如此一来,百度网盘帮助企业降本增效的同时,还将网盘能力赋能到硬件上彻底摆脱产品使用的割裂感,父母可直接在自己的网盘筛选适合孩子的内容,同步老师网盘的最新教学内容,远程一键推送到孩子的早教机上。

无疑,百度网盘正在“变轻”。

李彦宏认为,未来的趋势是所有应用都将基于大模型来开发,大模型最终会深度融合到实体经济当中去,每个行业都会有属于自己的大模型。

在百度网盘分论坛上,素玄科技、安诺优达、牛听听等公司就分享了与百度网盘的合作案例。但大模型的接入,也意味着百度网盘面临成本问题。

此前就有投资人测算过,对标一个GPT3.5,基于目前已有的公开资源,大概需要的投入至少是1亿到2亿美金。

唐海浩表示,目前百度网盘在大模型成本方面也持续做技术储备,除了依托百度大模型自身的成本优化,也包括业务本身的新机型、端云XPU协同计算与调度、大模型任务结合业务场景做精细化拆分与小型化等技术举措,持续降低单AI任务的成本。

不可否认的是,AI+网盘是大势所趋,网盘作为人类数据和数字世界的连接纽带,正在经历着前所未有的改变。

有没有可能变成“第二大脑”?

2016年3月,Google人工智能AlphaGo与围棋世界冠军李世石的人机大战最后一场落下了帷幕。人机大战第五场经过长达5个小时的搏杀,最终李世石与AlphaGo总比分定格在1比4,以李世石认输结束。这一次的人机对弈也让人工智能正式被世人所熟知,整个人工智能市场也像是被引燃了导火线,开始了新一轮爆发。

早在2013年,百度就开始关注并布局人工智能领域,10年累积投入超过1000亿。

2019年,其中领跑国内同行的文心大模型发布了1.0版本,文心大模型的持续迭代依托于国内首个全栈自研的AI大底座,AI大底座的千卡并行线性加速比可以达到90%以上,训练资源利用率超过70%,模型开发迭代效率提升100%。

基于文心大模型,百度旗下产品都值得重做一遍。那么,百度网盘未来的形态会发生什么变化?

“过去十年百度网盘经历了数据化、信息化的阶段,未来将迎来全面知识化的阶段。”唐海浩说道。

这也意味着,百度网盘从过去的工具型产品逐步升级为知识化的底座,成为企业和个人的“第二大脑”。

什么是“第二大脑”?科技作家徐子沛在他的书中这么解释,“第二大脑是在个人和互联网之间出现的一个新工具。它不仅是我们生物大脑的数字复制体、外挂大脑,可以随时记录、存储和查找,它还是人类生物大脑的一个补充和延伸,可以对我们的记录不断地进行动态整合和分析,借助算法的灵性,它还可以帮助我们发现、创建有价值的连接,推动第一大脑产生新的创意。”

总结下来,即可以完成以下这些动作:记录-存储-查找-整合-分析-筛选有用有意思的知识。百度网盘如若变成“第二大脑”,就意味着其不仅在存储效率上有更大的提升,还能实现自然语言的交互,将多模态的文件转化为各个场景的知识,并且进行分类、检测、美化等步骤。

届时,每个用户都能拥有属于自己的数字助理。

伯虎财经认为,这种构想并非虚幻,而且就在不远的将来。网盘需要有更大的想象空间,它绝不仅仅只是存储工具,作为数据入口它的商业价值仅仅只是呈现了部分。

正如吴天昊所言,“下一个更好的服务或应用,可能不是现在网盘的形态,而是一种全新的东西,只是我们现在还没想到。设想一种场景,我们带着智能眼镜,结合网盘和AI技术,这时候网盘已经没有操作界面,不再是APP形态了。未来的网盘和第二大脑是什么样的?需要大家一起去创造。”

过去14年,我们见证了百度网盘从1.0的数据化到2.0的信息化进化过程。如今,百度网盘又再次宣布“归零”,去讲述一个中国AI宇宙里的网盘故事。路漫漫其修远兮,百度网盘作为探路者对整个行业来说意义非凡。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。