推广 热搜: 行业  机械  设备    系统  教师  经纪  参数    蒸汽 

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

   日期:2024-11-11     移动:http://gzhdwind.xhstdz.com/mobile/quote/74899.html

美国商业科技界正在升起两位“新神”。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

一位是“钢铁侠”埃隆·马斯克,“带领人类走向火星”;

一位是“奥特曼”山姆·阿尔特曼,“带领AI走向人类”。

大多数人对马斯克很熟悉了,特斯拉汽车在中国道路上疾驰,朋友圈也经常能刷到SpaceX火箭发射和星链卫星的新闻。

阿尔特曼是因为ChatGPT爆热,才被国人知晓。2023年,大模型LLM、AGI、AIGC、prompt成为很多人口中的新名词。

本文就从头开始聊一聊:啥是大模型?欢迎阅读~

百度李彦宏经常在演讲中谈及大模型,用的标题都很吸睛 ——《大模型改变世界》。

“人工智能再次成为人类创新的焦点,越来越多的人认可第四次产业革命正在到来,而这次革命是以人工智能为标志的。

之所以成为焦点,是因为大模型。大模型成功地压缩了人类对于整个世界的认知,让我们看到了实现通用人工智能的路径。

当下,我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。”

360周鸿祎也不止一次地提到,过去三个月,相当于过去人工智能历史上的三十年,大模型是新时代“发电厂”。

“我觉得大模型的机会是一次不亚于PC、互联网、iPhone被发明的机会,应该说是一次新的工业革命的机会。

现在数字化已经成为国家战略,但数字化的终点不是大数据,数字化的终点应该是智能化。”

李开复更是在《AI1.0到AI2.0的新机遇》的演讲中,旗帜鲜明的发声:AI大模型是不能错过的历史机遇!AI2.0市场预计将是移动互联网规模的10倍。

无论是企业还是个人,都极度重视这一波AI大模型巨变。

但是,究竟啥是大模型?

百度百科给了一个“很糟糕的”回答:为了仿照实体而去建造的大型道具模型。

文心一言回答地还不错:

AI大模型是人工智能领域中的一种重要技术,具有强大的能力和广泛的应用前景。

今年4月,我现场参加了陆奇博士的分享,第一次比较清晰地理解了这个所谓的“大模型”。

“信息”系统(subsystem of information),从环境当中获得信息;

“模型”系统(subsystem of model),对信息做一种表达,进行推理和规划;

“行动”系统(subsystem of action),我们最终和环境做交互,达到人类想达到的目的。

基于此,陆奇还得出一个简单结论。

今天大部分数字化产品和公司,包括Google、微软、阿里、字节,本质是信息搬运公司。

“一定要记住,我们所做的一切,一切的一切,包括在座的大部分企业都在搬运信息。Nothing more than that,You just move bytes。但它已经足够好,改变了世界。”

可以说,以前的PC互联网也好,移动互联网也好,都还是信息无处不在。

2023年的拐点是什么?

AI大模型

当下,模型无处不在,未来,行动无处不在。

陆奇的布道,让众多创业者和投资人,清晰地感受到了,无处不在无所不能的“大模型”。

预训练大预言模型的代表:就有百度的文心、Open AI的GPT,进而有了文心一言和ChatGPT等大模型产品。

回头看一下,ChatGPT的英文全称:Chat Generative Pre-trained Transformer,恍然大悟。

这时如果再有人问你“啥是大模型”,你是不是,从概念到技术,都比较清晰了。

还没完,我们还应该从产业的视角进一步来看,什么是大模型?什么是AIGC应用?什么是算法、算力和数据?什么是模型层、应用层?

众所周知,AI人工智能,早已不是什么新鲜词了。

你的脑中或许会闪过这样的几个重要节点:

Deep-blue(1997)- AIphaGo(2016)- ChatGPT(2023)

人工智能的浪潮可谓是一波又一波。

人们回过头看,2014年之后的那一波AI创业企业,在近两年也是陷入低谷。

曾经的AI四小龙,而今安在哉?

语言人工智能、视觉人工智能、安防人工智能,也都时过境迁,远远不如今天的大模型、AGI、AIGC、ChatGPT火热。

给大家梳理下四个名词概念:AI、AGI、AIGC、ChatGPT。

AI:人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

AGI:通用人工智能(Artificial general intelligence),计算机科学与技术专业用语。这一领域主要专注于研制像人一样思考、像人一样从事多种用途的机器。这一单词源于AI,但是由于主流AI研究逐渐走向某一领域的智能化(如机器视觉、语音输入等),因此为了与它们相区分,增加了general。

AIGC:人工智能生成内容(AI generated content),又称生成式AI。例如AI文本续写,文字转图像的AI图、AI主持人等,都属于AIGC的应用。

“AIGC+ChatGPT大模型正是第三次浪潮谷底之后迎来的拐点,也是由大模型推动的新的一轮发展浪潮的来临。”

台下的我,是极度认同的。

光有技术和产品还不够,还得有顾客用户愿意买单。

商业化的考卷难题,再一次传到AI大模型企业的手中……

有了产品就有了市场,有了江湖就有了竞争。

移动互联网时代的那场“百团大战”,还让很多从业者记忆犹新。

那会,无论是马云、马化腾还是李彦宏,整个互联网圈都还在喊:

“所有行业都值得用互联网重做一遍。”

再看如今,无论是阿里百度,还是腾讯华为,也都在新时代振臂高呼:

“所有行业都值得用大模型重做一遍。”

故事总是充满熟悉的味道。

2023年,“百模大战”,一触即发。

因为工作需要,我除了参加行业、企业、研究机构的发布会和闭门会,还需要基于自身的业务,不断了解最新的AI大模型和AIGC应用

创业黑马牛文文曾在演讲中提到,只要有一个革命性技术出来,中国在应用层会快速追上。

“在AI大模型和AIGC应用上,互联网大厂、高校和研究机构、产业龙头企业,包括一些先知先觉的中小企业,都可以在大模型领域和大模型时代有所作为。”

那么,中国进入“百模大战”,未来机会在哪?

或者说,除了诞生ToC的“中国版ChatGPT”,中国的通用大模型企业其它的机会点在哪?

第一,ToG政府,为各级政府各个城市部署私有化大模型。

第二,ToB企业,为一些有需求的企业部署私有化大模型。

除了通用大模型,未来也将属于千千万万的行业大模型。

这主要是因为,越来越多的人感受到通用大模型的问题:

比如,大模型是“通才”,但缺乏行业深度。比如,大模型无法保证内容可信,行业称之为“幻觉”。还有一个很现实的问题,共有大模型的训练和部署成本太高,大多数中小企业无法承担,进而导致无法普惠到所有人。

相较于通用大模型,行业模型至少有三个优点:

第一,解决专业领域问题能力很强;第二,训练和部署成本更低;第三,升级和迭代更加灵活。

或许,AI大模型的未来,将是十几个通用大模型,以及成百上千个行业大模型。

除此以外,基于大模型产生的AIGC应用更是数不胜数,遍布各个细分场景,帮助人们解决各个具体问题。

不止百模大战,也是中美争锋。

早在2017年,国家就出台了新一代人工智能发展规划,明确将人工智能列为国家战略。今年4月28号,中央政治局会议更是重点提及要重视通用人工智能的发展,营造创新生态。7月13日,《生成式人工智能服务管理暂行办法》公布,鼓励技术在各行业和各领域的创新应用。

人工智能三大要素,算力、算法和数据。其中,中国两国在算力方面差距不大,按2022年年底的数据,美国占全球算力36%,中国占31%。

邬贺铨院士认为:“在中国从事AI研究的技术人员不算少,但具有架构设计能力和AIGC数据训练提示师水平的人才仍然短缺。在ChatGPT出现之前,有人认为中国在AI方面的论文与专利数与美国不相上下,ChatGPT的上线使我们看到了在AIGC上中美的差距,现在是需要清楚认识和重视我们面对的挑战,做实实在在的创新。”

现在许多公司和研究机构都处在“百模大战”之中,不论初创公司还是大公司,充分竞争的市场才是好市场,充分竞争的公司才是好公司。

张亚勤院士认为:“大模型时代才刚刚开始,42公里的马拉松我们刚跑到5公里,算力、数据不够都不成问题。中国在PC时代落后于美国,但在移动互联时代领先于美国(数字支付、微信、短视频),AI时代要给创业者、科研人员、企业更多信心。”

一些产业从业人士指出,在AI大模型上中美争锋,主要是“OMG”和“BAT”的战斗。

我们依次看一下这六家企业:OpenAI、meta、Google、百度、阿里、腾讯。

1)Open AI

2022年11月30日,OpenAI发布ChatGPT。作为ChatGPT的母公司,Open AI引领着AI大模型的发展。2016年微软投资了OpenAI十亿美金。2020年推出的 GPT-3 ,有1750亿参数,是大模型的技术。2022年推出的 ChatGPT 是基于大模型的产品形态。2023年微软继续投入100亿美金,OpenAI+微软已成为最具影响力的AI力量。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

2)meta

Facebook先是押注元宇宙,如今又入局AI大模型。扎克伯格是蹭热点,还是全面发力?过去Facebook的使命是“Make the world more open and connected”,这个话也是非常具有互联网时代特色的,就是开放、连接。如今,扎克伯格已然意识到这个东西不够了,他说我们要“Bring the world closer together”,怎么才能“closer together”呢?还是要通过用户画像、通过人工智能的技术,找到人和人之间相同的兴趣,把他们连接在一起。metaAI发布了开源大模型LLaMA,可以在单个GPU上运行。

3)Google

2023年5月10日,谷歌在两个小时的大会里提及“AI”200多次,并一口气推出了AI大模型PaLM2、AI机器人Bard、AI搜索、AI办公等多款模型和产品,一套完整的AI系统全面嵌入谷歌旗下超过25个产品和应用。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

歌搜索将在产品搜索页面同时展示其产品描述、评论、价格和展示图等信息

4)百度

2023年3月16日,百度在中国率先发布文心大模型。据了解,百度是中国最早布局大模型的公司,于2019年就开始了预训练模型 Ernie1.0。目前,文心大模型家族已形成文心大模型+工具与平台+产品与社区的庞大大家族。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

除了依托百度搜索的海量数据优势,百度在AI大模型领域的“四层模式”(芯片层+框架层+模型层+应用层)才是其在“百模大战”中的核心竞争力。百度之所以能够在Google、meta、阿里、腾讯等大厂之前先做出来“文心一言”,就是因为这四层的全栈布局。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

百度在芯片层的布局是昆仑芯,已经量产几万片。昆仑芯第三代,预计2024年初量产。飞桨属于框架层,文心属于模型层。

5)阿里

2023年,4月11日,阿里发布大模型。张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马、饿了么等。他认为,面向AI时代,所有产品都值得用大模型重新升级。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

阿里云也面向企业提供普惠的AI基础设施和大模型能力。未来每一个企业都可以通过阿里云调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

图注:钉钉会议能够随时生成会议记录并自动总结会议纪要、生成待办事项

6)腾讯

直到2023年6月19日,腾讯才姗姗来迟地开了场发布会。腾讯对外公布行业大模型研发进展,宣布将助力企业构建专属大模型及智能应用,为企业提供MaaS一站式服务。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

据了解,腾讯将为文旅、政务、金融等10余个行业,提供超过50个大模型行业解决方案。比如,基于腾讯云智能媒体AI中台,为央视打造人工智能开放平台,提供智能标签、修复、智能翻译等30多种算法。为上海大学,利用腾讯云教育行业大模型能力,构建专属的教育行业大模型基础平台,覆盖在校生和毕业生全生命周期业务,将提供教学助手、人才培养、招生就业助手和作业批改等服务;此外,腾讯企点、腾讯会议、AI代码助手等多款头部SaaS产品,也迎来了能力升级。

我们认为,中国大模型战队中除了BAT,还应该重点关注四家企业和机构,360、华为、智源和智谱。

百度、阿里、腾讯、360、华为、智源、智谱,就好比是中国AI大模型的“战国七雄”。

7)360

2023年6月13日,360集团对外发布了360智脑大模型。360关于大模型的战略是八个字:“两翼齐飞、四路并发”。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

“两翼齐飞”,一方面要发展大模型的技术,另一方面要场景化、产品化、平民化、垂直化。只是模仿ChatGPT,做了一个搜索对话框,做了一个聊天机器人,指望这个东西带来工业革命是不现实的。场景分为四路:一是To C的场景,搜索引擎+浏览器和桌面。二是面向中小企业。三是面向政府、大型企业。四是面向行业的GPT,跟有行业数据的合作伙伴相结合。

8)华为

2023年7月7日,华为发布盘古大模型3.0.“不作诗、只做事”、“AI 重塑千行百业”、“AI for Industries ”华为的盘古大模型聚焦行业价值场景,围绕行业重塑、技术扎根、开放同飞三大方向,为行业客户提供服务。

盘古大模型3.0是一个完全面向行业的大模型系列,包括5+N+X三层架构。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

华为从2019年到2021年之间就开始立项做盘古大模型。2021年发布了盘古NLP大模型、盘古机器视觉大模型、盘古科学计算大模型、盘古药物分子大模型。到2022年在行业中拓展应用,发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。2023年7月7日发布的盘古大模型3.0,重点提及了5个基础大模型(自然语言、多模态、视觉、预测、科学计算)和7个行业大模型(政务、金融、制造、药物分子、矿山、铁路、气象)。

9)智源

2023年6月9日,智源研究院院发布了全面开源的“悟道3.0”系列大模型及算法。继 2021 年悟道大模型项目(悟道1.0于2021年3月发布)连创“中国首个+世界最大”纪录之后,智源 “悟道3.0 ”进入全面开源新阶段,带来一系列领先成果:“悟道·天鹰”(Aquila)语言大模型系列、天秤(Flageval)开源大模型评测体系与开放平台,“悟道 · 视界”视觉大模型系列,以及一系列多模态模型成果。

10)智谱

2023年3月,基于千亿基座模型的ChatGLM开启内测。智谱AI由清华大学计算机系的技术成果转化而来,致力于打造新一代认知智能通用模型,提出了Model as a Service(MaaS)的市场理念。公司于2021年合作研发了双语千亿级超大规模预训练模型GLM-130B,并主导构建了高精度通用知识图谱,把两者有机融合为数据与知识双轮驱动的认知引擎,并基于此千亿基座模型打造ChatGLM。此外,智谱AI也推出了认知大模型平台Bigmodel.ai,形成AIGC产品矩阵。通过认知大模型链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座,赋予机器像人一样“思考”的能力。

最后,总结一下。

1、中国为什么一定要自研AI大模型?

基于战略安全角度和经济商业价值,都能得出中国一定要自研AI大模型这一确切答案。从中美贸易战到芯片卡脖子等,中国政府必然要保证关键技术的自主可控和国家安全。并且OpenAI和微软的实践也表明了,AI大模型将有巨大的商业价值,中国企业需要抓住这一机遇。

李开复也认为,“使用海外的开源大模型就可以做出中国版的OpenAI”的说法是绝对错误的,技术的天花板将决定你永远做不出达到或超越GPT-4.0技术水平的大模型。此外,拿海外训练出来的大模型,在国内做微调是值得商榷的。因为国内外的文化习惯、法律法规不同,所以自主创新做大模型是中国企业的必经之路。

2、中国AI大模型产品何时能赶上“ChatGPT”?

李彦宏曾公开表示,文心一言与ChatGPT版本差距并不明显,可能只相差一两个月的时间。对于这种说法,王小川则调侃称,媒体采访的可能是平行世界的李彦宏。

王小川认为国内目前的大模型和ChatGPT的差距不可能只是两个月。“如果在追上目前ChatGPT-3.5的水平,大概今年内就能做到,但如果要追上未来的GPT-4和GPT-5,预计要3年左右的时间。”

艾瑞咨询认为,与ChatGPT功能对标的大语言模型(Large Language Models, LLMs),目前国外主要有Google推出的Gopher、LaMDA以及meta的Llama等;国内为百度首发的“文心一言”、360发布的大语言模型、阿里发布的“通义千问”、商汤发布的 “商量”等。虽从对话和文本生成的直观体验看ChatGPT略胜一筹,但对于Google等国外大厂而言,克隆ChatGPT并不存在太高壁垒,当前暂时落后主要是出于公司战略与技术理念差异,选择了不同技术路线,随着各家探索成果和新技术方法的实践不断推进,仍存在对GPT系列模型赶超的可能。对百度等国内大厂而言,则在数据、算力、工程化能力等关键要素上存在短板,短期内难以对国外领先大模型实现赶超,为跟随者角色,长期更需要国内AI全产业链整体进化。

「人工智能」啥是大模型?一篇文章看懂火遍全网的“AI大模型”

3、AI大模型的竞争关键和创新机会在哪?

1)通过OMG可以看到:ChatGPT在逻辑推理、上下文理解等方面的能力,是模型参数量达到该量级后“涌现”出的,即所谓的“大力出奇迹”。在此之前,坚定的科研初心,丰厚的资本支持,是中国科技企业需要向美国科技企业认真学习的。

2)通过百度可以看到:“基础层+模型层+应用层”,底层技术的积累至关重要。无论是芯片层的昆仑还是框架层的飞桨,“根技术”的深厚决定枝叶的生长速度。

3)通过阿里可以看到:“互联网时代的产品都值得用AI重新升级”。阿里是这么说的,也是这么做的。必然有后浪高举AI原生的旗帜,颠覆马云的互联网思维。

4)通过腾讯和华为可以看到。无论是云服务还是大模型,竞争的核心和商业的重点,都指向行业ToB服务,AI大模型要更有行业价值,也要“离钱更近一点”。

5)通过360可以看到,数字人是大模型重要的应用入口,大模型的发展要和国家的产业数字化战略相结合,企业级垂直大模型更为关键。把大模型拉下神坛,变成每个企业、政府部门都感觉能够直接使用的东西。

4、中小企业该如何面对AI大模型?

李开复说:

我们完全可以想象今天的Word、PowerPoint、Excel、Photoshop等应用通通都会用AI大模型重写一次,而且重写之后它的用户体验会变,甚至商业模式也会变。

李彦宏说:

业界有一种说法,大模型时代来了,每一个产品都值得重做一遍。但谁真正重新做了一遍呢?百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!

也有企业保持理性:

折腾是找死!不折腾是等死!

大模型更像是巨头的游戏和军备竞赛,它和芯片、语料息息相关,如果没有巨量的资金储备,很难真正做大模型;非巨头还是要理性看待大模型。

大模型是基础建设,行业模型与应用场景等将拥有更大的发展机会?

创业黑马近期举办了两期AIGC产业营,参与者大多都是中小企业,300家。

通过其数据可以发现:25%的企业已经开始探索和应用AIGC,传统产业的企业期望利用AIGC转型升级,300家企业分布在企服、消费、培训、文娱、营销等各个行业领域。

但无论如何,中小企业不得不去思考:

有没有能力做AI大模型或行业模型?

自己的行业会不会出现新的AI产品?

新的AI产品会不会颠覆自己?

自己有没有能力做出那个AI产品?

自己原有产品如何基于AI新技术进行迭代创新?

自己基于大模型做微调做应用层创新?

基于国内外的哪个大模型做应用研发和产品创新?

不考虑大模型,直接用AIGC的产品或工具,简单粗暴降本增效?

……

最后,还有一点值得大家注意:

“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性工作。现在看起来,它会以相反的顺序进行。”

高科技投机机构ARK Invest预测,以AIGC为代表的新一代人工智能技术将辅助知识工作者(包括教师、律师、医生、财务、程序员等白领职业)提高工作效率。报告预测,到 2030 年,AI 将大幅提高知识工作者的工作效率,平均工作效率增加140%,新一代人工智能技术将有可能大幅度降低脑力劳动者的工作强度。如果这一切成为现实,或将是继人类历史上由于动力革命而摆脱繁重的体力劳动之后,人类社会发生的又一次伟大的技术革命。

上面引号里那句话,是ChatGPT创始人,山姆·阿尔特曼,说的。

他还说过一个观点:

“没必要担心被AI取代,人类和机器终将融为一体。”

本文地址:http://gzhdwind.xhstdz.com/quote/74899.html    物流园资讯网 http://gzhdwind.xhstdz.com/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关最新动态
推荐最新动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号