带你了解AI大语言模型的发展历程，2024年AI三巨头有哪些？Gemini和Claude是否已经超越GPT4

推广

推荐	链接	教程
翻墙机场VPN	注册链接	不限时翻墙机场推荐，众多不限时套餐｜大流量套餐｜免费试用｜畅享4K
SuPay虚拟U卡	注册链接	【视频教程】-SuPay美元虚拟U卡，支持ChatGPT Plus订阅，覆盖99%支付订阅场景
欧易开户教程	注册链接	【视频教程】-币圈小白入门，从零开始购买加密货币，欧易如何交易加密货币？

背景

自从ChatGPT发布以来，一年多的时间各个互联网大厂都发布了众多AI产品。今天的视频带大家了解AI大语言模型的发展历程，看一下近一年来，这些科技大厂都做了哪些让人惊艳的AI产品。同时2024年了，我们来看下AI领域三巨头有哪几家，谁会成为未来AI领域的龙头呢？ background

AI大语言模型

1. ChatGPT3.5

gpt35 一切要从2022.11.30日说起，OpenAI发布划时代意义的AI大语言模型，ChatGPT 3.5，而这成为AI大语言模型的里程碑，ChatGPT 3.5 可接受文本输入，并产生文本输出，可以帮你写代码，写文案，查资料，自动问答，自动摘要等多种任务。

ChatGPT 3.5 一经问世，用户就快速增长，仅用5天就有100万用户，一个月过后，就超过了1亿用户，成为增长最快的应用。

2. New Bing Chat

newbing 而在2023.02.07 微软发布New bing AI聊天机器人，New Bing比ChatGPT 3.5更加先进，可以联网获取实时信息，支持多种对话模式，而传闻OpenAI尚未发布的GPT-4已经集成到New Bing AI中，这一切都要归功于微软向OpenAI投资了100亿美金，作为OpenAI的大股东，自然可以坐享其成。

3. GPT-4

gpt4 2023.03.14 OpenAI宣布 GPT-4正式发布。GPT相比GPT3.5支持更长的上下文，ChatGPT可以处理3000个单词，而GPT-4可以处理25000个单词，同时GPT-4也支持多模态，拥有图片识别能力。

同时GPT-4也拥有更好的创造性和协作性，同时它也拥有更高的逻辑推理能力，可以解决复杂的逻辑推理题，在当时，这就是最好的AI模型。

4. Claude

claude 仅仅一天过后，2023.03.15 AI创业公司Anthropic发布新一代大语言模型Claude，你可能没听说过Anthropic，它是由OpenAI前研究副总裁和ChatGPT 3的论文一作等人在2021年共同创办的AI创业公司，由Google和亚马逊领投的一家非常有前景的创业公司。

Claude是下一代人工智能助手，Claude 可以帮助处理用例，包括摘要、搜索、创意和协作写作、问答、编码等。克劳德还可以对性格、语气和行为进行指导。Claude对语言技能和专业知识的结合令人印象深刻。

5. Google Bard

bard 2023.03.21 Google发布Bard AI机器人，宣布加入AI之战。当然bard AI早期版本并不算强大，还不支持中文访问，Google Bard会根据你的问题给你准备多份草稿，以便你选择最合适的起点让它进行作答。此时Bard对ChatGPT尚不构成威胁，但是我还是相信google的研发实力，在后续版本会有极大的提升。

6. Claude 2

claude2 2023.07.11 Anthpatic发布Claude 2，Claude性能得到极大提升，同时在编码、数学、推理方面对之前的模型进行了改进，而且Claude 2增加了Token的长度，可以支持100K个Token，所以Claude 2可以处理数百页的技术文档甚至一本书，Claude2在编码和数学测试上相比上代都有了极大提升，可以说Claude到目前为了算是到达了能用的程度。

7. GPT-4 Turbo

gpt4turbo 2023.11.07 OpenAI发布升级版GPT-4，GPT-4 Turbo。这次版本升级巨大，GPT-4 Turbo的Token提升到128K，这意味着模型能够处理更大范围的文本，更好地理解长篇文章或对话。

同时GPT-4 Turbo的训练数据更新到了2023年4月。信息的实时性也高了不少。

新的GPT-4 Turbo不仅可以处理文本，还可以处理图像。这意味着它可以接受图像作为输入，并生成与图像相关的文本或其他信息。这一切都归功于GPT-4 Turbo集成了OpenAI最新的DALL-E 3图片生成模型。

8. New Bing 改名为Copilot

copilot 2023.11.15 微软正式把Bing Chat改名为Copilot，与ChatGPT直接竞争，这次改名主要是为了让Copilot集成到微软全家桶中，让各大软件都能利用AI提高你的工作效率，Copilot依旧是集成ChatGPT 4和DALL-E3图像生成，（添加高亮）

区别在于使用GPT-4你需要付费，但是在微软的Copilot上这些统统是免费的，只需要登录微软账号就可以了。

Copilot也是我比较推荐使用的产品，只不过他的核心基于GPT-4

9. Claude 2.1

claude21 2023.11.21 Anthrapic发布Claude 2.1，这么频繁的发布新的版本，不得不说Anthrapic的野心极大，Claude 2.1可以支持20万的Token，相比于刚刚发布的GPT-4 Turbo的Token数提高了近一倍，它可以处理15万个单词或者超过500页的材料。你甚至可以上传整个代码库等技术文档长篇文学作品让Claude进行分析，总结，执行文档，预测趋势比较和对比多个文档等等。而20万的Token在当时也是行业最高。

10. Bard改名为 Gemini

gemini 时间来到，2024.02.08 google正式把bard改名为Gemini，这是第一个真正意义上可以对标甚至超越ChatGPT的产品，Gemini 1.0对标的是ChatGPT 3.5 同样是免费开放给用户使用。同时，Google 发布了Gemini Ultra 1.0 则对标的是GPT-4，

谷歌公布的测试报告显示，Gemini Ultra 1.0在文本模型的多个科目上基本全面超越GPT-4，同时也在多模态-图片，视频，音频的测试中也全面超越GPT-4，到目前为止，第一款可以对标GPT-4的AI模型出现了。

11. Sora

sora 2024.02.15，OpenAI史无前例的发布了首个文本生成视频模型Sora，其视频生成能力、效果呈现的成熟度震撼了全世界。Sora通过接收简单的文本指令，就能生成长达60秒的视频，其中包含多角度镜头切换、复杂的视频场景、生动的角色表情等等。Sora的横空出世，直接颠覆了生成式AI在视频领域的市场格局，这效果基本跟电影特效差不多了，不过目前Sora只开放内测用户使用，想要体验的小伙伴可以耐心等待一段时间。

12. Gemini 1.5 Pro

gemini15 仅仅一天之后，2024.02.16 Google发布了Gemini 1.5 Pro，直接把Token数提升到了100万，远大于GPT-4和Claude2.1，一百万的Token可以做什么呢？它可以一次性处理一个小时的视频，11个小时的音频，3万行的代码和超过70万个单词，我们看一下它对视频的处理，我们拿刚刚Sora生成的视频举例，Gemini 1.5 Pro能够准确的分析出视频里不合常理的地方，并质疑它是由AI合成的，我们再看一下2024年扣篮大赛的视频，我们拿14分钟的视频给Gemini 1.5 Pro问它谁拿了冠军，它能准确的告诉我们马克·麦克朗的最后一记扣篮获得了当晚的最高分——50 分满分获得冠军。

13. Claude 3

claude3 几天过后，2024.03.04 Anthrapic正式发布claude3，宣告Anthrapic也正式进入超过GPT-4的时代，Claude 3发布了三个型号，Haiku，Sonnet和Opus，而这三个型号的性能也是逐渐递增。

Anthrapic也给出了Claude3的性能基准测试，可以发现Claude3 Opus在和GPT-4以及Gemini 1.0 Ultra的对比中也是全面领先，而在多模态测试中，Claude3的三个模型也是全部领先于GPT-4和Gemini 1.0 Ultra平分秋色。

总结

从ChatGPT 3.5发布以来，OpenAI一直在AI大语言模型领域有着遥遥领先的优势，而通过一年的追赶，Google和Anthrapic也逐渐追上并开始超越，而到2024年，这三家公司在AI领域在飞速更新版本并出现相互超越的趋势，形成了目前的AI三巨头。

那么OpenAI怎么面对这一现状呢？万种期待的GPT5是否能让我们眼前一亮，重现领先地位？让我们拭目以待吧。

视频教程

本篇博客的视频教程首发于 Youtube：科技小飞哥，加入 电报粉丝群 获得最新视频更新和问题解答。