推广

tip
推荐以下翻墙必备工具
推荐 链接 教程
IEPL国际专线VPN 注册链接 IEPL内网级专线机场推荐、无视墙敏感时期、解锁ChatGPT、奈飞流媒体
青柠翻墙VPN 注册链接 自用机场推荐,翻墙必备、解锁ChatGPT、奈飞流媒体
👉长桥证券开户👈 文字教程 【视频教程】-长桥证券新加坡版开户入金教程:港美股永久免佣+0门槛开户
华侨银行OCBC开户 文字教程 【视频教程】-手把手教你开通新加坡华侨银行OCBC账户-保姆级教程
美国虚拟信用卡 注册链接 美国虚拟信用卡,轻松搞定ChatGPT4 Plus会员订阅

背景

自从ChatGPT发布以来,一年多的时间各个互联网大厂都发布了众多AI产品。 今天的视频带大家了解AI大语言模型的发展历程,看一下近一年来,这些科技大厂都做了哪些让人惊艳的AI产品。同时2024年了,我们来看下AI领域三巨头有哪几家,谁会成为未来AI领域的龙头呢? background

AI大语言模型

1. ChatGPT3.5

gpt35 一切要从2022.11.30日说起,OpenAI发布划时代意义的AI大语言模型,ChatGPT 3.5,而这成为AI大语言模型的里程碑,ChatGPT 3.5 可接受文本输入,并产生文本输出,可以帮你写代码,写文案,查资料,自动问答,自动摘要等多种任务。

ChatGPT 3.5 一经问世,用户就快速增长,仅用5天就有100万用户,一个月过后,就超过了1亿用户,成为增长最快的应用。

2. New Bing Chat

newbing 而在2023.02.07 微软发布New bing AI聊天机器人,New Bing比ChatGPT 3.5更加先进,可以联网获取实时信息,支持多种对话模式,而传闻OpenAI尚未发布的GPT-4已经集成到New Bing AI中,这一切都要归功于微软向OpenAI投资了100亿美金,作为OpenAI的大股东,自然可以坐享其成。

3. GPT-4

gpt4 2023.03.14 OpenAI宣布 GPT-4正式发布。GPT相比GPT3.5支持更长的上下文,ChatGPT可以处理3000个单词,而GPT-4可以处理25000个单词,同时GPT-4也支持多模态,拥有图片识别能力。

同时GPT-4也拥有更好的创造性和协作性,同时它也拥有更高的逻辑推理能力,可以解决复杂的逻辑推理题,在当时,这就是最好的AI模型。

4. Claude

claude 仅仅一天过后,2023.03.15 AI创业公司Anthropic发布新一代大语言模型Claude,你可能没听说过Anthropic,它是由OpenAI前研究副总裁和ChatGPT 3的论文一作等人在2021年共同创办的AI创业公司,由Google和亚马逊领投的一家非常有前景的创业公司。

Claude是下一代人工智能助手,Claude 可以帮助处理用例,包括摘要、搜索、创意和协作写作、问答、编码等。克劳德还可以对性格、语气和行为进行指导。Claude对语言技能和专业知识的结合令人印象深刻。

5. Google Bard

bard 2023.03.21 Google发布Bard AI机器人,宣布加入AI之战。当然bard AI早期版本并不算强大,还不支持中文访问,Google Bard会根据你的问题给你准备多份草稿,以便你选择最合适的起点让它进行作答。此时Bard对ChatGPT尚不构成威胁,但是我还是相信google的研发实力,在后续版本会有极大的提升。

6. Claude 2

claude2 2023.07.11 Anthpatic发布Claude 2,Claude性能得到极大提升,同时在编码、数学、推理方面对之前的模型进行了改进,而且Claude 2增加了Token的长度,可以支持100K个Token,所以Claude 2可以处理数百页的技术文档甚至一本书,Claude2在编码和数学测试上相比上代都有了极大提升,可以说Claude到目前为了算是到达了能用的程度。

7. GPT-4 Turbo

gpt4turbo 2023.11.07 OpenAI发布升级版GPT-4,GPT-4 Turbo。这次版本升级巨大,GPT-4 Turbo的Token提升到128K,这意味着模型能够处理更大范围的文本,更好地理解长篇文章或对话。

同时GPT-4 Turbo的训练数据更新到了2023年4月。信息的实时性也高了不少。

新的GPT-4 Turbo不仅可以处理文本,还可以处理图像。这意味着它可以接受图像作为输入,并生成与图像相关的文本或其他信息。这一切都归功于GPT-4 Turbo集成了OpenAI最新的DALL-E 3图片生成模型。

8. New Bing 改名为Copilot

copilot 2023.11.15 微软正式把Bing Chat改名为Copilot,与ChatGPT直接竞争,这次改名主要是为了让Copilot集成到微软全家桶中,让各大软件都能利用AI提高你的工作效率,Copilot依旧是集成ChatGPT 4和DALL-E3图像生成,(添加高亮)

区别在于使用GPT-4你需要付费,但是在微软的Copilot上这些统统是免费的,只需要登录微软账号就可以了。

Copilot也是我比较推荐使用的产品,只不过他的核心基于GPT-4

9. Claude 2.1

claude21 2023.11.21 Anthrapic发布Claude 2.1,这么频繁的发布新的版本,不得不说Anthrapic的野心极大,Claude 2.1可以支持20万的Token,相比于刚刚发布的GPT-4 Turbo的Token数提高了近一倍,它可以处理15万个单词或者超过500页的材料。你甚至可以上传整个代码库等技术文档长篇文学作品让Claude进行分析,总结,执行文档,预测趋势比较和对比多个文档等等。而20万的Token在当时也是行业最高。

10. Bard改名为 Gemini

gemini 时间来到,2024.02.08 google正式把bard改名为Gemini,这是第一个真正意义上可以对标甚至超越ChatGPT的产品,Gemini 1.0对标的是ChatGPT 3.5 同样是免费开放给用户使用。同时,Google 发布了Gemini Ultra 1.0 则对标的是GPT-4,

谷歌公布的测试报告显示,Gemini Ultra 1.0在文本模型的多个科目上基本全面超越GPT-4,同时也在多模态-图片,视频,音频的测试中也全面超越GPT-4,到目前为止,第一款可以对标GPT-4的AI模型出现了。

11. Sora

sora 2024.02.15,OpenAI史无前例的发布了首个文本生成视频模型Sora,其视频生成能力、效果呈现的成熟度震撼了全世界。Sora通过接收简单的文本指令,就能生成长达60秒的视频,其中包含多角度镜头切换、复杂的视频场景、生动的角色表情等等。Sora的横空出世,直接颠覆了生成式AI在视频领域的市场格局,这效果基本跟电影特效差不多了,不过目前Sora只开放内测用户使用,想要体验的小伙伴可以耐心等待一段时间。

12. Gemini 1.5 Pro

gemini15 仅仅一天之后,2024.02.16 Google发布了Gemini 1.5 Pro,直接把Token数提升到了100万,远大于GPT-4和Claude2.1,一百万的Token可以做什么呢?它可以一次性处理一个小时的视频,11个小时的音频,3万行的代码和超过70万个单词, 我们看一下它对视频的处理,我们拿刚刚Sora生成的视频举例,Gemini 1.5 Pro能够准确的分析出视频里不合常理的地方,并质疑它是由AI合成的,我们再看一下2024年扣篮大赛的视频,我们拿14分钟的视频给Gemini 1.5 Pro问它谁拿了冠军,它能准确的告诉我们马克·麦克朗的最后一记扣篮获得了当晚的最高分——50 分满分获得冠军。

13. Claude 3

claude3 几天过后,2024.03.04 Anthrapic正式发布claude3,宣告Anthrapic也正式进入超过GPT-4的时代,Claude 3发布了三个型号,Haiku,Sonnet和Opus,而这三个型号的性能也是逐渐递增。

Anthrapic也给出了Claude3的性能基准测试, 可以发现Claude3 Opus在和GPT-4以及Gemini 1.0 Ultra的对比中也是全面领先,而在多模态测试中,Claude3的三个模型也是全部领先于GPT-4和Gemini 1.0 Ultra平分秋色。

总结

从ChatGPT 3.5发布以来,OpenAI一直在AI大语言模型领域有着遥遥领先的优势,而通过一年的追赶,Google和Anthrapic也逐渐追上并开始超越,而到2024年,这三家公司在AI领域在飞速更新版本并出现相互超越的趋势,形成了目前的AI三巨头。

那么OpenAI怎么面对这一现状呢?万种期待的GPT5是否能让我们眼前一亮,重现领先地位?让我们拭目以待吧。

视频教程

本篇博客的视频教程首发于 Youtube:科技小飞哥,加入 电报粉丝群 获得最新视频更新和问题解答。