谷歌使出杀手锏最强大模型Gemini与GPT4巅峰对决,上演大型修罗场!
近日,谷歌正式发布了Gemini大模型。谷歌CEO桑达尔·皮查伊 (Sundar Pichai) 声称,这是谷歌迄今为止功能最强大、最通用的模型。在发布会现场,谷歌大张旗鼓地向ChatGPT宣战,直接将Gemini的多项功能与OpenAI的GPT-4进行对比。
出招:杀手锏让GPT4避之不及?
此前,谷歌在YouTube官方账号发布了一个名为与Gemini亲密互动:与多模态AI交互的视频,引发了大量网友围观。
在第一个演示中,Gemini识别了一个鸭子素描从一条线到完整画面的演变过程。当演示者将鸭子素描填满蓝色颜料时,Gemini指出鸭子通常是棕色、白色或黑色的,蓝色可不是鸭子常见的颜色。
而在视频中,无论操作员做出何种行动,Gemini都能精准释义,并根据操作者行为的改变迅速作出回应,甚至能够识别物体的材质、预测事件发生的趋势。
对此谷歌表示,市面上现有的人工智能模型通常只处理一种类型的推理,例如图片或文本,而 Gemini 从一开始就被创建为多模态的模型。
这意味着它接受包括多种媒体类型的输入,组合文本、图像、音频、视频和编程代码。在灵活度上,从数据中心到移动设备上,它都能够运行。
Gemini 1.0 针对不同尺寸推出了三个版本,分别是Ultra、Pro 和 Nano。其中Gemini Ultra是目前Google规模最大、功能最强大的模型,适用于高度复杂的任务。而Gemini Ultra在大模型研发被广泛使用的32个学术基准测试集中,在其中30个测试集的性能超过此前SOTA结果。
不仅如此Gemini Ultra在新的MMMU基准测试中也获得了59.4%的SOTA分数。这项基准测试是由跨不同领域的多模式任务组成,需要大模型进行一个深思熟虑的推理过程。
Gemini Pro是适用于可扩展各种任务的模型,能够超越GPT-3.5。将大量为谷歌人工智能服务提供动力,并成为Bard的支柱,搭载 Gemini Pro 的 Bard 是首选的免费聊天机器人,领先于其替代产品。在170多个国家和地区提供英语服务,并且计划在未来几个月内扩展不同的模态,并支持新的语言和地区。
Gemini Nano主要是在移动设备端的模型。Gemini Nano的主要设计目标是在移动设备上本地离线运行,为设备端任务提供高效的支持。Google的Pixel 8 Pro不仅是首款搭载Gemini Nano的智能手机,还能够进行录音总结、智能回复等AI功能。
对决:Gemini能否打败GPT4?
谷歌此次毫不避讳与GPT-4对决的雄心。在Gemini发布前,谷歌对它进行了一系列以标准行业指标评估的测试。
为了比较Gemini与OpenAI的GPT-4的性能,谷歌运行了32个完善的多模态基准测试,结果显示Gemini在32个基准测试中的30个中均领先于GPT-4。其中,在多选问题、数学问题、Python代码任务、阅读等方面,Gemini的性能都超过了此前最先进的水平。
Gemini Ultra还是首个在MMLU任务上表现优于人类专家的大模型,得分率高达90.0%。而人类专家的成绩为89.8%,GPT-4则为86.4%。
MMLU 数据集包含数学、物理、历史、法律、医学和伦理等 57 个科目,用于测试大模型的知识储备和解决问题能力。Gemini在包括文本和编码在内的一系列基准测试中超越了目前的技术水平。
总的来说,与GPT-4相比,谷歌提供的数据显示Gemini Ultra全方位超越GPT-4,而Gemini Pro在大多数指标上超越了GPT-3.5。同时也向我们表达了Gemini此次的改进十分显著,积极应对了GPT-4的挑战。
同时也一雪前耻了今年2月谷歌聊天机器人Bard意外翻车并导致股价大跌,引发众人质疑的不堪往事。
紧接着竞争对手OpenAI落井下石,推出的ChatGPT以及在必应搜索中整合的GPT技术,并超越了谷歌在应用程序下载量,人们开始质疑谷歌是否在人工智能领域落后于竞争对手。
而事实上谷歌才是提出2017年Transformer模型、为当今人工智能领域制定规则的领路人。
如今谷歌从失败中走出来,绽放出成功的光芒,未尝不是一种自我挑战。
危机:被爆猛料夸大宣传
意想不到的是,Gemini 的热度还没持续多久,便引火上身。视频中Gemini能够仅凭一些毫无规则的点就推断出绘制内容是一只螃蟹,显示出这一大模型强大的推理能力。
而正是因为Gemini强大能力的视频却被质疑造假,让该公司陷入夸大宣传的风波中。视频发布一天之内,外界纷纷质疑谷歌对Gemini的功能造假。并且观看演示视频的网友们也觉得,视频中存在着明显的剪辑痕迹。
面对质疑,谷歌坦然承认演示视频是经过后期处理的,同时也向媒体证实,这段关于Gemini性能演示的视频并不是实时的,而是使用了原始镜头中的静止图像帧,然后准备提示词,以便让Gemini做出回应。
谷歌DeepMind研究与深度学习主管奥里奥·维尼亚尔斯(Oriol Vinyals)再度自证,在X平台上发文称:视频中的所有用户提示和输出都是真实的,简洁起见做了缩减,并发布了一段Gemini Pro的对应演示视频。
在GPT一年的打压下,Gemini似乎有些迫不及待,可这一操作极有可能让原本看好Gemini的观众对此失去了信任。这次夸大宣传似乎是在欲盖弥彰,这也不经让人怀疑Gemini终究难敌GPT-4?
结语
Gemini与GPT4的争斗还在继续演变中,那么谁会最终赢家,让我们拭目以待!
本网站文章未经允许禁止转载,合作/权益/投稿 请联系平台管理员 Email:epebiz@outlook.com