继量子芯片之后大沢佑香作品,谷歌又来抢" OpenAI 双 12 直播"的流量了!
就在刚刚,谷歌新一代大模子Gemini 2.0一忽儿登场,再次由谷歌 CEO 皮猜亲身官宣。
新一代模子专为 AI Agent 而打造,谷歌暗示咫尺依然将 2.0 版块提供给了一些诞生者内测,正在赶紧将其集成在 Gemini 和搜索等产物线中。
好音讯是,Gemini 2.0 Flash 施行版模子今天就在网页端绽放,群众王人能玩,出动端行将推出。
除此除外,谷歌还推出了一项名为深度酌量(Deep Research)的新功能,基于高等推理和长陡立文才能,它能平直帮你干酌量助理的活儿——给个主题,我方出证据的那种。
咫尺这个新功能在 Gemini Advanced 版块中可用。
谷歌这一波脱手,再集聚 Sora 的不尽如东谈观点,新一天的直播还没启动,依然有东谈主启动唱衰 OpenAI 了:
OpenAI 的护城河是什么?
在谷歌 CEO 皮猜、Google DeepMind CEO 哈萨比斯,以及 Google DeepMind CTO 科雷(Koray Kavukcuoglu)三东谈主共同撰写的博客著作中,官方给Gemini 2.0的定位是:
五月桃色网面向智能体时期的 AI 模子。
在多模态方面的新进展,以及原生器具的使用,使咱们卤莽构建新的 AI 智能体,以更接近收尾通用助手的愿景。
具体奈何体现?在 Gemini 2.0 Flash 施行版第一时辰上线的同期,谷歌还在 Gemini Advanced 中推出了一项名为深度酌量(Deep Research)的智能体新功能。
你不错把它当成以酌量助理,围绕一个复杂主题生成酌量证据。有点像是个科研版 AI 搜索。
另外一个 Gemini 2.0 的重心要道词是:多模态。
2.0 Flash 施行版除了维持图像、视频、音频多模态输入,还维持多模态输出。
不只单是浅易的图文混排,可控的多语种文本到语音(TTS)输出也行,还能平直腹地调用器具,比如谷歌搜索、代码器具、第三方用户界说的功能。
有 ChatGPT 插件那味儿了。
不外,手脚施行模子,其文本到语音和原生图像生得胜能咫尺仅提供给早期探望合营伙伴。谷歌裸露 2.0 Flash 将在 1 月份认真推出,会提供更多不同大小的模子。
而凭证谷歌发布的基准测试服从,非论是在多模态的图片、视频才能上,如故编码、数学等才能上,仅是 Flash 施行版的 Gemini 2.0 进展就已着实全面杰出 Gemini 1.5 Pro 002。
而且它的速率是 1.5 Pro 的两倍。
谷歌暗示,来岁年头,会将 Gemini 2.0 扩张到更多旗下产物中,比如 Project Astra。
便是 I/O 大会上谷歌推出来跟 GPT-4o 的语音功能打擂台的阿谁。
这次,基于 Gemini 2.0,Project Astra 更新了以下功能:
更好的对话:当今卤莽以多种谈话和羼杂谈话进行对话,更好地交融口音和不常见的单词。
使用新器具:Project Astra 会用谷歌搜索、Lens 和舆图了。
更强的操心力:Project Astra 当今领有10 分钟的会话操心,何况不错记取更多历史对话,也就说,凭借这些"操心",它能更懂你了。
蜕变延伸:Project Astra 不错按宽泛东谈主类对话的节拍来交融对话。
谷歌还提到,正在将 Project Astra 移植到眼镜等更多出动结尾中。
另外,谷歌裸露,他们正在和 Supercell 等游戏诞生商合营,测试基于 Gemini 2.0 打造的游戏智能体们的实力。
这些智能体不错凭证屏幕上的动作对游戏进行推理,并与玩家及时对话提供行动提出。
玩《突击小队》、《部落打破》、《农场日志》,所在 belike:
除了网页端可用,Gemini 2.0 Flash 施行模子还通过 Google AI Studio 和 Vertex AI 的 Gemini API 向诞生者提供。
从 OpenAI 跳槽到谷歌的 Logan Kilpatrick 暗示,他们在 Google AI Studio 中创建了一个全新体验,展示了 Gemini 2.0 视频交融、原生器具使用、空间交融的初学诓骗。
那么,你合计这够 Agent 吗?
参考联结:
[ 1 ] https://x.com/GoogleDeepMind/status/1866869343570608557
[ 2 ] https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents
— 完 —
点这里� � 温雅我,紧记标星哦~
一键三连「共享」、「点赞」和「在看」
科技前沿进展日日重逢 ~