【845.net.cn】在2022年至2024年的科技浪潮中,ChatGPT犹如AI领域的璀璨明星。这一时期,人工智能(AI)技术如同火箭般疾驰,以前所未有的力量重塑着世界的每一个角落。从智能移动设备到个人计算平台,再到智能驾驶系统,AI的渗透力和影响力无处不在。
在这场技术革新的竞赛中,Open AI、谷歌、微软等科技巨头竞相角逐,纷纷亮剑。它们不仅在算法和模型上持续迭代优化,更在应用场景上不断探索。
与此同时,手机市场也在AI技术的驱动下焕发出新的活力。随着Android 15、iOS 18的即将到来,以及小米、华为等国内厂商在AI领域的积极探索,智能手机将实现更加智能化、个性化的功能。同时,PC市场也在AI的助力下焕发新生,联想、苹果、华为、荣耀等厂商纷纷推出AI PC产品。
作为当红炸子鸡的智能汽车也正在成为AI技术的新载体。汽车行业正由“软件定义”迈向“AI驱动”,通过集成先进的AI技术,实现更加智能、安全的驾驶体验。而在这一切变革中,英伟达凭借其卓越的GPU和无与伦比的AI计算能力,成为了无可争议的“最大赢家”。
在“AI”重塑这个世界的当下,CNMO推出了“AI重塑ing”系列专题,本文围绕的点是“新一轮AI竞赛中科技巨头的走向”。
5月份,三大科技巨头OpenAI、谷歌和微软不约而同发布了AI新产品,但各自的侧重点有所不同。OpenAI重点介绍了GPT-4o,它有点像科幻电影《她》中的人工智能女性,除了处理日常的工作和需求,还能满足人的情感需要。谷歌发布了十多项产品更新和新品,更像是“AI全家桶”。微软也是一口气发布了50多项更新,包括从AI基础设施的搭建到模型产品的落地。
Open AI——转向AI手机助手
OpenAI抢先谷歌一天发布了GPT-4o,它比以前任何大模型都更像人,似乎预示着人工智能与人类情感交互的新时代即将到来,这点可能是其它科技巨头的大模型不具备的。GPT-4o的发布,还表明OpenAI有向消费电子领域,尤其是向手机助手市场靠拢的想法。
GPT-4o的核心在于实现人机交互的无缝对接和对人类情感的深入理解。通过跨文本、视觉、音频的端到端训练,GPT-4o消除了传统模型转换的延迟,对话如同真人交流般流畅自然。
GPT-4o最引人注目的特点是对“情绪价值”的捕捉与反馈。它能从用户的语音细微变化中解读情绪状态,进而提供适时的建议或反馈,如引导用户深呼吸以缓解紧张情绪,甚至能通过用户的面部表情判断心情并做出相应回应,这是AI向具备情感智能方向发展的重要标志。
OpenAI的下一步棋是让GPT-4o的能力触及终端,从B端市场向C端消费市场扩展,苹果可能就是最重要的桥梁。据彭博社报道,苹果即将与OpenAI达成一项协议,将ChatGPT的能力整合进iPhone。根据这份协议,苹果将在未来发布的iOS 18中使用ChatGPT功能。目前双方谈判仍在进行中,协议尚未最终达成。站在苹果的角度,当整个手机行业都在向更高级别的智能交互模式转变时,它也不得不做出改变,所以与OpenAI的合作想必会顺利很多。
谷歌——分销才是王道
这几年谷歌在AI领域被OpenAI抢了风头,但其实谷歌算是OpenAI的一个加强版,因为它不仅在AI领域有着深厚的技术积累,更有着无可比拟的分销优势。Gemini可能成不了最好的AI模型,但有可能是用户最常用的。其最新发布的Gemini 1.5 Pro提供了一个拥有百万token的超长上下文窗口模型,支持35种语言,覆盖全球150多个国家和地区,为用户提供前所未有的长文本理解和处理能力。
谷歌的打法是要守住AI搜索,同时也要向未知的领域拓展。
在最新Gemini的加持下,谷歌搜索引擎将迎来多维度逻辑推理的强化,能够一并应对包含多重约束的复杂查询,为用户提供一站式的问题分解与创意激发服务,并且首次融入视频搜索功能,使用户能够通过上传视频来寻找问题的答案。作为全球最大的手机操作系统厂商,谷歌能够轻而易举将这项技术推广至全球超十亿用户。
谷歌的Project Astra项目是对抗OpenAI GPT-4o的重拳。Astra利用Gemini模型的多模态能力,实现了通过摄像头和语音命令进行实时环境分析和互动,展示了AI从虚拟助手向更全面生活伴侣的进化。在情感表达和响应速度上,它与GPT-4o尚有差距,但能用就行。谷歌计划逐步将Astra功能融入Gemini应用和产品矩阵中。
在AI生成内容的浪潮中,谷歌的Veo是对OpenAI Sora的直接回应。Veo能够基于文本、图像和视频提示生成高清视频内容,用户可根据个人偏好定制视频风格,只是具体发布时间未定,仍然是个期货。
谷歌在新一轮AI竞赛中比较重视全场景布局。从Gemini的广泛分销策略,到Project Astra的实用化探索,再到Veo的创意生成和底层技术的不断迭代,谷歌正构建一个由AI驱动的未来生态,其中既有对现有优势的深化加固,也有面向未来的探索。谷歌的战略不仅关乎技术的领先,更在于如何让这些技术“变现”。
微软——找准自身定位
与上述两个AI巨头相比,微软的AI战略始终是围绕企业生产力进行的。微软近期的一系列动作,尤其是“Copilot+PC”系列的发布与Team Copilot的亮相,都表明其在B端市场的深耕决心。
5月20日,微软推出的“Copilot+PC”系列,特别是新款Surface Pro,将AI技术深度融入个人电脑,号称“史上最强、最智能的Windows PC”。
紧接着,微软在2024年Build开发者大会上,推出了Team Copilot,这是微软AI战略向B端市场延伸的又一步棋。从个人助手到团队助理的转变,Team Copilot通过集成在Teams、Loop、Planner等工具中,不仅能主持会议、管理项目进度,更深层的意义在于优化团队协作流程,减少沟通成本,提升工作效率,直击企业痛点。
微软自定义ChatGPT构建工具Copilot Studio新增的Agent功能,为企业提供了高度定制化的AI解决方案。企业可以根据自身业务需求,打造出能够独立处理复杂流程的智能助手,如自动管理电商平台订单。
微软在模型研究上的投入同样不容忽视,Phi-3模型系列的推出,特别是涵盖文本、图片乃至多模态输入的多样化模型,不仅丰富了开发者的选择,也降低了AI应用的门槛,使得更多企业能够便捷地利用AI技术优化产品和服务。
面向个人用户做AI产品并非微软的优势,以提升生产力为核心的“打工人”与B端市场战略现在是微软的重中之重。无论是智能PC的革新、Team Copilot的推出,还是在模型构建工具、多模态模型以及数据分析平台上的创新,都是微软在探索AI与工作深度融合路径上的重要一步。
写在最后
无论是个人还是这些科技巨头,谁也无法预测AI最终会给人类带来怎样深刻的改变,AI的浪潮太大了,大到让人看不清方向,Meta算是前车之鉴。对于所有投身于AI竞赛的企业来说,找准自身定位,明确战略方向,将AI技术与自身优势结合,以解决实际问题为核心,或许才能在瞬息万变的洪流中稳舵前行。
本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
本网站所提供的信息,只供参考之用。本网站不保证信息的准确性、有效性、及时性和完整性。本网站及其雇员一概毋须以任何方式就任何信息传递或传送的失误、不准确或错误,对用户或任何其他人士负任何直接或间接责任。在法律允许的范围内,本网站在此声明,不承担用户或任何人士就使用或未能使用本网站所提供的信息或任何链接所引致的任何直接、间接、附带、从属、特殊、惩罚性或惩戒性的损害赔偿。