一句话总结
本次资讯覆盖2026年7月1日至3日全球AI领域动态,包含大模型技术迭代、智能体应用落地、具身智能与硬件基建升级、投融资进展、行业监管及社会价值探索等维度,海外科技厂商持续推进前沿技术与商业化落地,国内企业在国产大模型、算力自主化、场景应用等方向密集布局,AI安全治理与社会价值探索同步推进。
一、模型与技术突破
1.1 通用大模型(大语言模型与多模态模型)
Meta:筹建「Meta Compute」云基础设施业务,对外出售AI算力与模型访问权限,直接入局云算力市场与AWS、微软、谷歌云竞争;消息公布后其股价一度涨超10%、市值增长近千亿美元,算力租赁商CoreWeave、Nebius分别暴跌14%和17%;该模式效仿xAI闲置算力出租路径,被视为AI竞赛下半场信号,数据中心资源将成为核心竞争要素。
美团:发布自研MoE架构LongCat-2.0大模型,总参数1.6万亿、每token激活约48B,原生支持1M上下文,是首个从训练到推理全链路跑在国产算力上的万亿模型;依托LSA稀疏注意力、N-gram Embedding等原创设计,由5万张国产卡集群支撑,训推成本显著低于同规模英伟达路线;其匿名版本Owl Alpha此前在OpenRouter走红,多场景月调用量登顶,已通过全球开发者真实流量验证;美团同步调整大模型生态,全面限用外部大模型,力推自研LongCat体系。
上海AI Lab:推出35B参数MoE模型Agents-A1,通过扩展Agent Horizon而非堆参数,在多步搜索、科学研究、长指令遵循等长程任务上逼近万亿级模型表现;采用全领域SFT、领域级教师训练、多教师on-policy蒸馏三阶段训练方案,以知识-动作图为核心构建长程基础设施;实测可在12小时内将鲸鱼叫声检测AUC从0.58提升至0.9935,在机器学习工程类任务上仍与前沿大模型存在差距。
Anthropic:
- 推出Claude Sonnet 5,面向全套餐用户开放,可自主运行长时间任务、调用浏览器和终端等工具;性能接近Opus 4.8但定价更低,首发输入每百万token 2美元、输出10美元,Agent安全性优于Sonnet 4.6,网络安全任务能力远低于Opus系列;因采用新分词器导致Token消耗增加,实际使用成本高于前代及宣传水平。
- 旗下Fable 5与Mythos 5解除美国出口管制,恢复全球访问;Fable 5重新上线后新增网络安全分类器,可阻挡99%越狱攻击,但短期内误报率上升,异常请求将转至Opus 4.8处理;7月7日前订阅用户可将50%周使用额度用于Fable 5,后续转为按量计费模式。
- 发布Claude Science科研工作台,底层运行Claude Opus 4.8,整合60余种基因组学、蛋白质组学、化学信息学专业技能与连接器,支持任务拆分、子助手协作与事实核查;可原生渲染三维蛋白质结构、基因组轨迹等图表并附带源代码,科研能力对标研二学生水平,可将两年综述写作周期压缩至数周。
- 旗下Claude系列模型上线Microsoft Foundry并托管于Azure,运行于NVIDIA Blackwell Ultra系统,支持数据驻留区域选择。
谷歌: - 推出Nano Banana 2 Lite图像模型与Gemini Omni Flash视频模型;Nano Banana 2 Lite可4秒生成1K分辨率图像,单张成本0.034美元,主打高频批量内容生产;Gemini Omni Flash支持对话式视频编辑;两款模型可串联形成图生视频流水线,已内置到Gemini App、Google Flow与YouTube等入口免费开放;存在中文渲染出错、高峰排队、艺术风格迁移不稳定等短板。
- Gemini Spark代理助手登陆Mac端,支持自然语言下达复杂指令,可后台管理邮件、安排日程,响应速度与准确率表现优异。
- 推出编码智能体评估飞轮,通过准备测试数据、运行推理、自适应AutoRater评分、失败聚类分析、针对性优化五阶段实现自动化评估,可对生产流量持续运行。
NVIDIA:开源Nemotron-Labs-TwoTower扩散语言模型,基于Nemotron-3-Nano-30B-A3B主干构建,采用双塔架构——冻结的自回归上下文塔处理提示与已生成内容,可训练的扩散去噪塔以块为单位并行生成文本;总参数约60B,在约2.1T令牌上训练,主干预训练数据量达25T;在保留98.7%生成质量的前提下,实现2.42倍生成吞吐量提升,支持商业使用;基于Blackwell平台优化DeepSeek V4推理,单Token成本最多降至原来的1/5,吞吐量最高提升20倍。
月之暗面:Kimi K3预计7月发布,参数规模达2.5万亿,将实现1M超长上下文窗口与多模态能力深度集成;当前Kimi年度经常性收入突破3亿美元,API业务占比超70%,海外市场付费用户与API收入激增400%。
字节跳动: - 发布TRAE Work并开放预览,覆盖Work、Code、Design三种模式;Work Mode面向非开发人员梳理需求、输出方案,Code Mode支持代码开发调试,Design Mode可通过自然语言生成设计初稿并调整视觉元素;支持跨模式协同,可导入Figma设计系统生成符合团队规范的设计产出。
- 联合新加坡国立大学发布Seedream 5.0 Pro模型,实现交互式精准编辑与分层设计图输出,解决多能力冲突问题。
云上曲率:ViiTorVoice AI语音大模型登顶Seed-TTS国际评测榜单,是首个具备片段级局部编辑能力的AI语音系统;支持语音克隆、情绪与副语言控制,端到端首帧延迟约60ms,发音准确性与语义还原度达行业领先水平。
OpenAI: - 推出GeneBench-Pro生物学基准测试,覆盖基因组学等10个核心领域、129道任务,考察模型在噪声数据下的自主决策能力;GPT-5.6 Sol在该基准上表现大幅领先。
- 完成Codex全订阅用户速率限制重置,Go、Plus、Pro版本API调用速率恢复初始状态;Codex被曝日志默认TRACE级别,年写入量可达640TB,大幅缩短消费级固态硬盘寿命。
- 工程师团队将模型推理成本降低50%,新旗舰模型Sol在Terminal-Bench 2.1测试中表现优于Claude Mythos 5。
谷歌研究:发布零样本表格基础模型TabFM,支持混合数值与类别特征的结构化数据分类与回归,无需微调或超参数搜索,仅通过训练行为上下文单次前向预测;在数百亿合成表格数据集上训练,TabArena基准51个数据集上零样本性能超越调优后的梯度提升树等强基线,提供PyTorch与JAX两种权重版本。
港科大(广州)、美团、新国大:联合开发GenEvolve自演进图像生成Agent项目,将开放式图像生成形式化为工具编排的视觉轨迹,Agent通过收集文本证据、检索视觉参考、调用生成技能输出提示词-参考图程序;发布基于Qwen3-VL-8B的Agent策略、推理运行时与配套工具,实现生成后端的可迁移性。
北航等机构:联合研发LoopCoder v2 7B参数代码模型,通过重复共享Transformer模块扩展测试时计算规模,不增加参数量即可提升性能;实测“仅循环两次”时效果最优,SWE-bench Verified得分提升至64.4。
1.2 垂直大模型
气象领域:“睿宸”AI气象大模型,具备多通道数据处理能力,兼容雷达、卫星等多源数据,率先应用相控阵雷达高频分析技术,可为低空经济场景提供超精细化短临预报。
文旅领域:全球首个多模态文旅大模型“博观”,基于1.2PB数据训练,在西安投入使用,累计服务超400万人次,带动数字IP“唐骉骉”文创产品热销超200万件。
工业领域:全球首个工业跨具身泛化大模型“智合”,支持人形与轮式机器人协同作业,已落地工业应用场景。
矿山领域:博雷顿发布矿山智驾大模型,整合智驾模型、无人矿卡与光储微网体系,配套推出“算电双驱”战略。
充电领域:高德发布充电行业AI智能体“神算Agent”,整合出行数据与算法模型,为充电运营商提供流量洞察、智能选址与定价决策支持。
1.3 专项技术突破
- ATHENA高价值数据筛选技术:可在百亿参数模型中高速筛选高价值数据,筛选速度提升313倍,能够量化机器人数据价值并优化训练效率。
- JetSpec推测解码框架:阶跃星辰联合多校开源,通过因果并行草稿头实现单次前向传播生成完整因果候选树,打破传统推测解码扩展限制;在H100 GPU上对Qwen3-8B模型实现MATH-500基准9.64倍解码加速,开放式对话MT-Bench达4.58倍加速。
- BlockPilot解码加速技术:可自动预测推理过程的最佳分块,采用自适应生成策略,推理速度提升四倍以上,架构轻量且支持无缝嵌入现有系统。
- EvoPI医学推理对齐框架:可让多模态模型实现完全自主学习,配套动态进化监管框架使测试指标最高提升24.6%,为智能医疗诊断提供落地参考。
- INFUSER自进化框架:使大模型能以极少监督完成自我改进,实测数学和编程性能提升超20%,为推理进化方向奠定基础。
- 解耦冲突分析框架:将复杂冲突上下文拆解为推理图谱,借助强化学习优化内在逻辑,7B模型的判定成功率超越GPT-5.1。
- LoopWM循环世界模型架构:由脸谱心智团队提出,通过共享参数的Transformer模块迭代细化潜在状态,参数效率最高提升100倍,单步推理FLOPs减少约25倍,在ScienceWorld基准上表现比肩参数量大两个数量级的模型。
- GrowLoop评测方法:高德团队提出,以少量人类标注为种子,通过大模型元认知反思自动生成并迭代评分细则,与测试题目双循环协同进化;在132条对话评测题目上匹配率达0.78,可迁移至科研评审、艺术评价等标准模糊的领域。
- 华为AutoGenetic Memory引擎:开源发布,实现智能体记忆自主生长与高效管理;通过分层记忆体系、GraphMemory与Swarm群体记忆等技术,在LoCoMo测评中显著提升准确性、降低Token消耗,将AI记忆从被动存储转变为可治理的核心数据资产。
- EMCES强化学习样本合成方法:浙江理工大学与南京大学团队提出,引入情景记忆机制与高效状态表示方法,提升合成样本质量;离线与在线设置下均优于现有技术,同时降低存储与时间成本,相关论文被ICML2026录用。
- LLM-Wiki知识管理方案:前OpenAI科学家Andrej Karpathy提出,将大语言模型作为编译器处理个人笔记,替代传统RAG技术,实现知识库结构化与自动化维护,提升知识管理效率。
- 快手AgentX自迭代框架:通过智能代理实现推荐系统自我迭代优化,3个AgentX工作单元完成374个实验,带动用户使用时长上升0.561%,推动研发范式向自动化、批量化自进化演进。
- 扩散模型一致性研究:中科大等机构综述500余篇文献,系统分析扩散模型在生成图像与视频时的外部条件、内部状态、规范标准三类一致性问题,提出优化策略,指出未来生成模型需具备冲突感知、持久可编辑状态与可解释评价能力。
- PKINet-v2遥感目标检测骨干:南京理工大学与浙江大学联合提出,引入Poly-Kernel Scope模块融合条带卷积与多尺度方形卷积,形成层次化渐密感受野,兼顾不同尺度与形状目标的检测精度与速度。
- SafeGen功能安全评估框架:亚利桑那州立大学与德州仪器联合提出,将大语言模型与形式验证结合,用于功能安全导向的故障关键性评估,可生成更高质量的断言,提供优于传统仿真的语义可解释性。
1.4 AI框架与工具
- AReaL 2.0强化学习框架:蚂蚁集团开源,允许现有代理接入在线强化学习闭环,在执行任务同时持续优化改进;采用低侵入式接入方案,已应用于软件工程代码生成与修复等场景,降低企业采用在线RL技术的门槛。
- CubeSandbox安全沙箱:腾讯开源,专为AI Agent与不可信代码执行场景设计,基于RustVMM与KVM构建硬件级虚拟化;可60ms冷启动独立Guest内核沙箱,内存开销不足5MB,单节点支撑数千并发实例;原生兼容E2B SDK,提供快照、克隆、回滚、凭证保管、出口网络控制等能力,配套企业级Web管理面板,平衡安全隔离与性能开销。
- 9Router AI路由网关:本地运行的开源路由网关,GitHub星标近2万,支持40+提供商、100+模型;内置RTK Token Saver可压缩git diff、grep等工具输出,单次请求节省20%~40%输入Token;具备三级智能路由(订阅源→低价源→免费源)、多账号轮询、可视化Dashboard等功能,支持Claude Code、Cursor、Codex等工具接入,额度耗尽后自动降级保障服务不中断。
- OmniRoute开源AI网关:解决大模型调用成本高的痛点,内置压缩算法降低Token消耗,支持多模型源安全连接。
- agents-cli工具集:谷歌推出,可将任意编码助手转变为在Google Cloud上构建、评估、部署AI Agent的专家;覆盖项目脚手架、开发、评测到生产部署全生命周期,内置Agent开发能力、自动化评测、CI/CD集成与Gemini Enterprise注册等功能。
- AiToEarn内容营销平台:开源AI内容营销智能体平台,覆盖内容创建、分发、互动、变现全流程;支持一键发布至多平台,内置AI互动引擎可自动点赞、智能回复,集成多类视频与图片生成模型。
- ds4-rs-metal推理引擎:开源高性能推理引擎,专为Apple Silicon芯片运行DeepSeek-V4-Flash模型设计;采用Rust编写,依托Metal框架实现GPU加速,预填充阶段比C语言参考实现快18%-19%,解码速度持平;提供兼容OpenAI/Anthropic API的HTTP服务,支持加载GGUF量化模型。
- Astryx设计系统:Meta开源,基于React和StyleX构建,提供150+可访问组件、品牌级主题、暗黑模式与CLI工具集;支持swizzle深度定制,样式不锁定技术栈,可通过Tailwind、CSS Modules等方式覆盖样式。
- WYRD-ECS-Core认知引擎:实体-组件-系统架构的现实世界认知基础设施,可将多源实时数据规范化为有时空属性的实体与组件,为AI提供原生状态空间输入,构建持续更新的数字孪生环境。
二、智能体与AI应用
- 阿里巴巴:合并三款企业级Agent产品,以桌面工具QoderWork为基础,深度整合钉钉孵化的「悟空」与阿里云的「MuleRun」,打造全新企业生产力AI产品;由92年出生的陈宇森全面负责,核心目标是集中内部资源应对桌面Agent竞争;QoderWork因日活、Token用量居阿里AI工具首位被选为基础,定位「OS级」桌面智能体,未来有望形成桌面、云端、组织三层融合架构。
- 昆仑万维:天工3.2版本上线Skywork Tags功能,支持Agent在Slack、飞书、钉钉、Discord、Telegram等工具中通过@方式互动,直接融入团队现有工作环境;主打团队共享同一Agent,具备进度透明、可异步接力、上下文积累后能力提升三大特点;官方实验显示百人群组共享的Agent运行两三周后,效果反超精调的个人版。
- 腾讯:QClaw多Agent协作平台支持配置多分工智能体,全自动完成从数据分析到报告输出全流程;实测5个上万行Excel文件场景下,经25次工具调用、26次深度思考,可输出深度数据分析报告、PPT汇报、异常数据清单与管理层摘要。
- 飞书:推出多维表格智能体,将AI从个人助手升级为团队共享的AI同事;内置在群聊与表格中,支持自然语言查询多源数据,可主动监控业务变化并播报风险;继承飞书多维表格权限体系,不同角色查看结果不同。
- 微信:联合多家手机厂商推出A2A助手能力,已有厂商语音助手接入,支持一句话给微信好友发消息;公众号向医院开放AI分身能力,无需代码、后台5步即可开通,7×24小时在线回复挂号、科室、门诊时间等院务咨询,不涉及疾病诊断;试点医院日均回复超百次,可有效引导实际挂号。
- 蚂蚁集团(支付宝):AI生活助理“阿宝”开放全量公测,无需邀请码即可体验,支持通过文字或语音指令调用叫车、点外卖、办事查询等72项高频技能,覆盖政务、缴费、文旅等十余类板块;涉及资金变动与支付的最后一步由用户本人确认,新增亲密度陪伴体系,标志支付宝从工具型App向智能服务平台转型。
- xAI:推出Voice Agent Builder语音智能体构建器测试版,零代码平台约2分钟即可配置生产级Grok Voice语音智能体;采用一体化speech-to-speech工作流,内置电话接入、知识检索、工具调用、安全护栏等能力,无需开发者自行拼接多模块服务;定价0.05美元/分钟,适用于客户服务、个人助理等场景。
- Notion:上线HTML Block功能,AI可将页面内文档、数据库等内容转化为交互式HTML,直接内嵌在Notion页面中支持协作修改,可生成互动解释器、产品原型、数据图表等多种形态。
- 百度:DuMate上线高考志愿Skill,通过多源搜索交叉验证保障数据准确性,涉及外部事实时默认执行实时搜索;将志愿填报拆解为任务识别、画像采集、数据调取、分析输出、记忆复用五步流程。
- 微软:Teams计划8月上线AI会议助手Facilitator,可实时解析会议对话,自动识别未解答问题与模糊表述并推送补充信息;功能默认关闭,需手动开启,企业管理员可统一管控权限,仅支持标准Teams会议。
- 苹果:Safari技术预览版247新增MCP服务器功能,AI智能体可对接浏览器开发工具,实现网页内容查看、日志分析、网络请求记录等调试能力,覆盖网页排错、兼容性检查、无障碍审查等场景,降低人工调试成本。
- Anthropic:推出Claude Tag团队智能体,具备独立身份与权限体系,常驻Slack频道执行任务,可学习适配特定工作环境,已向企业版与团队版客户开放测试。
- 清华大学:发布AgentSociety²社会科学实验平台,首次实现AI在社会科学实验中的双角色设计——AI社会科学家辅助研究者完成调研、实验设计等工作,硅基被试在模拟社会中行动响应干预,使社会科学假设可转化为可运行、可干预的实验结构,提升研究效率与复现性。
三、物理AI/机器人
- FaceMind:提出Ego-NeuroLoop具身智能数据采集范式,通过同步采集视觉、视线、脑电和肌电信号模拟人类大脑预测与修正的闭环机制;配套硬件NeuroMatrix与软件NeuroBooster,降低数据采集门槛并提升处理效率,填补现有具身智能训练数据在行为生成机制上的空白。
- 英伟达:开源ASPIRE机器人技能库,类似机器人版编码Agent,将任务失败与修复经验沉淀为可复用的Skill;采用执行引擎、技能库、进化搜索三阶段流程,调用大模型分析故障原因并迭代控制程序,验证通过后写入技能库;双臂物体交接任务中成功率从20%提升至92%,标志机器人训练范式从梯度下降转向技能打磨。
- 特斯拉:Optimus人形机器人弗里蒙特工厂生产线正式投入运转,马斯克确认今夏投产,初期产量爬坡缓慢,预计7月下旬或8月正式投产,2027年实现大规模量产。
- 优必选:超仿生人形机器人优世界U1系列获超1万台订单,内置养成系情感大模型。
- 自变量机器人:连续完成B+至C轮多轮融资,估值突破200亿元人民币,投资方包含中国移动、红杉中国等30余家机构。
- 智元精灵G2、银河通用Galbot S1等人形机器人已投入工厂应用,聚焦搬运、质检等工作场景。
- 若愚科技:发布全球首款防爆机器人“若愚揽月01”,通过国内首个整机与机械臂双防爆认证。
- 京东与影智XBOT签署战略合作协议,影智XBOT已在15个国家部署超1000台设备。
- 优艾智合:发布具身智能新品与生态计划,目标三年内赋能一万个工业现场。
- 乐动机器人:布局空间感知技术,自研LD-SenseWorld灵境物理空间交互大模型,构建硬件感知层、模型层、数据层三层“数据精炼厂”架构,形成真实设备采集-模型训练-体验提升-更多设备部署的数据飞轮。
- 英伟达:投入1.86万人年将自动驾驶领域成熟的安全架构移植至机器人系统;在华启动大规模机器人人才招募,计划构建覆盖工业机械臂、四足及人形机器人的“安卓生态”。
- 通用汽车:在底特律Factory Zero工厂部署50台协作机器人,同步裁员超1000人,工会已提出申诉。
- 日本:政府计划2040年前全面部署千万台机器人应对人口老龄化,研发主权大模型提升社会整体生产率。
- 英伟达Jetson边缘AI平台将随“蓝幽灵2号”任务于2026年末进入月球轨道,实现首次在轨AI分析。
四、硬件与基础设施
4.1 芯片与算力硬件
英伟达:
- 2026年第一季度首次登顶全球数据中心以太网交换机市场收入榜首,标志其业务从GPU计算扩展至网络交换领域。
- 基于Blackwell平台优化DeepSeek V4推理性能,单Token成本最多降至原来的1/5,吞吐量最高提升20倍。
- Rubin Ultra AI加速器放弃4-Die方案,改为2-Die方案,性能缩减一半。
- 联合Valar Atomics演示首个由微型核反应堆供电的AI数据中心,采用氦气冷却技术,将年用水量从约260万加仑降至接近零。
Etched:AI推理芯片初创公司,累计筹资8亿美元,最新一轮融资后估值达50亿美元,年销售额达10亿美元;自研芯片采用台积电N4P工艺,已完成首次流片,具备低电压推理与集群级内存共享技术,今夏将交付首批机架级产品,当前订单需求达10亿美元。
中昊芯英:发布TPU芯片“须臾”,混合精度算力达896TFLOPS,功耗仅600W。
三星:HBM4E可靠性测试良率突破70%,接近80%的成熟标准,已向主要客户送样12层堆叠技术样品;韩国政府计划打造光州全罗南存储器制造枢纽,三星与SK海力士将进驻。
英特尔:终止AMX-TF32指令集开发,并从新版技术手册与GCC编译器中移除相关内容。
Tenstorrent:发布新型RISC-V CPU内核TT-Ascalon S,单位面积性能达旗舰核心Ascalon X的140%。
高通:推出Snapdragon START计划专攻智能眼镜领域;与字节跳动洽谈自研CPU相关合作。
字节跳动:自研下一代CPU,计划2027年初完成设计,同年下半年实现量产并大规模部署;早期版本自2025年底已内部使用,因需求强劲可能提前流片,旨在降低对英特尔、AMD的依赖。
寒武纪:总市值盘中突破1万亿元,成为科创板首只万亿市值股票,随后公司发布风险警示公告,股价回落。
中兴通讯:联合南方电网建成国内能源行业首个全栈自主可控千卡智算中心,算力利用率提升超40%。
Micro LED CPO光互连技术:作为AI数据中心芯片间互连低功耗方案兴起,采用并行光学架构,无需DSP、ADC/DAC等功耗部件,能效降至1-2 pJ/bit,整体功耗仅为铜缆方案的5%。
Neuralink:实现硬脑膜穿透电极植入技术,电极线可直接穿过硬脑膜插入大脑皮层同时保持硬脑膜完整,大幅提升脑机接口植入安全性与手术便利性。
4.2 数据中心与云基础设施
Meta:筹建「Meta Compute」云基础设施业务,对外出售AI算力与模型访问权限;2026年AI资本支出上调至1250亿至1450亿美元。
硅基流动:向港交所递交上市申请,按第18C章特专科技公司规则冲刺港股;2025年营收5533万元、同比增长约653%,净亏损扩大至3.45亿元;截至2026年4月注册用户超1000万,单日词元吞吐量峰值破万亿,阿里巴巴持股7.42%为最大外部机构股东。
IREN Ltd:转型AI云服务的数据中心运营商,与微软签署五年97亿美元合同,与英伟达达成34亿美元云服务协议,年经常性收入达31亿美元。
鹏城云脑Ⅲ:获得IO500全球总榜、研究榜双料第一,得分603334分,单框吞吐量达500GB/s,整体聚合带宽突破100TB/s。
黑石集团:计划未来3至5年投入300亿美元在日本建设AI数据中心,新增超1GW算力容量。
Cloudflare:宣布2026年9月15日起限制AI爬虫访问免费网站内容,区分AI爬虫与传统搜索爬虫;同时推出“按使用付费”机制,当创作者内容出现在AI搜索结果中时可获得补偿。
五、企业动态
- 美团:发布LongCat-2.0万亿参数大模型,同步调整大模型生态,全面限制外部大模型使用,全力推进自研LongCat体系落地。
- 阿里巴巴:整合三款企业级Agent产品,由陈宇森统一操盘;千问停止创建新智能体,已有拟人化互动类智能体将于7月中旬前下线,或为落实《人工智能拟人化互动服务管理暂行办法》监管要求。
- 可灵AI:即将完成30亿美元融资,腾讯参投,估值达180亿美元,计划12个月内启动赴港IPO;2026年第一季度营收突破6.5亿元,ARR接近5亿美元;其生成的两部广告作品斩获戛纳创意节1银2铜,标志AI影像创作获得顶级评奖体系认可。
- 乐奇Rokid:推出AIOS原生智能眼镜操作系统YodaOS与配套交互标准AIUI,实现从硬件厂商向AI时代操作系统厂商的转型。
- arXiv:7月1日正式脱离康奈尔大学,以独立非营利组织arXiv, Inc.身份运营,旨在提升财务灵活性以适应AI时代挑战,平台功能与服务保持不变,承诺继续免费开放。
- 抖音电商:上线“肖像保护功能”,通过模型识别与授权核验主动拦截AI仿冒、盗用素材行为;已处置仿冒账号逾1.2万个、侵权商品超4.8万件,累计保护180余位头部达人。
- 米哈游:全资设立上海米哈游舒俱科技有限公司,注册资本1000万元,经营范围涵盖人工智能应用系统研发、动漫游戏设计开发等。
- 软银集团:通过愿景基金二号向OpenAI追加100亿美元投资,计划2026年10月1日完成第三笔同等金额投资;重启以所持OpenAI股权作为抵押的100亿美元贷款谈判。
- 苹果公司:
- CEO库克与欧盟科技主管举行视频会谈,讨论新版Siri因未达《数字市场法》标准而延迟进入欧盟市场的问题。
- 推送iOS 26.5.2等安全更新,修复超过25项安全漏洞,防范AI加速网络攻击的潜在威胁。
- 推出OASIS 1智能戒指,结合私密语音捕捉与触控板编辑功能,集成Wispr Flow面向AI听写与文本输入场景。
- 华为:
- 开源AutoGenetic Memory智能体记忆引擎。
- 发布AI-OTN解决方案,支持双万兆接入、5G-A/6G,结合Tbps级传输能力与AI智能调度。
- 开源openPangu-2.0-Flash大模型,参数总量达920亿。
- 百度:
- 开源端到端OCR模型Unlimited OCR,在多个全球榜单登顶,发布5天GitHub星标即破万。
- 任命孙天祥为基础模型研发部负责人,持续优化AI人才与组织架构。
- 腾讯:
- 开源CubeSandbox硬件级虚拟化安全沙箱。
- 联合多家机构发起AI&Society创造营,设置思辨组与行动组,推动AI普惠与社会价值落地,行动组已涌现40个面向公共价值的AI项目。
- 快手:推出AgentX推荐系统自迭代框架;AI反诈治理拦截率达98.1%,日均识别近10万个风险账号。
- Palantir:CEO Alex Karp公开质疑前沿AI按Token收费模式,认为若技术真能创造巨额价值应采用分成模式而非按算力计费,将当前模式形容为“财富税”;指出企业数据被用于训练模型却逐步丧失竞争优势,若客户集体质疑该逻辑,AI行业高估值体系可能松动。
- OpenAI:ChatGPT非英语用户占比超50%,乌兹别克语、哈萨克语、缅甸语用户增长最快。
- 全球生成式AI市场:过去12个月真实收入达1100亿美元,年化运行率超1750亿美元;2026年一季度单季收入250亿美元,连续两季超过同期芯片与数据中心折旧的210亿美元,但仅“勉强跨过”折旧门槛;价格两年降数百倍收入仍保持近200%增长,源于杰文斯悖论,电力短缺与折旧年限争议使该平衡极为脆弱。
六、产品更新
- Anthropic产品线:Claude Sonnet 5正式发布、Fable 5与Mythos 5解禁恢复全球访问、Claude Science科研工作台上线、Claude Code隐写标记问题确认回滚修复。
- 谷歌产品线:Nano Banana 2 Lite轻量图像模型、Gemini Omni Flash视频模型上线;Gemini Spark代理助手登陆Mac端;NotebookLM上线短视频生成功能,可将文字资料转为60秒左右竖屏短视频。
- 昆仑万维天工3.2:上线Skywork Tags群聊智能体功能,支持多主流通讯工具接入。
- 字节跳动TRAE Work:开放预览,覆盖工作、代码、设计三种模式,实现从需求到产出的完整闭环。
- Cursor IDE:被披露两个高危远程代码执行漏洞“DuneSlide”,可绕过沙箱防护获取系统控制权;推出iOS移动端应用,支持远程启动、控制Agent编程任务。
- GitHub Copilot:CLI上线自动模型选择功能,可根据任务类型自动选择最优模型;浏览器工具正式上线,代理可驱动真实浏览器执行导航、交互等操作,权限粒度可控。
- 9Router AI路由网关:GitHub星标接近2万,支持多模型路由、Token压缩与自动降级。
- OpenClaw:开源AI代理项目推出iOS与Android移动端应用。
- Suno:筹备推出官方API,面向潜在合作伙伴发起调研问卷。
- 微信公众号:向医院开放AI分身能力,支持7×24小时院务咨询。
- 支付宝“阿宝”:AI生活助理正式开放全量公测。
- Notion:上线HTML Block功能,支持AI生成交互式网页内容。
- 飞书:推出多维表格智能体,实现团队共享AI协作能力。
七、投资
- 可灵AI:完成30亿美元融资,腾讯参投,估值180亿美元,计划12个月内赴港IPO。
- Venice AI:完成6500万美元A轮融资,估值达10亿美元,年化收入超7000万美元,资金将用于建设自有数据中心。
- Etched:累计融资8亿美元,最新一轮后估值50亿美元,订单需求达10亿美元。
- 自变量机器人:连续完成多轮融资,估值突破200亿元人民币。
- AI2 Robotics、X Square Robots:两家具身智能企业均完成融资,估值突破500亿元人民币。
- 跨维智能:完成10亿元B轮融资,投后估值超100亿元,启动IPO进程。
- 软银集团:向OpenAI追加100亿美元投资,计划10月再追加同等金额。
- 黑石集团:计划投入300亿美元在日本布局AI数据中心。
- 喜达屋资本:募集102亿美元基金,最多将35%资金投向数据中心领域。
- 阿什顿·库彻:创立新风投基金,聚焦AI基础设施、能源及深度科技早期投资。
- Acti:AI代理键盘创业公司完成530万美元种子轮融资。
- EquiLibre Technologies:前DeepMind研究员创立的AI交易公司完成A轮融资,估值5亿美元。
- 硅基流动:递交港股上市申请,冲刺“AI Token工厂第一股”。
八、行业观点与社会影响
8.1 行业观点
- a16z合伙人Benedict Evans:基础模型本身不是产品,产业价值终将向上游转移,模型公司可能仅赚取通道费;编程是当前唯一真正找到PMF的领域,20美元月费背后对应上万美元Token成本,定价与成本严重脱节,行业终将走向商品化价格战。
- OpenAI总裁Greg Brockman:AGI最理想的界面是对话,未来用户几乎不需要独立界面与产品,只需与持久存在的智能体交互;2023年推出的插件功能彻底失败,核心原因是当时上下文容量不足、模型易健忘;判断算力将长期供不应求,内部策略是“买下全部”,当前顶级模型一年后就会沦为廉价品,倒逼厂商持续迭代前沿模型。
- Palantir CEO Alex Karp:按Token收费本质是售卖算力,若AI真能创造巨额价值,厂商应采用价值分成模式;企业将工作流与客户数据输入模型,反而在训练模型替代自身,机密与竞争优势持续流失,该逻辑若被广泛质疑将动摇AI行业高估值基础。
- Zilliz CTO栾小凡:数据层是AI时代未被充分定价的核心护城河,模型公司训前数据准备容错率极低,Agent落地生产后最先遇到的瓶颈是数据过期、权限混乱等问题,而非模型能力。
- 3Blue1Brown创始人Grant Sanderson:AI在数学领域能力偏科,可快速解决几何题但在组合数学上表现薄弱;科学的最终目的是理解而非堆砌逻辑,即便AI证明复杂定理,若缺乏美感与洞见对人类价值有限;教学是后AGI时代最稳定的职业之一,情感联结与督导作用无法被AI替代。
- OpenAI Codex负责人Andrew Ambrosino:大模型使功能实现成本趋零,产品开发流程倒置,团队核心工作从“实现功能”变为“筛选与整合方案”;当前最稀缺的能力是“品味”,即判断做什么、如何组织系统、选择正确媒介传递价值的能力。
- Cloudflare报告:互联网非人类流量占比首次超过50%,其中52%的爬虫请求用于AI训练;传统搜索行为萎缩,内容许可市场正在形成,2023年以来已签署超50项出版方与AI公司的授权协议。
- 行业共识:全球生成式AI收入刚跨过折旧线,增长由杰文斯悖论驱动,电力短缺与折旧争议使盈利平衡十分脆弱;国内大模型开启价格战,头部厂商降幅最高达99%,大幅降低企业调用门槛。
8.2 监管与合规
- 美国FTC发布警示,AI偏见防护机制可能违反消费者保护法律,大模型厂商需重新审视安全对齐机制。
- 美国拟出台法案,禁止AI公司向数据中间商出售用户健康数据,赋予FTC与州检察长诉讼权。
- 中国正式发布七项AI智能体互联互通国家标准,在身份识别、相互发现、协作、工具调用等方面建立统一框架,推动智能体规模化应用。
- 北京发布《人工智能赋能科学研究实施方案》,目标2028年建成全球科学智能创新枢纽。
- 中国监管推进拟人化AI服务规范,千问等平台下线部分智能体产品以落实合规要求。
- 美国商务部解除对Anthropic Fable 5、Mythos 5的出口管制。
- 欧盟《数字市场法》持续推进,苹果Siri等AI服务入欧需满足合规要求。
8.3 社会价值与争议
- 社会价值探索:腾讯研究院联合多家机构发起AI&Society创造营,40个项目覆盖无障碍、性别平等、职场权益、反性侵求助、老年陪伴等公共场景,推动AI技术服务弱势群体与公共利益。
- 商业化落地争议:瑞典斯德哥尔摩咖啡馆采用AI店长Mona,两个月内亏损21万元,不同模型决策风格差异大,AI商业决策效果未达预期。
- 产品体验争议:Fable 5重新上线后因过度安全审查,日常编程频繁触发护栏降级,引发开发者集体不满;Claude Code被曝通过隐写术标记中国用户,引发隐私争议与信任危机;Codex日志机制导致硬盘写入量激增,大幅缩短硬件寿命,引发对AI工具资源管理的批评。
- 公众态度:美国民众对AI发展的支持率在2025年4月达到峰值后持续下滑。
- 企业落地反思:调研显示39%企业曾因部署AI裁员,其中55%承认裁员决策错误,行业逐步回归“人机协作”共识。
九、学习与研究资源
- Product Hunt使用指南:面向普通用户的产品信息获取教程,可用于发现AI工具、观察行业趋势、查看用户反馈与竞品动态。
- Agent Skill构建方法论:讲解如何在编码工具中组织规则、流程、工具、检查标准,形成可复用的智能体能力。
- 动态内容生成Skill:社交卡片生成工具新增Live Photo生成编辑能力,支持将静态素材升级为动态图文内容。
- Vibe Motion实操经验:代码驱动动态画面生成的避坑指南,覆盖短视频、知识动画、产品演示等场景。
- GitHub入门指南:面向非技术用户的信息获取教程,讲解如何判断开源项目价值、利用GitHub发现行业趋势。
- CV/ML面试学习路线图:更新后新增分割、OCR、视觉语言模型三大方向,覆盖计算机视觉求职核心知识点。
- 模型适配硬件数据集:开源汇总不同量化等级下模型的内存占用规则,可根据硬件配置推荐可运行的模型。
- AI编程全景指南:涵盖Cursor、Claude Code、Codex等主流AI编程工具的实践方法与落地案例。
- Claude账号自救指南:包含数据备份、工作流迁移、申诉模板等内容,应对账号封禁场景。
- 多租户RAG解决方案:讲解基于Milvus分区键实现物理隔离,搭配AutoRAG自动化验证的完整方案。
十、总结与洞察
本周期AI行业呈现六大核心趋势:
第一,产业竞争核心从模型能力转向算力资源,Meta等巨头下场对外输出算力,数据中心资产价值持续凸显,AI竞赛下半场将围绕基础设施布局展开。
第二,国产大模型与算力自主化加速突破,美团LongCat-2.0实现万亿模型全链路国产算力支撑,多个国产模型在语音、垂直场景等方向追赶国际前沿,自主可控进程提速。
第三,智能体从个人工具向生产系统演进,群聊共享Agent、桌面级智能体、行业专用智能体密集落地,协作模式从单人辅助升级为团队共享、多Agent协同,深度嵌入企业工作流。
第四,商业化仍处脆弱平衡期,全行业收入刚覆盖折旧成本,按Token收费模式遭到质疑,行业面临估值逻辑与盈利模式的双重验证,价值分成等新模式开始被讨论。
第五,技术发展与治理规范并行,模型安全、用户隐私、合规要求持续升级,各国监管框架逐步落地,企业需在技术迭代与合规边界间寻找平衡。
第六,AI社会价值维度持续拓展,无障碍、公共服务、弱势群体支持等场景涌现大量创新,技术普惠与以人为本的发展理念受到更多重视,成为行业重要的发展方向。