5月19-20日Google I/O大会发布:Gemini 3.5 Flash全线超越上代旗舰,输出速度达同级4倍;Gemini Omni实现任意模态输入→任意模态输出,原生支持视频生成与对话式编辑;Gemini Spark作为24/7个人Agent可后台执行跨Gmail/Docs/Sheets的长周期任务。Gemini App月活突破9亿。
5月21日Codex两大更新:/goal目标模式正式毕业,设定目标与验收标准后AI可自主持续推进数小时至数天,中途随时介入调整;Locked Computer Use支持Mac锁屏后继续操作电脑,配合手机App远程查看进度与审批,实现7×24无人值守。
5月22日OpenAI官宣Codex For PowerPoint插件内测,ChatGPT直接嵌入PPT Ribbon工具栏。支持从笔记、文档或prompt生成完整幻灯片,反向阅读点评汇报逻辑与叙事弱点,截图转可编辑页面,表格一键转图表;所有生成内容保持原生可编辑状态。
5月20日Google I/O发布Stitch重大改版:实时流式Agent实现"边说边生成",语音指令实时渲染UI组件与布局;新增多人协同编辑与Agent管理器;推出DESIGN.md开源设计格式,可跨Claude Code、Cursor等工具流转。目前完全免费。
5月20日阿里云峰会发布千问旗舰模型Qwen3.7-Max,Artificial Analysis全球第五、国产第一。在真武M890芯片上从零自主编程35小时完成432次内核评估与1158次工具调用,推理速度提升10倍;编程与Agent能力超越Claude Opus 4.6;千问APP/网页免费开放。
5月22日字节跳动开源Lance,激活参数仅3B,单一模型同时处理图像理解/生成、视频理解/生成、跨模态编辑。VBench视频生成85.11分、GenEval图像生成0.90,均达领先水平;Apache 2.0许可,权重已上HuggingFace。
5月18-20日AI公司Odyssey连续发布:Starchild-1为首个实时多模态世界模型,支持音视频联合生成最高24fps;Agora-1为首个多智能体世界模型,支持4人在同一模拟世界中实时交互,本质是"学出来的游戏引擎"。已融资2700万美元。
美团LongCat-Video-Avatar 1.5(5.25)音频驱动数字人,胜率超快手Kling与阿里OmniHuman,10秒视频约1分钟生成,MIT开源;阿里Qwen3.5-LiveTranslate(5.20)60语种→29语种实时同传,2.8秒延迟;贝壳PanoWorld(5.19)户型图→全屋VR全景;Meta WavFlow(5.18)波形空间音频生成;Mega-ASR(5.19)NTU/NUS/上海AI Lab开源极端声学场景语音识别SOTA。
5月20-21日OpenAI披露其推理模型独立提出Erdős"平面单位距离问题"的新反例构造,突破1946年以来的"方格"假设。菲尔兹奖得主Tim Gowers、Princeton教授Noga Alon验证并确认证明正确,称"无需犹豫即可接受发表于Annals of Mathematics"。
5月22日智谱发布GLM-5.1高速版API,输出速度达400tokens/s,首次将旗舰级模型能力与低延迟同时带入生产环境,系推理引擎、调度系统与底层基础设施三方面系统级优化。港股智谱当日涨超32%,总市值突破5800亿港元。
5月22日DeepSeek宣布V4-Pro API永久降至原价1/4,输入缓存命中仅0.025元/百万Token,综合成本仅为GPT-5.5的1/40。技术降本源自稀疏注意力+MoE架构优化及国产昇腾芯片适配。同步推进700亿元(约100亿美元)融资,投前估值约450亿美元。
5月20日腾讯上线操作系统级 AI 助手 Marvis(马维斯),面向 Windows/Mac/Android 全量免邀请码开放。内置 Main/File/Computer/App/Browser/Search 六个 Agent 7×24 协作,支持「效率模式」端云协同与「隐私模式」纯端侧运行(基于阿里 Qwen,断网可用)。可一句话调整系统设置、管理文件、跨端远程操控 PC,每位用户日赠 1000 万 Token。
5月22日部长刘伟连开部务会与党组会:审议《公路发展"十五五"规划》,明确"大力实施公路更新和数智化改造";同日发布《智能航运2030行动计划》。5月21日发布会上提出推动"人工智能+"在涉企执法检查中的应用。整体锚定2035年交通强国目标,强调攻克关键核心技术。
5月25日北京市科委报道,清华大学、天津大学、河北工业大学联合研发的"高速公路全生命期智能建造理论与技术方案"已在京津塘、塘承、津沧等京津冀20余条高速落地。方案融合物联网传感、卫星定位与AI算法,无人压路机群施工时工程师可手机实时查看路径、进程与质量数据,并建成贯穿三地的路网大数据管控平台。
2026工程数智大会将于5月29-31日在深圳举办,主题"AI×BIM2.0新蓝图",由清华大学、国家数字建造技术创新中心及广联达联合主办。住建部明确北京、上海、广州、深圳等24个试点城市政府投资项目全面强制推行BIM正向设计+AI智能审查;发改委要求2026年底AI辅助评标覆盖部分省市,2027年全国推广BIM模型与AI评标系统对接。
本周起启动 AI 技术简报试运行,面向院内推送 AI 前沿、行业政策与同行动态,覆盖大模型发布、交通数智化政策、BIM+AI 等核心话题,支持 HTML / 长图 / Markdown 三格式一键导出,方便群聊速览与内网归档。
GDT Nexus 作为院内 AI 工具统一入口已上线,首批上架 AI 图纸处理、设计规范 AI 助手、可视化汇报系统、智能交调系统等工具,并集成原有项目管理平台、低碳设计平台、路面管理平台,实现院内技术资产一站式访问。注意:需院内内网环境。