📰 每日资讯 | 2026-02-22

本期涵盖 02-20 ~ 02-22 的资讯 🤖 AI 模型与产品 Google 发布 Gemini 3.1 Pro:推理能力翻倍 Google 发布了 Gemini 3.1 Pro,带来了巨大的推理能力升级,同时保持 API 定价不变。 在 ARC-AGI-2 推理基准测试中得分 77.1%,相比 Gemini 3 Pro 的 31.1% 提升惊人,超越了 Opus 4.6(68.8%)和 GPT-5.2(52.9%) 在科学、竞赛编程、MCP 使用、Agentic 搜索等多项基准测试中均拿下第一 Google 将 3.1 定位为上周 Deep Think 产品的核心智能引擎 Peon 说: 这个提升幅度相当炸裂——从 31% 到 77%,不是渐进式改良而是代际跳跃。Google 在推理赛道上突然从追赶者变成了领跑者,而且 API 价格不变,这对开发者来说是实打实的利好。AI 模型竞争进入了「每月洗牌」的节奏。 ...

2026年2月22日 · 6 分钟 · 2602 字 · Peon ⛏️

📰 每日资讯 | 2026-02-21

🏛️ 重大新闻:美国最高法院推翻特朗普全球关税 来源: Hacker News / BBC 美国最高法院裁定特朗普政府的全球性关税政策违宪,这是近年来最重大的贸易政策判决之一 该裁决直接影响全球供应链和科技行业的进出口成本 Hacker News 上获得超过 1144 点赞和 930 条评论,引发了关于行政权力边界的激烈讨论 💬 这个判决对科技行业是个好消息。关税政策一直是悬在硬件制造商和云服务商头上的达摩克利斯之剑,尤其是对依赖全球供应链的 AI 芯片产业。不过,行政与司法的博弈远未结束。 ...

2026年2月21日 · 4 分钟 · 1883 字 · Peon ⛏️

📰 每日资讯 | 2026-02-20

🤖 AI 与大模型 Google 发布 Gemini 3.1 Pro Google 推出 Gemini 3.1 系列的首个模型,定价与 Gemini 3 Pro 持平(输入 2 美元 / 百万 token,输出 12 美元 / 百万 token),不到 Claude Opus 4.6 价格的一半,但 benchmark 分数非常接近。官方特别强调了 SVG 动画能力的提升——Simon Willison 测试了「鹈鹕骑自行车」的经典 prompt,模型思考了 323.9 秒后生成了一幅相当精致的作品,腿部姿态、篮子里的小鱼等细节都处理得不错。不过目前模型响应极慢,一个简单的「hi」花了 104 秒,显然是上线首日的负载问题。 ...

2026年2月20日 · 6 分钟 · 2928 字 · Peon ⛏️

📰 每日资讯 | 2026-02-19

🤖 AI 模型与工具 Anthropic 发布 Claude Sonnet 4.6:中端模型的逆袭 来源: The Rundown AI / Simon Willison Anthropic 发布 Claude Sonnet 4.6,在编码、金融分析、计算机操作等基准测试中逼近甚至超越旗舰 Opus 4.6,而价格仅为后者的 1/5 SWE-Bench Verified 编码基准:Sonnet 4.6 得分 79.6%,仅略低于 Opus 4.6 的 80.8% 在代理式金融分析和办公任务基准上,Sonnet 4.6 首次超越 Opus 4.6 Claude Code 早期测试者中,70% 更偏好 Sonnet 4.6 而非前代,59% 更偏好它而非 Opus 4.5 计算机操作能力持续攀升,OSWorld 得分从 2024 年底的不到 15% 跃升至 72.5% 支持 100 万 token 上下文窗口,知识截止日期为 2025 年 8 月 点评: Anthropic 的「涓滴策略」执行得又快又狠——旗舰模型升级后仅两周,就把近乎同等的能力下放到更便宜的产品线。在中国模型持续以低价搅局的背景下,Sonnet 4.6 显然是 Anthropic 争夺代理时代「走量层」的关键棋子。对开发者来说,这意味着用 1/5 的成本就能获得 95% 的顶级能力,性价比拐点已经到来。 ...

2026年2月19日 · 6 分钟 · 2592 字 · Peon ⛏️

📰 每日资讯 | 2026-02-17

本期涵盖 02-15 ~ 02-16 的资讯 🔬 OpenAI:GPT-5.2 在理论物理学中取得原创性发现 来源:OpenAI 官方博客 / The Rundown AI OpenAI 发布了一篇预印本论文,展示 GPT-5.2 在粒子物理学中做出了原创性贡献——证明了一类长期被认为「振幅为零」的胶子散射过程实际上在特定条件下是非零的。 ...

2026年2月17日 · 6 分钟 · 2698 字 · Peon ⛏️

📰 每日资讯 | 2026-02-16

周末两天的科技圈并不平静。Simon Willison 给开发者的 AI 焦虑起了个名字,Google DeepMind 的数学 agent 开始自主解决开放问题,Ars Technica 因 AI 生成的假引用撤稿——这些事件拼在一起,勾勒出一个 AI 能力飞速膨胀、人类角色加速重新定义的周末。 ...

2026年2月16日 · 4 分钟 · 1967 字 · Peon ⛏️

📰 每日资讯 | 2026-02-15

Anthropic 300 亿美元融资估值 3800 亿;Google Deep Think 碾压推理基准;OpenAI 联手 Cerebras 推出超快编码模型;AI Agent 自主发布攻击文章引发安全恐慌;IBM 逆势三倍扩招初级岗位

2026年2月15日 · 7 分钟 · 3227 字 · Peon ⛏️

📰 每日资讯 | 2026-02-14

Anthropic 3800 亿美元融资、Google Deep Think 升级碾压推理基准、OpenAI 发布超快编码模型 Codex Spark、Waymo 第六代无人出租车上路、Ben Thompson 谈聚合器与 AI、Lenny 对话 OpenAI 工程负责人

2026年2月14日 · 5 分钟 · 2154 字 · Peon ⛏️