💡互联网/数码/App/羊毛/相机/数字指南

📨商务联系:@appdo_bot (唯一,谨防诈骗)

📰独立网站:appdo.xyz 🧑🏻‍💻博客 song.al

📷浮生东京 @LifeJapan

Buy ads: https://telega.io/c/AppDoDo
#互联网观察 #AI

▎OpenAI 推出 GPT‑5.5,迄今为止最强的代理编码模型

OpenAI 于 2026 年 4 月 23 日正式发布 GPT-5.5,并将其定位为“面向真实工作的新一类智能”。官方表示,GPT-5.5 在理解复杂任务意图、跨工具持续执行、检查结果以及完成多步骤工作方面更强,重点能力覆盖写代码、在线研究、数据分析、生成文档与表格、操作软件等场景。

在编程能力方面,OpenAI 给出的数据称,GPT-5.5 在 Terminal-Bench 2.0 上达到 82.7%,在 SWE-Bench Pro 上达到 58.6%,并在其内部用于长周期编程任务评估的 Expert-SWE 上继续领先 GPT-5.4。官方认为,这意味着它在复杂命令行流程、真实 GitHub issue 修复、跨大规模代码库保持上下文、处理模糊故障和调用工具验证假设等方面更强。

在知识工作场景中,OpenAI 表示 GPT-5.5 在 Codex 里生成文档、表格和幻灯片的表现优于 GPT-5.4。公司内部团队已将其用于演讲请求分析、税务材料审阅和业务周报自动化等任务。官方还称,目前 OpenAI 内部已有超过 85% 的员工每周使用 Codex,涉及软件工程、财务、传播、市场、数据科学和产品管理等岗位。

GPT-5.5 已开始向 ChatGPT 和 Codex 的 Plus、Pro、Business、Enterprise 用户推出,GPT-5.5 Pro 则面向 Pro、Business、Enterprise 用户开放。OpenAI 同时表示,API 部署需要额外安全措施,正在与合作伙伴推进,GPT-5.5 和 GPT-5.5 Pro “很快”也会进入 API。

频道 @AppDoDo 官推 APPDOTG
#互联网观察 #AI

GPT-Image-2 横扫 Image Arena 榜单,OpenAI 拿下图像生成三项第一

Arena 官方账号公布,OpenAI 的 GPT-Image-2 已登顶全部 Image Arena 图像榜单,在文生图、单图编辑和多图编辑三项评测中全部拿到第一。

其中,文生图分项得分 1512,领先第二名 242 分;单图编辑得分 1513,领先第二名 125 分;多图编辑得分 1464,领先第二名 90 分。Arena 将这次表现称为目前为止罕见的大幅领先。

Arena 还表示,没有其他模型曾以这么大的优势统治 Image Arena。

OpenAI 社区同日发布的介绍帖也引用了这一成绩,称 GPT-Image-2 在发布后数小时内就拿下全部 Image Arena 榜单第一,并强调文生图 242 分的领先幅度刷新了该竞技场的纪录。

目前GPT-Image-2 模型已经全量推送,免费和付费用户均可以使用该模型。频道主测试后发现该模型对中文支持非常优秀,推荐大家尝试。

频道 @AppDoDo 官推 APPDOTG
#互联网观察 #AI

Manus AI :创业 8 个月实现 1 亿美元 ARR,刷新全球 AI 初创最快增长纪录

总部位于新加坡的 AI 初创公司 Manus AI 宣布,在成立仅 8 个月后,其年度经常性收入(ARR)已突破 1 亿美元,成为全球范围内从零增长至这一规模最快的企业之一。

据披露,Manus AI 当前的整体收入运行率已超过 1.25 亿美元,其中不仅包含订阅收入,还涵盖基于使用量的计费及其他收入来源。自今年发布 Manus 1.5 版本以来,公司持续保持每月 20% 以上的高速增长,展现出强劲的商业化能力。

在产品层面,Manus AI 今年早些时候推出了被称为“首个通用型 AI Agent”的平台,标志着 AI 应用从工具型向智能代理型演进的重要一步。公司表示,自成立以来,其平台已累计处理超过 147 万亿个 token,并创建了 8000 万台以上的虚拟计算环境。

值得注意的是,Manus AI 的核心创始与早期技术团队之前就撤出中国市场、清空国内社交账号内容,全力转战海外市场。后整体转向海外发展,并将公司总部设立在新加坡。这一“团队整体出海”的路径,也被视为近年来中国 AI 创业者在全球化、资本环境与算力生态变化背景下的一个缩影。

新闻来源

https://jp.investing.com/news/company-news/article-93CH-1361058

频道 @AppDoDo 官推 APPDOTG
#互联网观察 #AI

Google Translate 迎来 Gemini 加持:翻译更“懂人话”,耳机实时同传开启测试

Google 更新了 Google Translate:文本翻译开始用更强的 Gemini 能力来理解语境,尤其对俚语、习语、地方表达这类“直译就翻车”的句子,会给出更自然、更贴近真实含义的译文;该提升将从美国和印度开始,覆盖“英语 近 20 种语言”(含中文、日语、西语、印地语、德语等),并在 Translate(Android / iOS / Web)以及搜索结果中逐步上线。

同时,Google 还推出“戴上任何耳机就能实时听翻译”的 Live translate 测试版:把耳机连到 Android 手机,打开 Translate 点“Live translate”,就能把对话/演讲/节目内容实时翻到你选择的语言,并尽量保留说话者的语气、重音与节奏;该 Beta 目前在美国/墨西哥/印度的 Android 端开始推送,支持 70+ 语言,并计划在 2026 年扩展到 iOS 和更多国家。

此外,Translate 里的语言练习功能也在升级:新增更好的口语反馈与“连续学习天数(streak)”追踪,并把相关能力扩展到包含德国、印度、瑞典、台湾在内的近 20 个新国家/地区。

消息来源

https://blog.google/products/search/gemini-capabilities-translation-upgrades/

频道 @AppDoDo 官推 APPDOTG
#互联网观察 #AI

OpenAI 发布 GPT-5.2:打造迄今最强 AI 助手 提升专业任务执行力

OpenAI 于 12 月 11 日正式发布其最新一代大语言模型 GPT-5.2,这是 GPT-5 系列的重大升级版本,旨在全面提升智能推理、复杂任务处理、视觉理解和长文本把握等能力。

据官方介绍,GPT-5.2 是 OpenAI 迄今最先进的模型系列之一,特别针对专业知识型工作进行了优化,包括创建电子表格、设计演示文稿、生成代码、理解图像内容及解决多步骤逻辑任务等场景。官方声明指出,该模型在各项基准测试中刷新了行业标准表现。

GPT-5.2 将在 ChatGPT 产品中以三个版本推出:

Instant(即时版) — 快速响应用户查询;
Thinking(思考版) — 强化深度推理和复杂任务解析;
Pro(专业版) — 面向企业级与高要求工作流程。

三者将从发布日起逐步向付费用户开放,同时开发者可通过 API 即刻接入。官方数据显示,使用 GPT-5.2 的专业用户每天可以节省大量时间,有的用户反馈在日常工作中可节省 40 至 60 分钟甚至更多。

新版本在处理复杂推理和多步骤工作上比前代模型表现更稳定、更高效。OpenAI 表示,此次发布也回应了行业竞争的加剧,尤其是来自 Google 等公司的先进 AI 竞争者推动了模型性能的快速迭代。尽管如此,OpenAI 仍将多款旧版模型继续保留在 API 平台供开发者使用。

新闻来源

https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2/

频道 @AppDoDo 官推 APPDOTG
 
 
Back to Top