第一影视网

展开菜单

OpenAI 和 Anthropic “互测”模型安全性

OpenAI 和 Anthropic “互测”模型安全性
openai与anthropic首次开展跨机构联合安全评估,双方对彼此公开发布的模型进行了深度互评,聚焦误对齐、指令遵循、幻觉、越狱等关键风险领域,并同步公开了详尽的评估报告。 此次评估涵盖Claude Opus 4、Claude Sonnet 4、GPT-4o、GPT-4.1、OpenAI o3、OpenAI o4-mini等主流模型,所有测试均通过公开API执行,部分场景下放宽了外部防护机制,以模拟高风险能力暴露环境。 结果显示,Claude 4系列在指令遵循性测试中表...

Anthropic 隐私政策更新:用户数据将用于模型训练、默认同意

Anthropic 隐私政策更新:用户数据将用于模型训练、默认同意
anthropic 宣布将启用用户数据用于其 ai 模型的训练,涉及的内容包括最新的聊天记录与代码编写交互过程,除非用户明确选择退出。与此同时,公司还调整了数据保留期限,将数据存储时间延长至最长五年,该政策同样适用于未选择退出的用户。 根据 Anthropic 官方博客发布的声明,所有用户必须在 9 月 28 日前完成隐私设置的选择。若用户选择“接受”,其数据将立即被用于模型训练,并可能被保存长达五年。 此次隐私政策变更适用于所有面向消费者的 Claude 订阅服务,涵盖...

SuperCLUE 多模态视觉 8 月评测榜:Gemini-2.5-Pro 位居第一

SuperCLUE 多模态视觉 8 月评测榜:Gemini-2.5-Pro 位居第一
在8月28日公布的中文多模态视觉语言模型测评基准(superclue-vlm)榜单中,gemini-2.5-pro 以74.99的总分位列榜首,openai 的 gpt-5(high)则以68.59分紧随其后,排名第二。 该测评基准充分结合中文语境与实际应用场景,围绕基础认知、视觉推理和视觉应用三大核心能力构建评估体系,致力于为多模态模型的发展提供科学、公正的衡量标准。 本次测评共纳入15个主流多模态模型,包括Claude-Opus-4.1、Gemini-2.5-Pro、G...

Xcode 26 Beta 7 已集成 Claude Sonnet 4

Xcode 26 Beta 7 已集成 Claude Sonnet 4
xcode 26 beta 7 现已推出,本次更新带来了对 claude sonnet 4 的原生集成,开发者可在 xcode 内直接登录 claude 账户,调用 claude sonnet 4 模型实现 ai 辅助编程。 依托 Claude Sonnet 4 强大的推理与生成能力,开发者可利用其生成高质量代码和详细技术文档,自动检测并修复程序中的各类缺陷,甚至能在代码行内创建可交互的实时演练环境(inline playgrounds)。 该模型具备读取项目源码和编译日志...

SuperCLUE多模态视觉评测榜:文心4.5 Turbo总分并列国内第一

SuperCLUE多模态视觉评测榜:文心4.5 Turbo总分并列国内第一
8月29日,中文多模态视觉语言模型测评基准superclue-vlm发布了最新8月榜单,百度推出的ernie-4.5-turbo-vl多模态大模型以66.47分的成绩与国内其他领先模型并列第一,在真实应用场景中的表现尤为突出,展现出强劲实力。 此次测评共纳入15款国内外主流多模态模型,包括Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-...

书生·万象 InternVL3.5 开源发布

书生·万象 InternVL3.5 开源发布
上海AI实验室近日宣布开源书生·万象 InternVL3.5,该模型通过引入级联式强化学习、动态视觉分辨率路由机制以及解耦部署架构,在推理能力、部署效率和多任务通用性方面实现了全面突破。 据悉,InternVL3.5涵盖从10亿到2410亿参数的九种不同规模版本,全面刷新当前开源多模态模型的性能记录。无论是在通用多模态感知、复杂推理任务还是文本理解能力上,均达到业界领先水平。同时,模型在图形用户界面(GUI)智能体操作、具身空间感知、矢量图像(SVG)解析与生成等前沿应用场...

Anthropic 承认 Claude Opus 4.1 和 Opus 4 模型近期“降智”

Anthropic 承认 Claude Opus 4.1 和 Opus 4 模型近期“降智”
8 月 30 日,anthropic 正式发布事件通报,承认 claude opus 4.1 与 opus 4.0 近期出现了性能下滑问题。(官方称现已修复) 根据报告内容,自 8 月 25 日 17:30 起至 8 月 28 日 2:00(UTC 时间),Claude Opus 4.1 在处理部分请求时表现异常,用户可能遇到智能化水平下降、输出格式错乱,或在使用 Claude Code 时出现工具调用故障等问题。 Anthropic 指出,该问题是由于一次推理堆栈的版本更...

腾讯优图实验室正式开源智能体框架 Youtu-Agent

腾讯优图实验室正式开源智能体框架 Youtu-Agent
9月2日,腾讯优图实验室正式宣布开源其全新智能体框架——youtu-agent。该框架以极简架构与卓越性能为核心设计理念,致力于为科研人员及开发者提供一个高效、易用且结果可复现的智能体开发平台。 据悉,Youtu-Agent 是一个面向真实应用场景的开源框架,具备广泛的应用覆盖能力,涵盖文件管理、数据解析、学术研究以及广域信息综述等多个领域。目前,该框架已成功应用于腾讯云多个产品线,支撑实际业务运行。 其关键优势在于:无需额外训练模型,也不依赖国外闭源大模型API,即可在现实...

开源 AI 客户端 Cherry Studio 1.5.9 发布:免费 GLM 4.5 flash、集成 Nano banana

开源 AI 客户端 Cherry Studio 1.5.9 发布:免费 GLM 4.5 flash、集成 Nano banana
Cherry Studio 是一款支持 Windows、macOS 和 Linux 的跨平台 AI 桌面应用,现正式推出 1.5.9 版本。此次更新不仅带来了三项重磅功能升级,还在用户体验与效率工具方面实现了全方位优化。 ? 亮点一:开箱即用,免费畅享国产顶尖大模型! 为了让每位用户都能轻松体验高性能大模型的魅力,Cherry Studio 与两家国内头部 AI 企业达成官方合作,带来真正“零门槛”的免费模型使用体验! 联合智谱 AI,首发免费 GLM-4.5-flas...

AI 公司 Anthropic 完成 130 亿美元融资

AI 公司 Anthropic 完成 130 亿美元融资
anthropic宣布完成130亿美元f轮融资,投后估值达到1830亿美元,成为科技领域私募融资史上规模第二大的一轮融资,仅次于openai在同年3月创下的400亿美元融资纪录。 本轮融资由Iconiq Capital、富达管理研究公司及光速创投共同领投,贝莱德、黑石集团、高盛等数十家全球知名投资机构亦参与其中。 据Anthropic透露,公司在2025年初的年化收入为10亿美元,仅八个月后便跃升至50亿美元,增速使其跻身历史上增长最为迅猛的科技企业之列。 目前,Anthr...